<< Back

Regex: i gruppi di caratteri e le abbreviazioni

Continuiamo la serie di articoli sulle espressioni regolari, iniziata con il post sul punto, parlando dei gruppi di caratteri e delle abbreviazioni.

I gruppi di caratteri servono per ricercare un elenco di caratteri. Si racchiudiono tra parentesi quadre. Se subito dopo la parentesi quadra aperta inseriamo un “^”, andiamo a negare il gruppo e quindi a farci restituire tutto tranne quello che c’è nel gruppo.

È possibile creare dei range di caratteri con il meno “-” (dal carattere x al carattere y), oppure delle opzioni “or” con la riga orizzontale “|” (il carattere x oppure y).

Esistono dei set di gruppi già presabiliti, oppure è possibile creare dei gruppi personalizzati.

In Alteryx molti gruppi di caratteri standard sono già presenti nel menù a tendina del Regex tool, sotto forma di set abbreviato, composto dallo slash seguito da una lettera.

  • [:alpha:] –> w tutte le lettere dalla “a” alla “z”, maiuscole o minuscole, comprese quelle accentate.
  • [:lower:] –> l –> tutte le lettere dalla “a” alla “z” minuscole, comprese quelle accentate.
  • [:upper:] –> u –> tutte le lettere dalla “A” alla “Z” maiuscole, comprese quelle accentate.
  • [:digit:] –> d tutti i numeri.
  • [:alnum:] –> [:alpha:] + [:digit:] tutti i numeri e tutte le lettere sia maiuscole che minuscole.
  • [:space:] –> s –> spazio
  • [:blank:] –> s|t –> spazi e tab
  • [:cntrl:] –> i caratteri di controllo. Tutti quei caratteri che non si possono stampare, come il CR+LF del fine riga e capo.
  • [:print:] –> l’esatto opposto: tutti i caratteri visibili a schermo.
  • [:punct:] –> tutti i caratteri di punteggiatura.
  • [:xdigit:] –> tutti i caratteri che possono formare un numero esadecimale (da 0 ad F)

In aggiunta a questi gruppi è possibile creare gruppi adatti alle nostre esigenze. Ad esempio:

  • [abc] –> restituisce le lettere a, b e c.
  • [^abc] –> restituisce tutte le lettere tranne a, b e c.
  • [0-9] –> restituisce tutti i numeri
  • [^0-9] –> restituisce tutti i non numeri
  • [aeiou] –> ci restituisce tutte le vocali.
  • [^aeiou] –> ci restituisce tutti caratteri che non sono vocali, ossia le consonanti.
  • [a-e] –> ci restituisce tutte le lettere dalla “a” alla “e” (a, b, c, d, e).
  • [a-z] –> ci restituisce tutte le lettere dell’afabeto, ad eccezione di quelle accentate.
  • (rosso|marrone) –> ci restituisce le parole rosso oppure marrone

Scarica il workflow d’esempio.

Mandalo in esecuzione per vedere come reagisce il RegEx tool alle diverse espressioni. Troverai anche un workflow con tre opzioni diverse per suddivedere nello stesso modo le sezioni del CF, usando quanto imparato oggi sulle espressioni regolari e i gruppi.

Federica Ferrarini

Trainer - Milano

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.