Insights / Blog

Guida alle Espressioni Regolari: Gruppi di Caratteri e Abbreviazioni

Guida alle Espressioni Regolari

Continuiamo la guida sulle espressioni regolari, parlando dei gruppi di caratteri e delle abbreviazioni.

I gruppi di caratteri servono per ricercare un elenco di caratteri. Si racchiudono tra parentesi quadre. Se subito dopo la parentesi quadra aperta inseriamo un “^”, andiamo a negare il gruppo e quindi a farci restituire tutto tranne quello che c’è nel gruppo.

È possibile creare dei range di caratteri con il meno “-” (dal carattere x al carattere y), oppure delle opzioni “or” con la riga orizzontale “|” (il carattere x oppure y).

Esistono dei set di gruppi già presabiliti, oppure è possibile creare dei gruppi personalizzati.

In Alteryx molti gruppi di caratteri standard sono già presenti nel menù a tendina del Regex tool, sotto forma di set abbreviato, composto dallo slash seguito da una lettera.

  • [:alpha:] –> w tutte le lettere dalla “a” alla “z”, maiuscole o minuscole, comprese quelle accentate.
  • [:lower:] –> l –> tutte le lettere dalla “a” alla “z” minuscole, comprese quelle accentate.
  • [:upper:] –> u –> tutte le lettere dalla “A” alla “Z” maiuscole, comprese quelle accentate.
  • [:digit:] –> d tutti i numeri.
  • [:alnum:] –> [:alpha:] + [:digit:] tutti i numeri e tutte le lettere sia maiuscole che minuscole.
  • [:space:] –> s –> spazio
  • [:blank:] –> s|t –> spazi e tab
  • [:cntrl:] –> i caratteri di controllo. Tutti quei caratteri che non si possono stampare, come il CR+LF del fine riga e capo.
  • [:print:] –> l’esatto opposto: tutti i caratteri visibili a schermo.
  • [:punct:] –> tutti i caratteri di punteggiatura.
  • [:xdigit:] –> tutti i caratteri che possono formare un numero esadecimale (da 0 ad F)

In aggiunta a questi gruppi è possibile creare gruppi adatti alle nostre esigenze. Ad esempio:

  • [abc] –> restituisce le lettere a, b e c.
  • [^abc] –> restituisce tutte le lettere tranne a, b e c.
  • [0-9] –> restituisce tutti i numeri
  • [^0-9] –> restituisce tutti i non numeri
  • [aeiou] –> ci restituisce tutte le vocali.
  • [^aeiou] –> ci restituisce tutti caratteri che non sono vocali, ossia le consonanti.
  • [a-e] –> ci restituisce tutte le lettere dalla “a” alla “e” (a, b, c, d, e).
  • [a-z] –> ci restituisce tutte le lettere dell’afabeto, ad eccezione di quelle accentate.
  • (rosso|marrone) –> ci restituisce le parole rosso oppure marrone

Mandalo in esecuzione per vedere come reagisce il RegEx tool alle diverse espressioni regolari. Troverai anche un workflow con tre opzioni diverse per suddividere nello stesso modo le sezioni del CF, usando quanto imparato oggi grazie alla guida sulle espressioni regolari e i gruppi.

Tags
Blog
Data Analytics Automation

Cos’è la Data Analytics Automation e perché adottarla

In un mondo travolto dalla trasformazione digitale, la Data Analytics Automation sta diventando uno strumento...

Tableau
business intelligence

Business Intelligence: perché scegliere Tableau e la Gen AI

Oggi più che mai la Business Intelligence è un catalizzatore essenziale per tradurre dati in...