Insights / Blog

Guida alle Espressioni Regolari: Gruppi di Caratteri e Abbreviazioni

Guida alle Espressioni Regolari

Continuiamo la guida sulle espressioni regolari, parlando dei gruppi di caratteri e delle abbreviazioni.

I gruppi di caratteri servono per ricercare un elenco di caratteri. Si racchiudono tra parentesi quadre. Se subito dopo la parentesi quadra aperta inseriamo un “^”, andiamo a negare il gruppo e quindi a farci restituire tutto tranne quello che c’è nel gruppo.

È possibile creare dei range di caratteri con il meno “-” (dal carattere x al carattere y), oppure delle opzioni “or” con la riga orizzontale “|” (il carattere x oppure y).

Esistono dei set di gruppi già presabiliti, oppure è possibile creare dei gruppi personalizzati.

In Alteryx molti gruppi di caratteri standard sono già presenti nel menù a tendina del Regex tool, sotto forma di set abbreviato, composto dallo slash seguito da una lettera.

  • [:alpha:] –> w tutte le lettere dalla “a” alla “z”, maiuscole o minuscole, comprese quelle accentate.
  • [:lower:] –> l –> tutte le lettere dalla “a” alla “z” minuscole, comprese quelle accentate.
  • [:upper:] –> u –> tutte le lettere dalla “A” alla “Z” maiuscole, comprese quelle accentate.
  • [:digit:] –> d tutti i numeri.
  • [:alnum:] –> [:alpha:] + [:digit:] tutti i numeri e tutte le lettere sia maiuscole che minuscole.
  • [:space:] –> s –> spazio
  • [:blank:] –> s|t –> spazi e tab
  • [:cntrl:] –> i caratteri di controllo. Tutti quei caratteri che non si possono stampare, come il CR+LF del fine riga e capo.
  • [:print:] –> l’esatto opposto: tutti i caratteri visibili a schermo.
  • [:punct:] –> tutti i caratteri di punteggiatura.
  • [:xdigit:] –> tutti i caratteri che possono formare un numero esadecimale (da 0 ad F)

In aggiunta a questi gruppi è possibile creare gruppi adatti alle nostre esigenze. Ad esempio:

  • [abc] –> restituisce le lettere a, b e c.
  • [^abc] –> restituisce tutte le lettere tranne a, b e c.
  • [0-9] –> restituisce tutti i numeri
  • [^0-9] –> restituisce tutti i non numeri
  • [aeiou] –> ci restituisce tutte le vocali.
  • [^aeiou] –> ci restituisce tutti caratteri che non sono vocali, ossia le consonanti.
  • [a-e] –> ci restituisce tutte le lettere dalla “a” alla “e” (a, b, c, d, e).
  • [a-z] –> ci restituisce tutte le lettere dell’afabeto, ad eccezione di quelle accentate.
  • (rosso|marrone) –> ci restituisce le parole rosso oppure marrone

Mandalo in esecuzione per vedere come reagisce il RegEx tool alle diverse espressioni regolari. Troverai anche un workflow con tre opzioni diverse per suddividere nello stesso modo le sezioni del CF, usando quanto imparato oggi grazie alla guida sulle espressioni regolari e i gruppi.

Tags
Pharma
Predictive analytics healthcare

Predictive analytics healthcare: come l’AI rivoluziona la medicina

Il mondo dell’healthcare è storicamente legato ai dati. Gli esami, le diagnosi, i successi degli...

Blog
tableau pulse

Tableau Pulse: La GeneAI sbarca su Tableau

Tableau Pulse, introdotto da Salesforce come parte della suite Tableau AI, sfrutta l’intelligenza artificiale generativa...