Disponible avec une licence Data Reviewer.
La vérification Expression régulière vous permet de vérifier à la fois les valeurs et les formats des valeurs de chaîne. Les champs de chaîne utilisent des chaînes alphanumériques comme valeurs.
Les champs peuvent notamment contenir le nom de l’entité, les mesures (hauteur, longueur, largeur et surface), les valeurs z et les métadonnées (date de création d’une entité, par exemple). Lorsqu’une chaîne qui ne correspond pas au format ou aux valeurs spécifiés est détectée, la ligne de la table est renvoyée comme erreur. Pour rechercher par exemple les enregistrements dont le format du numéro de sécurité social est incorrect, vous pouvez saisir \b[0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9][0-9][0-9]\b dans le champ SSN (Numéro de sécurité sociale). La vérification renvoie les entités ou lignes dont les valeurs de champ SSN sont incorrectes, par exemple : 123456789, 123-ab-4567, 1123-34-12345 ou 123-4567.
La vérification Expression régulière permet également de vérifier les chaînes de texte en fonction de plages de valeurs. Pour mettre ces valeurs en forme, vous pouvez définir différents paramètres. Ces paramètres se composent de métacaractères et d’abréviations. Les métacharactères vous aident à complexifier la requête, tandis que les abréviations offrent des raccourcis qui facilitent l’ajout de types de valeurs spécifiques dans la requête.
En savoir plus sur la vérification Expression régulière
Description des métacaractères
Les métacaractères décrits dans la table suivante sont des opérateurs qui peuvent être utilisés dans la requête pour déterminer ce qui est à apparier à l’aide de la vérification Expression régulière.
Métacaractère | Description | Exemple |
---|---|---|
. | Apparie les caractères individuels. | x.y.z apparie une chaîne telle que x1y0z ou xaybz. |
[ ] | Contient des caractères individuels et des plages de valeurs à apparier. | [xyz] apparie les chaînes contenant x, y, ou z. |
^ | Apparie la saisie de début lorsqu’elle est au début de l’expression. Lorsqu’il se trouve entre crochets et qu’il est suivi de caractères, il invalide les caractères qui suivent. | ^[xyz] apparie les chaînes commençant par x, y ou z. [^abc] apparie des chaînes qui ne contiennent aucune combinaison de a, b et c. Les chaînes potentiellement appariées incluent bat et bar, mais pas cab. |
- | Indique une plage de valeurs à apparier. | [1–5][1-9][1-9] [1-9][1-9] apparie des chaînes telles que 12345 ou 26589, mais pas 67890. |
? | Les caractères ou plages de valeurs qui précèdent sont une partie facultative de l’expression à apparier. | Sept? apparie Sept et Septembre, mais pas Décembre. |
+ | Les caractères ou plages de valeurs qui précèdent peuvent être appariées une fois ou plus. | [0–9]+ apparie 1, 11, 456, etc. |
* | Les caractères ou plages de valeurs qui précèdent peuvent être appariées zéro fois ou plus. | 12*3 apparie 1223 et 123, mais pas 223 ou 23. |
?? | Apparie une partie minimale des caractères ou plages de valeurs facultatifs. | 6(ème)?? apparie 6ème. |
+? | Apparie une partie minimale des caractères ou plages de valeurs pouvant se répéter. La partie minimale peut être répétée une ou plusieurs fois. | Ju+? apparie Juin et Juillet, mais pas Janvier. |
*? | Apparie une partie minimale des caractères ou plages de valeurs pouvant se répéter. La partie minimale peut être répétée zéro ou plusieurs fois. | ai*? apparie des chaînes comme aire, ami et dira. |
( ) | Contient un groupe d’expressions et de valeurs. | (cat) apparie des chaînes telles que catégorie et concaténer, mais pas carton. |
\ | Permet d’utiliser un métacaractère comme caractère littéral. | \+ permet au signe plus d’être reconnu en tant que tel. |
$ | Apparie la saisie en fonction du dernier caractère. | [123]$ apparie les chaînes qui se terminent par 1, 2 ou 3. |
| | Apparie une autre expression ou orthographe. | I|international apparie International et international. |
Raccourcis des plages de valeurs
Les abréviations suivantes fournissent des raccourcis pour les plages de valeurs :
Abréviation | Description |
---|---|
\a | Tout caractère alphanumérique (a–zA–Z0–9) |
\b | Espace blanc |
\c | Tout caractère alphabétique (a–zA–Z) |
\d | Tout chiffre décimal (0–9) |
\h | Tout chiffre hexadécimal |
\n | Nouvelle ligne |
\q | Chaîne référencée |
\w | Mot simple ([a–zA–Z]+) |
\z | Entier ([0–9]+) |
Exemples d’expressions régulières
Voici des exemples d’expressions régulières :
Chaîne à trouver | Expression régulière |
---|---|
Date au format aaaa-mm-jj comprise entre 1900-01-01 et 2099-12-31 | ((19)|(20))\d\d((0[1-9])|(1[012]))((0[1-9])|([12][0-9])|(3[01])) |
Parties d’une ligne avant et après le nom d’une personne | ^.*Chris.*$ |
Champ de chaîne contenant uniquement des caractères alphabétiques. | [A-Za-z]* |