Доступно с лицензией Data Reviewer.
С помощью метода проверки Регулярное выражение можно проверить значения и форматы строковых значений. В строковых полях значениями служат буквенно-числовые символы.
Это поля, содержащие название объекта, измерения (высота, длина, ширина и площадь), z-значения и метаданные, такие как дата создания объекта. При обнаружении строки, не соответствующей указанному формату или значениям, строка таблицы возвращается как ошибка. Например, чтобы найти записи, содержащие недопустимый формат номера социального страхования (SSN), можно ввести \b[0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9][0-9][0-9]\b в поле SSN. В результате проверки вернутся функции или строки с неверными значениями поля SSN, например 123456789, 123-ab-4567, 1123-34-12345 или 123-4567.
Проверка Регулярное выражение также может использоваться для проверки текстовых строк на основе диапазона значений. Для форматирования этих значений может применяться множество параметров. Эти параметры состоят из метасимволов и аббревиатур. Метасимволы помогают создавать сложные запросы, а аббревиатуры предоставляют ярлыки, которые используются для ввода в запрос значений определенных типов.
Более подробно о проверке Регулярное выражение
Описания метасимволов
Метасимволы, описанные в следующей таблице, являются операторами, которые могут использоваться в запросе для задания сопоставляемых элементов при использовании метода проверки Регулярное выражение.
Метасимвол | Описание | Пример |
---|---|---|
. | Сопоставление отдельных символов. | x.y.z соответствует строке x1y0z или xaybz. |
[ ] | Обозначает отдельные символы и диапазоны значений для сопоставления. | [xyz] соответствует строкам, содержащим x, y или z. |
^ | Сопоставление начальных символов, находящихся в начале выражения. При размещении в скобках с последующими символами, выполняется отрицание этих символов. | ^[xyz] находит строки, начинающиеся с x, y или z. [^abc] находит строки, не содержащие любые комбинации a, b и c. Находятся строки, содержащие bat и bar, но не cab. |
- | Задает диапазон сопоставляемых значений. | [1–5][1-9][1-9] [1-9][1-9] соответствует строкам 12345 или 26589, но не 67890. |
? | Предшествующие символы или диапазоны значений являются частью сопоставляемого выражения. | Sept? соответствует Sept и September, но не December. |
+ | Предшествующие символы или диапазоны значений могут сопоставляться один или несколько раз. | [0–9]+ соответствует 1, 11, 456 и т.д. |
* | Предшествующие символы или диапазоны значений могут сопоставляться ноль раз или несколько раз. | 12*3 соответствует 1223 и 123, но не 223 или 23. |
?? | Сопоставление минимальной части любых символов или диапазонов значений. | 6(th)?? соответствует 6th. |
+? | Сопоставление минимальной части символов или диапазонов значений, которые могут повторяться. Минимальную часть можно повторить один или более раз. | Ju+? соответствует June и July, но не January. |
*? | Сопоставление минимальной части символов или диапазонов значений, которые могут повторяться. Минимальную часть можно повторить ноль или более раз. | ea*? соответствует each, era и fare. |
( ) | Содержит группу выражений и значеий. | (cat) соответствует строкам category и concatenate, но не cart. |
\ | Разрешает использование метасимвола как значимого символа. | \+ позволяет использовать знак + для распознавания. |
$ | Сопоставление по последнему символу. | [123]$ соответствует строкам, оканчивающимся на 1, 2 или 3. |
| | Соответствие альтернативной фразе или написанию. | I|international соответствует International и international. |
Ярлыки для диапазонов значений
Следующие аббревиатуры являются ярлыками для диапазонов значений:
Аббревиатура | Описание |
---|---|
\a | Любые буквенно-цифровые символы (a–zA–Z0–9) |
\b | Пробел |
\c | Любые буквенные символы (a–zA–Z) |
\d | Любая цифра (0–9) |
\h | Любое шестнадцатеричное число |
\n | Новая строка |
\q | Строка в кавычках |
\w | Простое слово ([a–zA–Z]+) |
\z | Целое число ([0–9]+) |
Примеры регулярных выражений
Ниже приведены примеры регулярных выражений:
Строка для поиска | Регулярное выражение |
---|---|
Дата в формате yyyy-mm-dd, в диапазоне между 1900-01-01 и 2099-12-31 | ((19)|(20))\d\d((0[1-9])|(1[012]))((0[1-9])|([12][0-9])|(3[01])) |
Части строки до и после имени человека | ^.*Chris.*$ |
Строковое поле, содержащее только буквы | [A-Za-z]* |