Функции разбиения и слияния строк и массивов
splitByChar(separator, s)
Разбивает строку на подстроки, используя в качестве разделителя separator
.
separator должен быть константной строкой из ровно одного символа.
Возвращается массив выделенных подстрок. Могут выделяться пустые подстроки, если разделитель идёт в начале или в конце строки, или если идёт более одного разделителя подряд.
Синтаксис
Аргументы
Возвращаемые значения
Возвращает массив подстрок. Пустая подстрока, может быть возвращена, когда:
- Разделитель находится в начале или конце строки;
- Задано несколько последовательных разделителей;
- Исходная строка
s
пуста.
Пример
splitByString(separator, s)
Разбивает строку на подстроки, разделенные строкой. В качестве разделителя использует константную строку separator
, которая может состоять из нескольких символов. Если строка separator
пуста, то функция разделит строку s
на массив из символов.
Синтаксис
Аргументы
Возвращаемые значения
Возвращает массив подстрок. Пустая подстрока, может быть возвращена, когда:
- Разделитель находится в начале или конце строки;
- Задано несколько последовательных разделителей;
- Исходная строка
s
пуста.
Примеры
splitByRegexp(regexp, s)
Разбивает строку на подстроки, разделенные регулярным выражением. В качестве разделителя используется строка регулярного выражения regexp
. Если regexp
пустая, функция разделит строку s
на массив одиночных символов. Если для регулярного выражения совпадения не найдено, строка s
не будет разбита.
Синтаксис
Аргументы
regexp
— регулярное выражение. Константа. String или FixedString.s
— разбиваемая строка. String.
Возвращаемые значения
Возвращает массив выбранных подстрок. Пустая подстрока может быть возвращена, если:
- Непустое совпадение с регулярным выражением происходит в начале или конце строки;
- Имеется несколько последовательных совпадений c непустым регулярным выражением;
- Исходная строка
s
пуста, а регулярное выражение не пустое.
Примеры
Запрос:
Результат:
Запрос:
Результат:
splitByWhitespace(s)
Разбивает строку на подстроки, используя в качестве разделителей пробельные символы.
Синтаксис
Аргументы
s
— разбиваемая строка. String.
Возвращаемые значения
Возвращает массив подстрок.
Пример
splitByNonAlpha(s)
Разбивает строку на подстроки, используя в качестве разделителей пробельные символы и символы пунктуации.
Синтаксис
Аргументы
s
— разбиваемая строка. String.
Возвращаемые значения
Возвращает массив подстрок.
Пример
arrayStringConcat(arr[, separator])
Склеивает строковые представления элементов массива с разделителем separator
.
separator
- необязательный параметр, константная строка, по умолчанию равен пустой строке.
Возвращается строка.
alphaTokens(s)
Выделяет подстроки из подряд идущих байт из диапазонов a-z и A-Z. Возвращается массив выделенных подстрок.
Пример:
ngrams
Выделяет из UTF-8 строки отрезки (n-граммы) размером ngramsize
символов.
Синтаксис
Аргументы
string
— строка. String or FixedString.ngramsize
— размер n-грамм. UInt.
Возвращаемые значения
- Массив с n-граммами.
Пример
Запрос:
Результат:
tokens
Разбивает строку на токены, используя в качестве разделителей не буквенно-цифровые символы ASCII.
Аргументы
input_string
— набор байтов. String.
Возвращаемые значения
Возвращает массив токенов.
Тип: Array.
Пример
Запрос:
Результат: