В этой части речь пойдет о функциях работы с текстовой информацией, которые могут применяться в запросах и программном коде на языке PL/SQL.
Функция CONCAT(strl, str2)
Данная функция выполняет конкатенацию строк strl и str2. Если один из аргументов равен NULL, то он воспринимается как пустая строка. Если оба аргумента равны NULL, то функция возвращает NULL. Пример:
SELECT CONCAT("У попа \ "была собака") x1,
CONCATCTest"
,
NULL)
х2,
CONCAT(NULL, "Test") х3,
CONCAT(NULL, NULL) x4
FROM
dual
У попа была собака |
Для конкатенации строк Oracle поддерживает специальный оператор конкатенации «||», который работает аналогично функции CONCAT, например:
SELECT CONCAT("У попа
\ "была собака")
x1, "У
попа " ||
"была собака" х2
FROM dual
Не следует путать оператор конкатенации «||», эквивалентный вызову функции CONCAT, и оператор «+», применяемый в арифметических операциях. В Oracle это разные операторы, но за счет автоматического приведения типов возможны трудноуловимые ошибки, например:
SELECT
"5"
+ "3" x1
FROM dual
В данном случае возвращается числовое значение 8, а не текстовая строка «53». Это связано с тем, что, обнаружив арифметическую операцию «+», Oracle автоматически пытается привести аргументы к типу NUMBER.
Функция LOWER(str)
Функция LOWER преобразует все символы строки str в строчные. Пример:
SELECT
LOWER("TeXt DATA") X
FROM dual
Функция UPPER(str)
Функция UPPER преобразует все символы строки str в прописные. Пример:
SELECT UPPER("TeXt DATA") X
FROM
dual
Функция INITCAP(str)
Возвращает строку str, в которой первые буквы всех слов преобразованы в прописные. Функция удобна для форматирования полного имени при построении отчетов. Пример:
SELECT INITCAPCИваноВ петр сиДорович")
X
FROM
dual
Функции LTRIM(str [,set]) и RTRIM(str [,set])
Функция LTRIM удаляет все символы с начала строки до первого символа, которого нет в наборе символов set. По умолчанию set состоит из одного пробела и может не указываться. Функция RTRIM аналогична LTRIM, но удаляет символы, начиная от конца строки. Рассмотрим несколько примеров:
SELECT LTRIM(" TeXt
DATA") X1,
LTRIM(" _ # TeXt
DATA", " #_") X2,
LTRIM(" 1234567890
TeXt DATA", "
1234567890") X3
FROM dual
Функция REPLACE(str, search_str, [,replace_str])
Функция REPLACE осуществляет поиск образца search_str в строке str и каждое найденное вхождение заменяет на replace_str. По умолчанию replace_str равен пустой строке, поэтому вызов функции REPLACE с двумя аргументами приводит к удалению всех найденных вхождений. Поиск подстроки ведется с учетом регистра. Пример:
SELECT REPLACE("У попа была собака",
"собака", "кошка")
x1,
REPLACE("У попа была злая собака",
"злая")
х2,
REPLACE("У попа была собака",
"Собака", "Кошка") х3
FROM dual
У попа была кошка |
У попа была собака |
У попа была собака |
Функция TRANSLATE(str, from_mask, to_mask)
Функция TRANSLATE анализирует строку str и заменяет в ней все символы, встречающиеся в строке from_mask, на соответствующие символы из to_mask. Для корректной работы функции строки from_mask и to_mask должны иметь одинаковую длину или строка from_mask должна быть длиннее, чем to_mask. Если from_mask длиннее, чем to_mask, и в процессе обработки строки str обнаружатся символы, соответствующие одному из символов from_mask, и при этом им не найдется соответствия в to_mask, то такие символы будут удалены из строки str. Если передать from_mask или to_mask, равное NULL, то функция возвратит значение NULL. Сравнение производится с учетом регистра.
SELECT TRANSLATE("Test 12345", "е2\
"Е!") x1,
TRANSLATE("Test 12345", "e234", "E") x2
FROM dual
Данная функция удобна для решения ряда практических задач, связанных с перекодировкой символов или с поиском запрещенных символов. Например, необходимо проанализировать пароль и выяснить, содержит ли он хотя бы одну цифру. Реализация данной проверки при помощи TRANSLATE имеет вид:
IF TRANSLATE(PassWd, "0123456789", "*") = PassWd THEN
ADD_ERR0R("Ошибка
- Пароль должен содержать хотя
бы одну цифру!");
RETURN 1;
END IF;
Другой пример: идет подготовка числа к его преобразованию в NUMBER. Необходимо заменить разделители десятичных знаков «,» и «.» на «.» и удалить пробелы. Реализация данной операции при помощи TRANSLATE имеет вид:
SELECT TRANSLATE("123 455,23", "., ", "
. . ")
x1,
TRANSLATE("-123
455.23", "., ", " . . ") х2
FROM dual
Функция SUBSTR(str, m [,n])
Функция SUBSTR возвращает фрагмент строки str, начиная с символа m длиной n символов. Длину можно не указывать - в этом случае возвращается строка от символа m и до конца строки str. Нумерация символов идет с 1. Если указать m = 0, то копирование все равно начнется с первого символа. Задание отрицательного значения m приводит к тому, что символы отсчитываются от конца строки, а не от начала. Задание значений m, превышающих по абсолютному значению длину строки, приводит к тому, что функция возвращает NULL.
SELECT SUBSTR("У
попа была собака", 13) x1,
SUBSTR("У попа была собака", -6) х2,
SUBSTR("Эto тестовый
текст", 5, 8) х3,
SUBSTR("У попа была собака", 150) х4
FROM dual
текстовый |
Функция INSTR(str, search_str [,n[,m]])
Функция INSTR возвращает позицию первого символа m-ro фрагмента строки str, совпадающего со строкой search_str. Сравнение ведется с n-го символа строки str, при сравнении учитывается регистр. По умолчанию n = m = 1, то есть поиск ведется от начала строки и возвращается позиция первого найденного фрагмента. В случае неуспешного поиска функция возвращает 0.
SELECT INSTR("y
попа была собака", "собака") x1,
INSTR("y
попа была собака", "кошка") х2,
INSTR("Это текст для демонстрации поиска текста", "текст",
1, 2) х3,
INSTR(‘11111000000001",
"1", 7) х4
FROM dual
С данной функций, равно как и со всеми остальными в Oracle, часто допускаются типовые ошибки, связанные с обработкой значения NULL. Если str=NULL, то функция вернет NULL, а не ноль! Это необходимо учитывать при построении различных условий. Например, данный фрагмент программы на PL/SQL как раз не учитывает эту особенность:
IF INSTR(TXT_VAR,
"*") = 0
THEN
...
END
IF
;
В данном случае правильно было бы написать так:
IF
NVL(INSTR(TXT_VAR,
"*"), 0) = 0 THEN
...
END
IF;
Функции LENGTH (str) и LENGTHB (str)
Функция LENGTH (str) возвращает длину строки str в символах. Для пустой строки и значения NULL функция возвращает NULL, поэтому совместно с данной функцией рекомендуется использовать NVL.
SELECT LENGTH("У попа
была собака")
x1,
LENGTH("") х2,
LENGTH(NULL)
х3,
NVL(LENGTH(""), 0) х4
FROM
dual
Функция LENGTHB аналогична функции LENGTH, но возвращает длину строки в байтах.
Функция ASCII(str)
Возвращает ASCII-код первого символа строки str в случае применения кодировки ASCII и значение первого байта многобайтного символа при использовании кодировки на основе многобайтных символов. Пример:
SELECT ASCII("Test") x1 FROM dual
Функция CHR(n)
Возвращает символ по его коду.
SELECT
CHR(64) x1
FROM dual
Вот полный перечень функций работы со строками, взятый из BOL:
Результат - 11. Чтобы выяснить, какие это буквы, мы можем применить функцию CHAR, которая возвращает символ по известному ASCII-коду (от 0 до 255):
А вот как, например, можно получить таблицу кодов всех алфавитных символов:
SELECT CHAR(ASCII("a")+ num-1) letter, ASCII("a")+ num - 1 FROM (SELECT 5*5*(a-1)+5*(b-1) + c AS num FROM (SELECT 1 a UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) x CROSS JOIN (SELECT 1 b UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) y CROSS JOIN (SELECT 1 c UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) z) x WHERE ASCII("a")+ num -1 BETWEEN ASCII("a") AND ASCII("z") |
Тех, кто еще не в курсе генерации числовой последовательности, отсылаю к соответствующей статье.
Как известно, коды строчных и прописных букв отличаются. Поэтому чтобы получить полный набор без переписывания запроса, достаточно просто дописать к вышеприведенному коду аналогичный:
Я полагаю, что не будет сложным добавить эту букву в таблицу, если потребуется.
Рассмотрим теперь задачу определения нахождения искомой подстроки в строковом выражении. Для этого могут использоваться две функции - CHARINDEX и PATINDEX . Обе они возвращают начальную позицию (позицию первого символа подстроки) подстроки в строке. Функция CHARINDEX имеет синтаксис:
CHARINDEX (искомое_выражение , строковое_выражение [, стартовая_позиция ])
Здесь необязательный целочисленный параметр стартовая_позиция определяет позицию в строковом выражении, начиная с которой выполняется поиск искомого_выражения . Если этот параметр опущен, поиск выполняется от начала строкового_выражения . Например, запрос
Следует отметить, что если искомая подстрока либо строковое выражение есть NULL, то результатом функции тоже будет NULL.
Следующий пример определяет позиции первого и второго вхождения символа "a" в имени корабля "California"
А вот, например, как можно найти имена кораблей, которые содержат последовательность из трех символов, первый и последний из которых есть "e":
Парная к LEFT функция RIGHT возвращает заданное число символов справа из строкового выражения:
RIGHT(<строковое выражения >,<число символов >)
Вот, например, как можно определить имена кораблей, которые начинаются и заканчиваются на одну и ту же букву:
Здесь мы разделяем пробелом имя класса и имя корабля. Кроме того, чтобы не повторять всю конструкцию в качестве аргумента функции, используем подзапрос. Результат будет иметь вид:
Чтобы исключить этот случай, можно воспользоваться еще одной полезной функцией LEN (<строковое выражение >) , которая возвращает число символов в строке. Ограничимся случаем, когда число символов больше единицы:
Функция REPLICATE
дополняет константу "abcde" пятью пробелами справа, которые не учитываются функцией LEN
, - в обоих случаях получаем 5.
Функция DATALENGTH
возвращает число байтов в представлении переменной и демонстрирует нам различие между типами CHAR и VARCHAR. DATALENGTH
даст нам 12 для типа CHAR и 10 - для VARCHAR.
Как и следовало ожидать, DATALENGTH
для переменной типа VARCHAR вернула фактическую длину переменной. Но почему для переменной типа CHAR результат оказался равным 12? Дело в том, что CHAR - это тип фиксированной длины
. Если значение переменной оказывается меньше ее длины, а длину мы объявили как CHAR(12), то значение переменной будет "выровнено" до требуемой длины за счет добавления концевых пробелов.
На сайте имеются задачи, в которых требуется упорядочить (найти максимум и т.д.) в числовом порядке значения, представленные в текстовом формате. Например, номер места в самолете ("2d") или скорость CD ("24x"). Проблема заключается в том, что текст сортируется так (по возрастанию)
Если же требуется упорядочить места в порядке возрастания рядов, то порядок должен быть такой
Если только этим и ограничиться, то получим
Осталось выполнить сортировку
Строковые функции Sql
Эта группа функций позволяет манипулировать текстом. Строковых функций много, мы рассмотрим наиболее употребительные.- CONCAT(str1,str2...)
Возвращает строку, созданную путем объединения аргументов (аргументы указываются
в скобках - str1,str2...). Например, в нашей таблице Поставщики (vendors) есть столбец Город (city) и столбец Адрес (address).
Предположим, мы хотим, чтобы в результирующей таблице Адрес и Город указывались в одном столбце, т.е. мы хотим
объединить данные из двух столбцов в один. Для этого мы будем использовать строковую функцию CONCAT(), а в качестве
аргументов укажем названия объединяемых столбцов - city и address:
SELECT CONCAT(city, address) FROM vendors;
Обратите внимание, объединение произошло без разделения, что не очень читабельно. Давайте подправим наш запрос, чтобы между объединяемыми столбцами был пробел:
SELECT CONCAT(city, " ", address) FROM vendors;
Как видите, пробел считается тоже аргументом и указывается через запятую. Если объединяемых столбцов было бы больше, то указывать каждый раз пробелы было бы нерационально. В этом случае можно было бы использовать строковую функцию CONCAT_WS(разделитель, str1,str2...) , которая помещает разделитель между объединяемыми строками (разделитель указывается, как первый аргумент). Наш запрос тогда будет выглядеть так:
SELECT CONCAT_WS(" ", city, address) FROM vendors;
Результат внешне не изменился, но если бы мы объединяли 3 или 4 столбца, то код значительно бы сократился.
- INSERT(str, pos, len, new_str)
Возвращает строку str, в которой подстрока, начинающаяся
с позиции pos и имеющая длину len символов, заменена подстрокой new_str. Предположим, мы решили в столбце Адрес (address)
не отображать первые 3 символа (сокращения ул., пр., и т.д.), тогда мы заменим их на пробелы:
SELECT INSERT(address, 1, 3, " ") FROM vendors;
То есть три символа, начиная с первого, заменены тремя пробелами.
- LPAD(str, len, dop_str)
Возвращает строку str, дополненную слева строкой dop_str до длины len.
Предположим, мы хотим, чтобы при выводе городов поставщиков они располагались бы справа, а пустое пространство заполнялось бы
точками:
SELECT LPAD(city, 15, ".") FROM vendors;
- RPAD(str, len, dop_str)
Возвращает строку str, дополненную справа строкой dop_str до длины len.
Предположим, мы хотим, чтобы при выводе городов поставщиков они располагались бы слева, а пустое пространство заполнялось бы
точками:
SELECT RPAD(city, 15, ".") FROM vendors;
Обратите внимание, значение len ограничивает количество выводимых символов, т.е. если название города будет длиннее 15 символов, то оно будет обрезано.
- LTRIM(str)
Возвращает строку str, в которой удалены все начальные пробелы. Эта строковая
функция удобна для корректного отображения информации в случаях, когда при вводе данных допускаются случайные пробелы:
SELECT LTRIM(city) FROM vendors;
- RTRIM(str)
Возвращает строку str, в которой удалены все конечные пробелы:
SELECT RTRIM(city) FROM vendors;
В нашем случае лишних пробелов не было, поэтому и результат внешне мы не увидим.
- TRIM(str)
Возвращает строку str, в которой удалены все начальные и конечные пробелы:
SELECT TRIM(city) FROM vendors;
- LOWER(str)
Возвращает строку str, в которой все символы переведены в нижний регистр.
С русскими буквами работает некорректно, поэтому лучше не применять. Например, давайте
применим эту функцию к столбцу city:
SELECT city, LOWER(city) FROM vendors;
Видите, какая абракадабра получилась. А вот с латиницей все в порядке:SELECT LOWER("CITY");
- UPPER(str)
Возвращает строку str, в которой все символы переведены в верхний регистр.
С русскими буквами так же лучше не применять. А вот с латиницей все в порядке:
SELECT UPPER(email) FROM customers;
- LENGTH(str)
Возвращает длину строки str. Например, давайте узнаем сколько символов в наших
адресах поставщиков:
SELECT address, LENGTH(address) FROM vendors;
- LEFT(str, len)
Возвращает len левых символов строки str. Например, пусть в городах поставщиков
выводится только первые три символа:
SELECT name, LEFT(city, 3) FROM vendors;
- RIGHT(str, len)
Возвращает len правых символов строки str. Например, пусть в городах поставщиков
выводится только последние три символа:
SELECT LOAD_FILE("C:/proverka");
Обратите внимание, необходимо указывать абсолютный путь к файлу .
Below is a full list of the string functions taken from BOL:
ASCII | NCHAR | SOUNDEX |
CHAR | PATINDEX | SPACE |
CHARINDEX | REPLACE | STR |
DIFFERENCE | QUOTENAME | STUFF |
LEFT | REPLICATE | SUBSTRING |
LEN | REVERSE | UNICODE |
LOWER | RIGHT | UPPER |
RTRIM | RTRIM |
Let"s start from two reciprocally related functions - ASCII and CHAR:
The ASCII function returns an ASCII code value of the leftmost character of a character expression, being a function argument.
Here is an example of the way to determine how many different letters which the names of the ships in the Ships table start from are:
SELECT COUNT(DISTINCT ASCII(name)) FROM Ships
Result is 11. To find out what these letters are, we can use CHAR function that returns a character by a known ASCII code value (from 0 to 255):
SELECT DISTINCT CHAR(ASCII(name)) FROM Ships ORDER BY 1
We should note that the identical result can be got simpler using one more function - LEFT that has the following syntax:
LEFT (<character_expression >, <integer_expression >)
and returns the part of a character string starting at a specified number of characters from the left. So,
SELECT DISTINCT LEFT(name, 1) FROM Ships ORDER BY 1
And this is the way to get the table of codes of all alphabetical characters:
SELECT CHAR(ASCII("a")+ num-1) letter, ASCII("a")+ num - 1
FROM
(SELECT 1 a UNION ALL SELECT 2 UNION
ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) x
CROSS
JOIN
CROSS
JOIN
) x
WHERE ASCII("a")+ num -1 BETWEEN ASCII("a") AND ASCII("z")
For those who are unaware of generating of numerical sequence I refer to the corresponding article .
It is known that code values of lowercase letters and capital letters differ. That"s why in order to get the whole set without rewriting above query; it will be enough to write up the identical code to aforesaid:
UNION
SELECT CHAR(ASCII("A")+ num-1) letter, ASCII("A")+ num - 1
FROM
SELECT 5*5*(a-1)+5*(b-1) + c AS num FROM
(SELECT 1 a UNION ALL SELECT 2
UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) x
CROSS
JOIN
(SELECT 1 b UNION ALL SELECT 2
UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) y
CROSS
JOIN
(SELECT 1 c UNION ALL SELECT 2
UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) z
) x
WHERE ASCII("A")+ num -1 BETWEEN ASCII("A") AND ASCII("Z")
Now let"s consider the task of searching a substring in a string expression. The two functions can be used for this: CHARINDEX and PATINDEX . They both return a starting position (a position of the first character of a substring) of a substring in a character string. The function CHARINDEX has the following syntax:
CHARINDEX (string_expression , target_expression [ , start_location ] )
Here an optional integer parameter start_location defines a position in a string_expression , where searching a target_expression starts from. If this argument is omitted, a searching starts from the beginning of a string_expression . For example, the query
SELECT name FROM Ships WHERE CHARINDEX("sh", name) > 0
will output the ships that has the sequence of characters "sh" in its names. Here we use the fact that if a substring to be found is not found, the function CHARINDEX returns 0. The result of executing the query will contain the following ships:
name |
Kirishima |
Musashi |
Washington |
We should note that if a target_expression or string_expression is NULL, the result of the function is also NULL.
The next example determines the positions of the first and second occurrences of the character "a" in the name of the ship "California"
SELECT CHARINDEX("a",name) first_a,
CHARINDEX("a", name, CHARINDEX("a", name)+1) second_a
Pay attention that in determining of the second occurrence the starting position, used in function, is the position of a character next to the first "a" - CHARINDEX("a", name)+1. The propriety of the result - 2 and 10 - can be easily checked.
The function PATINDEX has the following syntax:
PATINDEX ("%pattern%" , string_expression )
The main distinction of this function from CHARINDEX is that a search string may contain wildcard characters - % and _. Leading and ending characters "%" are required. For, example, usage of this function in the first example will look like
SELECT name FROM Ships WHERE PATINDEX("%sh%", name) > 0
And there"s the way to find the names of the ships that contain the sequence of three characters, first and last of which is "e":
SELECT name FROM Ships
WHERE PATINDEX("%e_e%", name) >0
The result of executing of this query looks like this:
name |
Revenge |
Royal Sovereign |
The function RIGHT that complements LEFT returns a specified number of characters from the right of a character expression:
RIGHT(<character_expression >,<integer_expression >)
Here is, for example, the way to determine the names of the ships that start and end with the same letter:
SELECT name FROM Ships
WHERE LEFT(name, 1) = RIGHT(name, 1)
The thing that we got an empty resulting set means that such ships are absent in our database. Let"s take a combination - a class and a name of a ship.
The combining of two string values into one is called concatenation , and in the SQL Server sign "+" is used for this operation ("||" in standard). So,
SELECT * FROM (
) x
Here we separate by space the class and the name of a ship. Besides, in order not to repeat the whole construction in the function argument, we use a subquery. The result will look like this:
cn |
Iowa Missouri |
North Carolina Washington |
And what if a string expression will contain only one character? The query will output it. You can easily check it by writing
SELECT * FROM (
SELECT class +" "+ name AS cn FROM Ships
UNION ALL SELECT "a" as nc
) x
WHERE LEFT(cn, 1)=RIGHT(cn, 1)
In order to exclude this case, one more useful function LEN(string_expression ) can be used. It returns the number of characters in a string. Let"s bound by the case, when the number of characters is greater than one:
SELECT * FROM (
SELECT class +" "+ name AS cn FROM Ships
UNION ALL SELECT "a" as nc
) x
WHERE LEFT(cn, 1)=RIGHT(cn, 1) AND LEN(cn)>1
There are tasks on the website that require to normalize (find maximum etc.) in a numerical order a values represented in a string format, for example, a seat number in a plane ("2d") or a speed of CD ("24x"). The problem lies in a fact that the text sorts like this (ascending)
11a
1a
2a
SELECT "1a" AS place
UNION ALL SELECT "2a"
UNION ALL SELECT "11a"
ORDER BY 1
If the sorting of places in order of rows increase is required, the order must be like this:
1a
2a
11a
In order to get such an order, the sorting by a numeric values in text is needed. I
offer the following algorithm:
1. Extract a number from the string.
2. Convert it to a numeric format.
3. Perform a sorting by a converted value.
As we know that there"s only one letter in the string, and to extract a number we can use the following construction that doesn"t depend on a number of numerals in a seat number:
LEFT(place, LEN(place)-1)
If we just bound by this, we"ll get
place |
1a |
11a |
2a |
Converting to a numeric format may look like the following:
CAST (LEFT(place, LEN(place)-1) AS INT)
Now we should just perform a sorting
SELECT * FROM (
SELECT "1a" AS place
UNION ALL SELECT "2a"
UNION ALL SELECT "11a"
) x ORDER BY CAST(LEFT(place, LEN(place)-1) AS INT)
As required to proof.
Previously we used the LEFT function to extract a number from a string expression, because we knew a priori how many characters should be removed from the right (one). And what if we should extract a string from a substring not by the known position of a character, but by a character itself? For example, extract all the characters before the first letter "x" (a value of CD speed).
In this case we can also use the previously considered CHARINDEX function that allows us to determine the unknown position of the character:
SELECT model, LEFT(cd, CHARINDEX("x", cd) -1) FROM PC
SUBSTRING function
SUBSTRING (<expression > ,<start >,<length >)
This function allows us to extract from an expression its part of a specified length, starting from a specified initial position. Expression may be a character or a binary string, and also can have a text or image type. For example, if we need to get 3 characters in a ship name, starting from the 2 nd character, then it"s not quite easy to do it without the SUBSTRING function. And so we write:
SELECT name, SUBSTRING(name, 2, 3) FROM Ships
In case we need to extract all the characters, starting from the certain, we also can use this function. For example,
SELECT name, SUBSTRING(name, 2, LEN(name)) FROM Ships
will give us all the characters in the names of the ships, starting from the second letter in the name. Pay attention that in order to specify the number of characters to extract I used the LEN(name) function that returns a number of characters in the name. It"s clearly that forasmuch as I need the characters, starting from the second, its number will be less than the whole number of the characters in the name. But it doesn"t cause an error, because if a specified number of characters exceed a permissible number, all the characters until the end of a string will be extracted. That is why I take it with a reserve sparing myself the calculations.
REVERSE function
This function reverses a string, just like reading it from the right to left. That is the result of the query
SELECT REVERSE("abcdef")
will be "fedcba". In case of the absence of the RIGHT function in the language the query
SELECT RIGHT("abcdef",3)
can be equally replaced with the query
SELECT REVERSE(LEFT(REVERSE("abcdef"),3))
I see the profit of this function in the following. Let we need to determine a position not the first, but the last occurrence of any character (or a sequence of characters) in a character string.
Let"s remind an example, where we were determining the position of the first character "a" in the name of the ship "California":
SELECT CHARINDEX("a", name) first_a
FROM Ships WHERE name="California"
Now let"s determine the position of the last occurrence of the character "a" in this name. The function
CHARINDEX("a", REVERSE(name))
will allow us to find this position, but from the right. In order to get the position of this character, but from the left, it"s enough to write
SELECT LEN(name) + 1 - CHARINDEX("a", REVERSE(name)) first_a
FROM Ships WHERE name="California"
REPLACE function
REPLACE (<string_expression1 > , <string_expression2 > , <string_expression3 >)
This function replaces in the string_expression1 all the occurrences of the string_expression2 with the string_expression3 . This function is absolutely helpful in UPDATE operators, if we should change the content of the column. For example, let we are needed to replace all the spaces with the hyphen in the names of the ships. Then we can write
UPDATE Ships
SET name = REPLACE(name, " ", "-")
(This example you can perform on the page with the DML exercises, where the questions on updating the data are admitted)
However this function can also find its appliance in more non-trivial cases. Let"s determine how many times the letter "a" is used in a name of a ship. The idea is quite easy: let"s replace every searching letter with any two characters, and after that we"ll calculate the difference of lengths of the string we got and the source string. So,
SELECT name, LEN(REPLACE(name, "a", "aa")) - LEN(name) FROM Ships
And what if we need to determine the number of occurrences of a random sequence of characters that, say, we get as a parameter of a stored procedure? In this case we should complement the used above algorithm with the division on a number of a characters in a sequence:
DECLARE @str AS VARCHAR(100)
SET @str="ma"
SELECT name, (LEN(REPLACE(name, @str, @[email protected])) - LEN(name))/LEN(@str) FROM
Ships
Here in order to double the number of searching characters the concatenation @[email protected] was applied. However for this effect we can use one more function - REPLICATE that repeats the first argument so many times as it specified by the second argument.
SELECT name, (LEN(REPLACE(name, @str, REPLICATE(@str, 2))) - LEN(name))/LEN(@str) FROM Ships
That is we repeat twice the substring stored in the variable @str.
If we need to replace in a string not a certain sequence of characters, but a specified number of characters, starting from some position, it"s simpler to use the STUFF function:
STUFF (<character_expression1
> , <start
>
,
This function replaces a substring with length of length that starts from the start position in the character_expression1 with the character_expression2 .
The example. Change the name of a ship: append "_" (underscore) and a launching year after the first 5 characters. If there is less than 5 characters in the name, complement it with the spaces.
This task can be solved with many different functions. We"ll try to do it with the STUFF function.
In the first approach we"ll write (bounding with the select query):
SELECT name, STUFF(name, 6, LEN(name), "_"+launched) FROM Ships
I use LEN(name) as the third argument (number of characters to replace), because I should replace all the characters until the end of the string, and that"s why I take it with a reserve - the original number of characters in the name. But this query will still return an error. And the question is not in the third argument, but in the forth, where the concatenation of the string constant and the integer column is performing. This is the type conversion error. In order to convert a number to its string representation we may use one more built-in function - STR :
STR (<float_expression > [ , <length > [ , <decimal > ] ])
Under this conversion the round-up is being worked, and a length specifies a length of the resulting string. For example,
STR(3.3456, 5, 1) 3.3
STR(3.3456, 5, 2) 3.35
STR(3.3456, 5, 3) 3.346
STR(3.3456, 5, 4) 3.346
Take note, that if have got string view of the number is less than the specified length, the leading spaces are added. If the result is greater than the specified length, the fractional part is being truncated (with the round-up); in case there is an integer value we get the corresponding number of the asterisks "*".
STR(12345,4,0) ****
By the way, default length is 10 symbols. Keeping in mind that a year is represented by four numbers, we will write
SELECT name, STUFF(name, 6, LEN(name), "_"+STR(launched, 4)) FROM Ships
Everything is almost right. The case is rested to consider, when the number of symbols in the name is less than 6, as in this case the function STUFF gives NULL. Well, we will have to be on the rack to the end, which is connected with using this function in this example, on the way applying one more string function.
We"ll add the trailing blanks for the name`s length being knowingly more than 6. There is a special SPACE function for that
SPACE(<number_of_blanks >):
SELECT name, STUFF(name + SPACE(6), 6, LEN(name), "_"+STR(launched,4)) FROM Ships
LTRIM and RTRIM functions
LTRIM (<character_expression >)
RTRIM (<character_expression >)
cut accordingly the leading and trailing blanks of the string expression, which is being converted by default to the VARCHAR type.
Let us need to build such a string: passenger`s name_passenger`s identifier for every record from the Passenger table. If we write
SELECT name + "_" + CAST(id_psg AS VARCHAR) FROM Passenger,
we will get in the result something like:
It is connected with the fact that the column name has the type CHAR (30). The short string is added with the blanks for this type to the specified dimension (we have 30 symbols). The function RTRIM will help us here:
SELECT RTRIM(name) + "_" + CAST(id_psg AS VARCHAR) FROM Passenger
LOWER and UPPER functions
LOWER(<character_expression >)
UPPER(<character_expression >)
convert all the characters of the argument accordingly to the lower and upper register. These functions turn out to be useful in comparison with the registerdepended strings.
A pair of the interesting functions SOUNDEX and DIFFERENCE
SOUNDEX(<character_expression >)
DIFFERENCE (<character_expression_1 >, <character_expression_2 >)
allow us to determine the similar-sounding of words. SOUNDEX returns a four-character code to evaluate the similarity, but DIFFERENCE just properly evaluates the similarity of two comparing character strings. Being that these functions do not support Cyrillic, I refer interested to BOL for the examples of its usage.
In conclusion we will adduce some functions and a few examples of the Unicode usage:
UNICODE function
UNICODE (<ncharacter_expression >)
returns the Unicode value for the first character of the input expression.
NCHAR function
NCHAR (<integer >)
returns a character with the given integer Unicode value. A few examples:
SELECT ASCII("а"), UNICODE("а")
Returns the ASCII-code value and the Unicode value of the Russian letter "а": 224 and 1072.
SELECT CHAR(ASCII("а")), CHAR(UNICODE("а"))
We try to recover a symbol by its code value. We get "а" and NULL. The NULL-value returns because the 1072 code value is absent in the usual code table.
SELECT CHAR(ASCII("а")), NCHAR(UNICODE("а"))
Now it"s all right, "a" in both cases.
SELECT NCHAR(ASCII("а"))
will give "a", because the Unicode value 224 exactly corresponds to this letter.
» Given examples here can be done directly on the website by selecting the check box “Without checking” on the page with SELECT exercises .
Вот полный перечень функций работы со строками, взятый из BOL:
ASCII | NCHAR | SOUNDEX |
CHAR | PATINDEX | SPACE |
CHARINDEX | REPLACE | STR |
DIFFERENCE | QUOTENAME | STUFF |
LEFT | REPLICATE | SUBSTRING |
LEN | REVERSE | UNICODE |
LOWER | RIGHT | UPPER |
LTRIM | RTRIM |
Начнем с двух взаимно обратных функций - ASCII и CHAR .
Функция ASCII возвращает ASCII-код крайнего левого символа строкового выражения, являющегося аргументом функции.
Вот, например, как можно определить, сколько имеется разных букв, с которых начинаются названия кораблей в таблице Ships:
Следует отметить, что аналогичный результат можно получить проще с помощью еще одной функции - LEFT , которая имеет следующий синтаксис:
LEFT (<строковое выражение >, <целочисленное выражение >)
и вырезает заданное вторым аргументом число символов слева из строки, являющейся первым аргументом. Итак,
SELECT DISTINCT LEFT(name, 1) FROM Ships ORDER BY 1 |
А вот как, например, можно получить таблицу кодов всех алфавитных символов:
SELECT CHAR(ASCII("a")+ num-1) letter, ASCII("a")+ num - 1 FROM (SELECT 5*5*(a-1)+5*(b-1) + c AS num FROM (SELECT 1 a UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) x CROSS JOIN (SELECT 1 b UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) y CROSS JOIN (SELECT 1 c UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) z ) x WHERE ASCII("a")+ num -1 BETWEEN ASCII("a") AND ASCII("z") |
Тех, кто еще не в курсе генерации числовой последовательности, отсылаю к соответствующей статье .
Как известно, коды строчных и прописных букв отличаются. Поэтому чтобы получить полный набор без переписывания запроса, достаточно просто дописать к вышеприведенному коду аналогичный:
Я полагаю, что не будет сложным добавить эту букву в таблицу, если потребуется.
Рассмотрим теперь задачу определения нахождения искомой подстроки в строковом выражении. Для этого могут использоваться две функции - CHARINDEX и PATINDEX . Обе они возвращают начальную позицию (позицию первого символа подстроки) подстроки в строке. Функция CHARINDEX имеет синтаксис:
CHARINDEX (искомое_выражение , строковое_выражение [, стартовая_позиция ])
Здесь необязательный целочисленный параметр стартовая_позиция определяет позицию в строковом выражении, начиная с которой выполняется поиск искомого_выражения . Если этот параметр опущен, поиск выполняется от начала строкового_выражения . Например, запрос
Следует отметить, что если искомая подстрока либо строковое выражение есть NULL, то результатом функции тоже будет NULL.
Следующий пример определяет позиции первого и второго вхождения символа "a" в имени корабля "California"
SELECT CHARINDEX("a",name) first_a, CHARINDEX("a", name, CHARINDEX("a", name)+1) second_a FROM Ships WHERE name="California" |
Обратите внимание, что при определении второго символа в функции используется стартовая позиция, которой является позиция следующего за первой буквой "a" символа - CHARINDEX("a", name)+1. Правильность результата - 2 и 10 - легко проверить:-).
Функция PATINDEX имеет синтаксис:
PATINDEX ("%образец %" , строковое_выражение )
Главное отличие этой функции от CHARINDEX заключается в том, что поисковая строка может содержать подстановочные знаки - % и _. При этом концевые знаки "%" являются обязательными. Например, использование этой функции в первом примере будет иметь вид
Результат выполнения этого запроса выглядит следующим образом:
То, что в результате мы получим пустой результирующий набор, означает, что таких кораблей в базе данных нет. Давайте возьмем комбинацию значений - класс и имя корабля.
Соединение двух строковых значений в одно называется конкатенацией , и в SQL Server для этой операции используется знак "+" (в стандарте "||"). Итак,
А если строковое выражение будет содержать лишь одну букву? Запрос выведет ее. В этом легко убедиться, написав