DB version: 5.7.25-log
目錄:
一、字符串常規函數
二、字符串比較函數
三、正則表達式
四、字符集和排序規則函數
一、字符串常規函數
ASCII(str)
返回字符串中第一個字符的ascii碼,如果字符串為空,則返回0,為NULL,則返回NULL。只適合單字節的字符,不適用于多字節,如漢字。
多字節用 ORD(str)
。
mysql> select ascii('123');
+--------------+
| ascii('123') |
+--------------+
| 49 |
+--------------+
mysql> select ascii(1);
+----------+
| ascii(1) |
+----------+
| 49 |
+----------+
mysql> select ascii('a');
+------------+
| ascii('a') |
+------------+
| 97 |
+------------+
mysql> select ascii('abc');
+--------------+
| ascii('abc') |
+--------------+
| 97 |
+--------------+
mysql> select ascii('');
+-----------+
| ascii('') |
+-----------+
| 0 |
+-----------+
mysql> select ascii(NULL);
+-------------+
| ascii(NULL) |
+-------------+
| NULL |
+-------------+
ORD(str)
如果字符串str的第一個字符是多字節字符,則返回該字符的代碼,該代碼使用以下公式根據其組成字節的數值計算得出:
(1st byte code) + (2nd byte code * 256) + (3rd byte code * 256^2) ...
mysql> select ord('我');
+-----------+
| ord('我') |
+-----------+
| 15108241 |
+-----------+
mysql> select ord('我是中國人');
+-------------------+
| ord('我是中國人') |
+-------------------+
| 15108241 |
+-------------------+
計算公式:
mysql> SELECT hex(CONVERT( '我' USING utf8 ));
+---------------------------------+
| hex(CONVERT( '我' USING utf8 )) |
+---------------------------------+
| E68891 |
+---------------------------------+
將三個字節對應的編碼轉為10進制再乘以256的次方。
第一個字節 91 :(9*16+1)
第二個字節 88 :(8*16+8)*256
第三個字節 E6 :(14*16+6)*256*256
mysql> select (9*16+1)+(8*16+8)*256+(14*16+6)*256*256 as res;
+----------+
| res |
+----------+
| 15108241 |
+----------+
如果字符串str的第一個字符是單字節字符,則返回與ASCII(str) 相同的值。
mysql> select ord('a我是中國人');
+--------------------+
| ord('a我是中國人') |
+--------------------+
| 97 |
+--------------------+
BIN(N)
返回N的二進制值的字符串表示形式,其中N是一個BIGINT數字。最大可為2^64。
- 如果N為NULL或'',則返回NULL;
- 如果N為非數字,則返回0。
mysql> select bin(1234);
+-------------+
| bin(1234) |
+-------------+
| 10011010010 |
+-------------+
mysql> select bin(NULL);
+-----------+
| bin(NULL) |
+-----------+
| NULL |
+-----------+
mysql> select bin('');
+---------+
| bin('') |
+---------+
| NULL |
+---------+
mysql> select bin('w');
+----------+
| bin('w') |
+----------+
| 0 |
+----------+
mysql> select bin('我');
+-----------+
| bin('我') |
+-----------+
| 0 |
+-----------+
BIT_LENGTH(str)
以位為單位返回字符串str的長度。
gbk 編碼下一個漢字占兩個字節
mysql> select bit_length(CONVERT( '我' USING gbk )) ;
+----------------------------------------+
| bit_length(CONVERT( '我' USING gbk )) |
+----------------------------------------+
| 16 |
+----------------------------------------+
utf8 編碼下一個漢字占三個字節,24位
mysql> select bit_length(CONVERT( '我' USING utf8mb4 ));
+--------------------------------------------+
| bit_length(CONVERT( '我' USING utf8mb4 )) |
+--------------------------------------------+
| 24 |
+--------------------------------------------+
emoji表情只能用 utf8mb4保存,且占四個字節,32位
mysql> select bit_length(CONVERT( '??' USING utf8mb4 )) ;
+------------------------------------------+
| bit_length(CONVERT( '?' USING utf8mb4 )) |
+------------------------------------------+
| 32 |
+------------------------------------------+
CHAR(N)
返回N整數部分在ascii碼表對應的字符(N為小數,則舍棄小數位)
1.NULL被跳過,不返回任何東西 ;
2.ascii碼只有256(0-255)個,超過255的數字將被轉換成多個字節結果;
3.默認返回二進制字符集,可用using語句進行指定字符集。
mysql> SELECT CHAR(77,121,null,83,81,'76');
+------------------------------+
| CHAR(77,121,null,83,81,'76') |
+------------------------------+
| MySQL |
+------------------------------+
mysql> SELECT CHAR(81,81.12,'81.3');
+-----------------------+
| CHAR(81,81.12,'81.3') |
+-----------------------+
| QQQ |
+-----------------------+
超過255被轉為多字節
CHAR(256) 等價于 CHAR(1,0),CHAR(65535)等價于CHAR(255,255),以此類推
mysql> SELECT HEX(CHAR(255)),HEX(CHAR(256)),HEX(CHAR(1,0)),HEX(CHAR(65535)),HEX(CHAR(255,255)),HEX(CHAR(65536)),HEX(CHAR(1,0,0));
+----------------+----------------+----------------+------------------+--------------------+------------------+------------------+
| HEX(CHAR(255)) | HEX(CHAR(256)) | HEX(CHAR(1,0)) | HEX(CHAR(65535)) | HEX(CHAR(255,255)) | HEX(CHAR(65536)) | HEX(CHAR(1,0,0)) |
+----------------+----------------+----------------+------------------+--------------------+------------------+------------------+
| FF | 0100 | 0100 | FFFF | FFFF | 010000 | 010000 |
+----------------+----------------+----------------+------------------+--------------------+------------------+------------------+
如果給出了USING并且結果字符串對于給定的字符集是非法的,則會發出警告。
如果啟用了嚴格的SQL模式,則CHAR()的結果將為NULL。
mysql> SELECT CHARSET(CHAR(0x65)), CHARSET(CHAR(0x65 USING utf8));
+---------------------+--------------------------------+
| CHARSET(CHAR(0x65)) | CHARSET(CHAR(0x65 USING utf8)) |
+---------------------+--------------------------------+
| binary | utf8 |
+---------------------+--------------------------------+
CHARACTER_LENGTH(str)
是CHAR_LENGTH()的同義詞,見下
CHAR_LENGTH(str)
返回字符串str的長度,以字符為單位。不論多字節還是單字節字符均算作單個字符。
mysql> SELECT CHAR_LENGTH('MySQL'), CHAR_LENGTH('我是中國人');
+----------------------+---------------------------+
| CHAR_LENGTH('MySQL') | CHAR_LENGTH('我是中國人') |
+----------------------+---------------------------+
| 5 | 5 |
+----------------------+---------------------------+
CONCAT(str1,str2,...)
返回由一個或多個參數連接產生的字符串。
1.如果所有參數均為非二進制字符串,則結果為非二進制字符串。
2.如果參數包含任何二進制字符串,則結果為二進制字符串。
3.數字參數將轉換為其等效的非二進制字符串形式。
4.連接的字符串中存在NULL,則返回NULL
mysql> SELECT CONCAT('My', 'S', 'QL'),CHARSET(CONCAT('My', 'S', 'QL')), CONCAT('My', 'S',NULL, 'QL'),CONCAT(X'65','f',12),CHARSET(CONCAT(X'65','f',12));
+-------------------------+----------------------------------+------------------------------+----------------------+-------------------------------+
| CONCAT('My', 'S', 'QL') | CHARSET(CONCAT('My', 'S', 'QL')) | CONCAT('My', 'S',NULL, 'QL') | CONCAT(X'65','f',12) | CHARSET(CONCAT(X'65','f',12)) |
+-------------------------+----------------------------------+------------------------------+----------------------+-------------------------------+
| MySQL | utf8mb4 | NULL | ef12 | binary |
+-------------------------+----------------------------------+------------------------------+----------------------+-------------------------------+
對于帶引號的字符串,可以通過將字符串彼此相鄰放置來實現串聯
mysql> SELECT 'My' 'S' 'QL' as res ;
+-------+
| res |
+-------+
| MySQL |
+-------+
CONCAT_WS(separator,str1,str2,...)
代表用分隔符連接,是CONCAT()的一種特殊形式。
1.第一個參數是分隔符, 分隔符被添加到要連接的字符串之間;
2.分隔符可以是字符串,其余參數也可以;
3.如果分隔符為NULL,則結果為NULL;
4.不會跳過空字符串, 但是,它會跳過分隔符參數之后的所有NULL值。
mysql> SELECT CONCAT_WS(',','First name','Last Name'),CONCAT_WS(NULL,'First name','Last Name'),CONCAT_WS(',','First name','','Last Name'), CONCAT_WS(',','First name',NULL,'Last Name');
+-----------------------------------------+------------------------------------------+--------------------------------------------+----------------------------------------------+
| CONCAT_WS(',','First name','Last Name') | CONCAT_WS(NULL,'First name','Last Name') | CONCAT_WS(',','First name','','Last Name') | CONCAT_WS(',','First name',NULL,'Last Name') |
+-----------------------------------------+------------------------------------------+--------------------------------------------+----------------------------------------------+
| First name,Last Name | NULL | First name,,Last Name | First name,Last Name |
+-----------------------------------------+------------------------------------------+--------------------------------------------+----------------------------------------------+
EXPORT_SET(bits,on,off[,separator[,number_of_bits]])
這函數鄙人第一次用。Talk is cheap,show you the code ??
mysql> SELECT EXPORT_SET(111,'1對應我','0對應我','|',10);
+---------------------------------------------------------------------------------+
| EXPORT_SET(111,'1對應我','0對應我','|',10) |
+---------------------------------------------------------------------------------+
| 1對應我|1對應我|1對應我|1對應我|0對應我|1對應我|1對應我|0對應我|0對應我|0對應我 |
+---------------------------------------------------------------------------------+
轉換步驟:
1.將 bits 轉換為二進制,這里是111,二進制為 1101111 ;
2.對 1101111 從低到高位排序得到 1111011 ;
3.number_of_bits=10,表示總位數為10,不足時右側補0,得到 1111011000 ;
4.然后將 1 替換成 '1對應我' ,0 替換成 '0對應我' ,得到最終結果。
ELT(N,str1,str2,str3,...)
返回字符串列表的第N個元素:如果N = 1,則返回str1;如果N = 2,則返回str2,依此類推。 如果N小于1或大于參數個數,則返回NULL。 ELT()是FIELD()函數的補充。
mysql> SELECT ELT(1, 'Aa', 'Bb', 'Cc', 'Dd'),ELT(3, 'Aa', 'Bb', 'Cc', 'Dd'),ELT(7, 'Aa', 'Bb', 'Cc', 'Dd') ;
+--------------------------------+--------------------------------+--------------------------------+
| ELT(1, 'Aa', 'Bb', 'Cc', 'Dd') | ELT(3, 'Aa', 'Bb', 'Cc', 'Dd') | ELT(7, 'Aa', 'Bb', 'Cc', 'Dd') |
+--------------------------------+--------------------------------+--------------------------------+
| Aa | Cc | NULL |
+--------------------------------+--------------------------------+--------------------------------+
FIELD(str,str1,str2,str3,...)
返回str在字符串 str1,str2,str3,... 中所在的位置,如找不到,則返回0。若str為NULL,則返回0。FIELD()亦是ELT()的補充。
mysql> SELECT FIELD('Bb', 'Aa', 'Bb', 'Cc'),FIELD('Dd', 'Aa', 'Bb', 'Cc'),FIELD(NULL, 'Aa', 'Bb', 'Cc');
+-------------------------------+-------------------------------+-------------------------------+
| FIELD('Bb', 'Aa', 'Bb', 'Cc') | FIELD('Dd', 'Aa', 'Bb', 'Cc') | FIELD(NULL, 'Aa', 'Bb', 'Cc') |
+-------------------------------+-------------------------------+-------------------------------+
| 2 | 0 | 0 |
+-------------------------------+-------------------------------+-------------------------------+
FIND_IN_SET(str,strlist)
返回str在字符串strlist中的位置。如果str是字符串,strlist是一個集合,則FIND_IN_SET()將會被優化成位運算。
mysql> SELECT FIND_IN_SET('b','a,b,c,d'),FIND_IN_SET('e','a,b,c,d'),FIND_IN_SET(NULL,'a,b,c,d'),FIND_IN_SET('b','a,NULL,b,c,d'),FIND_IN_SET('b,','a,b,c,d'),FIND_IN_SET('中','我,是,中,國,人');
+----------------------------+----------------------------+-----------------------------+---------------------------------+-----------------------------+------------------------------------+
| FIND_IN_SET('b','a,b,c,d') | FIND_IN_SET('e','a,b,c,d') | FIND_IN_SET(NULL,'a,b,c,d') | FIND_IN_SET('b','a,NULL,b,c,d') | FIND_IN_SET('b,','a,b,c,d') | FIND_IN_SET('中','我,是,中,國,人') |
+----------------------------+----------------------------+-----------------------------+---------------------------------+-----------------------------+------------------------------------+
| 2 | 0 | NULL | 3 | 0 | 3 |
+----------------------------+----------------------------+-----------------------------+---------------------------------+-----------------------------+------------------------------------+
FORMAT(X,D[,locale])
將數字X格式化為類似于 '#,###,###.##' 的格式,四舍五入到D小數位,然后將結果作為字符串返回。 如果D為0,則結果沒有小數點或小數部分。可選的第三個參數允許指定語言環境,以用于結果數字的小數點,千位分隔符以及分隔符之間的分組。 允許的語言環境值與lc_time_names系統變量的合法值相同,如果未指定語言環境,則默認值為“ en_US”。
mysql> SELECT FORMAT(12332.123456, 4), FORMAT(12332.12,4), FORMAT(12332.123456, 0), FORMAT(12332.1, 2,'en_US'), FORMAT(12332.123456, 2,'de_DE');
+-------------------------+--------------------+-------------------------+----------------------------+---------------------------------+
| FORMAT(12332.123456, 4) | FORMAT(12332.12,4) | FORMAT(12332.123456, 0) | FORMAT(12332.1, 2,'en_US') | FORMAT(12332.123456, 2,'de_DE') |
+-------------------------+--------------------+-------------------------+----------------------------+---------------------------------+
| 12,332.1235 | 12,332.1200 | 12,332 | 12,332.10 | 12.332,12 |
+-------------------------+--------------------+-------------------------+----------------------------+---------------------------------+
FROM_BASE64(str)
解碼由函數TO_BASE64()編碼得到的字符串。如果str為NULL或不是有效的base-64編碼則返回NULL。
mysql> SELECT TO_BASE64('我'),FROM_BASE64(TO_BASE64('我')),FROM_BASE64(NULL);
+-----------------+------------------------------+-------------------+
| TO_BASE64('我') | FROM_BASE64(TO_BASE64('我')) | FROM_BASE64(NULL) |
+-----------------+------------------------------+-------------------+
| 5oiR | 我 | NULL |
+-----------------+------------------------------+-------------------+
TO_BASE64(str)
將字符串以base-64編碼后返回。如果參數不是字符串,則在進行轉換之前將其轉換為字符串。解碼時用FROM_BASE64(str)。
1.The encoding for alphabet value 62 is '+'(未理解)
2.The encoding for alphabet value 63 is '/'(未理解)
3.輸入數據的每3個字節使用4個字符進行編碼。 如果最后一組不完整,則用'='字符填充,長度為4。
4.在編碼輸出的每76個字符之后添加一個換行符,以將長輸出分成多行。
5.解碼識別并忽略換行符,回車符,制表符和空格。
mysql> SELECT TO_BASE64('ab'),TO_BASE64('abc'),TO_BASE64(NULL),FROM_BASE64('YW Jj') ;
+-----------------+------------------+-----------------+----------------------+
| TO_BASE64('ab') | TO_BASE64('abc') | TO_BASE64(NULL) | FROM_BASE64('YW Jj') |
+-----------------+------------------+-----------------+----------------------+
| YWI= | YWJj | NULL | abc |
+-----------------+------------------+-----------------+----------------------+
輸出超過76個字符則換行
mysql> SELECT TO_BASE64('abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz');
+----------------------------------------------------------------------------------------------------------------------------------------------+
| TO_BASE64('abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz') |
+----------------------------------------------------------------------------------------------------------------------------------------------+
| YWJjZGVmZ2hpamtsbW5vcHFyc3R1dnd4eXphYmNkZWZnaGlqa2xtbm9wcXJzdHV2d3h5emFiY2Rl
ZmdoaWprbG1ub3BxcnN0dXZ3eHl6YWJjZGVmZ2hpamtsbW5vcHFyc3R1dnd4eXo= |
+----------------------------------------------------------------------------------------------------------------------------------------------+
HEX(str)
, HEX(N)
返回沒有字符或數字的16進制編碼。
mysql> SELECT HEX('我'),HEX('ab'),HEX(255),UNHEX('E68891');
+-----------+-----------+----------+-----------------+
| HEX('我') | HEX('ab') | HEX(255) | UNHEX('E68891') |
+-----------+-----------+----------+-----------------+
| E68891 | 6162 | FF | 我 |
+-----------+-----------+----------+-----------------+
UNHEX(str)
對于字符串參數str,UNHEX(str)將參數中的每對字符解釋為十六進制數字,并將其轉換為該數字表示的字節。 返回值是一個二進制字符串。
1.參數字符串中的字符必須為合法的十六進制數字:“ 0” ..“ 9”,“ A” ..“ F”,“ a” ..“ f”。 如果參數包含任何非十六進制數字,則結果為NULL;
2.如果UNHEX()的參數是BINARY列,則可能會返回NULL;
3.對于數字參數N,HEX(N)的解碼不是UNHEX(),改用CONV(HEX(N),16,10)。
mysql> SELECT UNHEX('62'),UNHEX('E68891'),HEX(255),UNHEX('FF'),CONV('FF',16,10);
+-------------+-----------------+----------+-------------+------------------+
| UNHEX('62') | UNHEX('E68891') | HEX(255) | UNHEX('FF') | CONV('FF',16,10) |
+-------------+-----------------+----------+-------------+------------------+
| b | 我 | FF | ? | 255 |
+-------------+-----------------+----------+-------------+------------------+
INSERT(str,pos,len,newstr)
返回字符串str,子字符串從pos位置開始,并且len個字符由字符串newstr取代。
1.如果pos不在字符串的長度內,則返回原始字符串。
2.如果len不在字符串其余部分的長度內,則從位置pos替換字符串的其余部分。
3.如果任何參數為NULL,則返回NULL。
mysql> SELECT INSERT('who are you?', 1, 3, 'where'),INSERT('who are you?', -1, 3, 'where'),INSERT('who are you?', 1, 100, 'where'),INSERT('我是中國人', 3, 3, '渣渣輝');
+---------------------------------------+----------------------------------------+-----------------------------------------+--------------------------------------+
| INSERT('who are you?', 1, 3, 'where') | INSERT('who are you?', -1, 3, 'where') | INSERT('who are you?', 1, 100, 'where') | INSERT('我是中國人', 3, 3, '渣渣輝') |
+---------------------------------------+----------------------------------------+-----------------------------------------+--------------------------------------+
| where are you? | who are you? | where | 我是渣渣輝 |
+---------------------------------------+----------------------------------------+-----------------------------------------+--------------------------------------+
INSTR(str,substr)
返回substr在str中第一次出現的位置,如果str或substr為NULL,則返回NULL。和兩個參數的LOCATE(substr,str)相同,只是參數順序相反。見下
mysql> SELECT INSTR('goodboy','boy'),INSTR('goodboy','o'),INSTR('goodboy','bye'),INSTR('goodboy',NULL);
+------------------------+----------------------+------------------------+-----------------------+
| INSTR('goodboy','boy') | INSTR('goodboy','o') | INSTR('goodboy','bye') | INSTR('goodboy',NULL) |
+------------------------+----------------------+------------------------+-----------------------+
| 5 | 2 | 0 | NULL |
+------------------------+----------------------+------------------------+-----------------------+
POSITION(substr IN str)
為LOCATE(substr,str)的同義詞,見下
LOCATE(substr,str)
, LOCATE(substr,str,pos)
第一個表達式返回substr在str中第一次出現的位置,與INSTR()一樣。第二個表達式返回從str的pos位置往后第一次出現substr的位置。
mysql> SELECT LOCATE('boy','goodboy'),LOCATE('o','goodboy',5),LOCATE(NULL,'goodboy');
+-------------------------+-------------------------+------------------------+
| LOCATE('boy','goodboy') | LOCATE('o','goodboy',5) | LOCATE(NULL,'goodboy') |
+-------------------------+-------------------------+------------------------+
| 5 | 6 | NULL |
+-------------------------+-------------------------+------------------------+
LCASE(str)
為函數LOWER(str)的同義詞,見下
LOWER(str)
根據當前字符集,返回字符串str的小寫形式,默認字符集latin1。對應將str轉為大寫的函數UPPER(str)
。
1.當應用于二進制字符串(BINARY,VARBINARY,BLOB)時,LOWER()和UPPER()無效。需要先將str中的數據字符集轉換為非二進制。
2.早期版本中,視圖里的LOWER()會被改寫成LCASE(),5.7中,LOWER()將不會被改寫。
mysql> SELECT LOWER('Good Boy'),LOWER(BINARY 'Good Boy'),LOWER(CONVERT(BINARY 'Good Boy' using utf8));
+-------------------+--------------------------+--------------------------------------------+
| LOWER('Good Boy') | LOWER(BINARY 'Good Boy') | LOWER(CONVERT(BINARY 'Good Boy' using utf8)) |
+-------------------+--------------------------+--------------------------------------------+
| good boy | Good Boy | good boy |
+-------------------+--------------------------+--------------------------------------------+
UCASE(str)
為函數UPPER(str)的同義詞,見下
UPPER(str)
根據當前字符集,返回字符串str的大寫形式,默認字符集latin1。對應將str轉為小寫的函數LOWER(str)
。
mysql> SELECT UPPER('Good Boy'),UPPER(BINARY 'Good Boy'),UPPER(CONVERT(BINARY 'Good Boy' using utf8));
+-------------------+--------------------------+----------------------------------------------+
| UPPER('Good Boy') | UPPER(BINARY 'Good Boy') | UPPER(CONVERT(BINARY 'Good Boy' using utf8)) |
+-------------------+--------------------------+----------------------------------------------+
| GOOD BOY | Good Boy | GOOD BOY |
+-------------------+--------------------------+----------------------------------------------+
LEFT(str,len)
返回字符串str中最左邊的len個字符;如果任何參數為NULL,則返回NULL。相對應的函數RIGHT(str,len)。見下
mysql> SELECT LEFT('Good Boy',4);
+------------------+
| LEFT('Good Boy',4) |
+------------------+
| Good |
+------------------+
RIGHT(str,len)
返回字符串str中最右邊的len個字符;
mysql> SELECT RIGHT('Good Boy',5);
+-------------------+
| RIGHT('Good Boy',5) |
+-------------------+
| d Boy |
+-------------------+
OCTET_LENGTH(str)
為LENGTH(str)
的同義詞,見下
LENGTH(str)
以字節為單位返回字符串str的長度。 多字節字符計為多個字節。 這意味著對于包含5個2字節字符的字符串,LENGTH()返回10,而CHAR_LENGTH()返回5。
mysql> SELECT LENGTH('text'),CHARSET('左輪'),LENGTH('左輪');
+----------------+-------------------+------------------+
| LENGTH('text') | CHARSET('左輪') | LENGTH('左輪') |
+----------------+-------------------+------------------+
| 4 | utf8 | 6 |
+----------------+-------------------+------------------+
LOAD_FILE(file_name)
讀取文件內容并以字符串形式返回。
1.用戶需要有file權限;
2.文件不要超過 max_allowed_packet大小;
3.參數secure_file_priv需要為非NULL,且指定到一個目錄路徑;
4.如果文件不可讀或者不存在,則返回NULL。
mysql> SELECT LOAD_FILE('D:\\A.TXT'),LOAD_FILE('D:\\B.TXT');
+------------------------+------------------------+
| LOAD_FILE('D:\\A.TXT') | LOAD_FILE('D:\\B.TXT') |
+------------------------+------------------------+
| HAHAHAA | NULL |
+------------------------+------------------------+
可以用文件里的數據更新表中的字段。
mysql> UPDATE T SET T_NAME=LOAD_FILE('D:\\A.TXT') WHERE T_ID = '01';
LPAD(str,len,padstr)
返回字符串str
1.如果len > str 的長度,則用padstr左填充str至len長度;
2.如果len < str 的長度,則返回len長度的字符;
3.相對應函數RPAD(str)
。
mysql> SELECT LPAD('GoodBoy',12,'$'),LPAD('GoodBoy',4,'$');
+------------------------+-----------------------+
| LPAD('GoodBoy',12,'$') | LPAD('GoodBoy',4,'$') |
+------------------------+-----------------------+
| $$$$$GoodBoy | Good |
+------------------------+-----------------------+
RPAD(str,len,padstr)
返回字符串str,用法同LPAD(str,len,padstr)
mysql> SELECT RPAD('GoodBoy',12,'$'),RPAD('GoodBoy',4,'$');
+------------------------+-----------------------+
| RPAD('GoodBoy',12,'$') | RPAD('GoodBoy',4,'$') |
+------------------------+-----------------------+
| GoodBoy$$$$$ | Good |
+------------------------+-----------------------+
LTRIM(str)
返回已刪除str前面空格后的字符串
RTRIM(str)
返回已刪除str后面空格后的字符串
TRIM(str)
返回已刪除str前面及后面空格后的字符串
mysql> SELECT LTRIM(' GoodBoy ') LTR,length(LTRIM(' GoodBoy ')) Len_LTR,RTRIM(' GoodBoy ') RTR,length(RTRIM(' GoodBoy ')) Len_RTR,TRIM(' GoodBoy ') TR,length(TRIM(' GoodBoy ')) Len_TR ;
+-----------+----------+-----------+----------+----------+---------+
| LTR | Len_LTR | RTR | Len_RTR | TR | Len_TR |
+-----------+----------+-----------+----------+----------+---------+
| GoodBoy | 9 | GoodBoy | 9 | GoodBoy | 7 |
+-----------+----------+-----------+----------+----------+---------+
MAKE_SET(bits,str1,str2,...)
Talk is cheap,show you the code ??
mysql> SELECT MAKE_SET(18,'a','b','c','d','e','f');
+---------------------------+
| MAKE_SET(18,'a','b','c','d','e','f') |
+---------------------------+
| b,e |
+---------------------------+
轉換步驟:
1.首先 'a','b','c','d','e','f' 分別對應 2^0,2^1,2^2 ... ,即1,2,4,8,16...,是從低位到高位的順序。
2.18 = 2 + 16,對應 'b' 和 'e',返回即可。
3.或者可以這么理解,將18轉為2進制,得到 10010 ,從低位到高位則為 01001(顛倒下順序即可),對應到'a','b','c','d','e','f'上。
'a' 'b' 'c' 'd' 'e' 'f'
0 1 0 0 1 0
即'b' 'e'。
mysql> SELECT MAKE_SET(18|6,'a','b','c','d','e','f');
+-----------------------------+
| MAKE_SET(18|6,'a','b','c','d','e','f') |
+-----------------------------+
| b,c,e |
+-----------------------------+
轉換步驟:
此處只是將 18|6 進行了位或 運算
1 0 0 1 0
0 0 1 1 0
---------
1 0 1 1 0
結果 1 0 1 1 0 ,從低位到高位則為 01101(顛倒下順序即可),對應到'a','b','c','d','e','f'上。
'a' 'b' 'c' 'd' 'e' 'f'
0 1 1 0 1 0
即 b c e
MATCH()
完整表達式 MATCH (col1,col2,...) AGAINST (expr [search_modifier])
,全文索引字符搜索,詳細介紹見官檔:https://dev.mysql.com/doc/refman/5.7/en/fulltext-search.html
mysql> CREATE TABLE articles (
-> id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
-> title VARCHAR(200),
-> body TEXT,
-> FULLTEXT (title,body)
-> ) ENGINE=InnoDB;
mysql> INSERT INTO articles (title,body) VALUES
-> ('MySQL Tutorial','This database tutorial ...'),
-> ("How To Use MySQL",'After you went through a ...'),
-> ('Optimizing Your Database','In this database tutorial ...'),
-> ('MySQL vs. YourSQL','When comparing databases ...'),
-> ('MySQL Security','When configured properly, MySQL ...'),
-> ('Database, Database, Database','database database database'),
-> ('1001 MySQL Tricks','1. Never run mysqld as root. 2. ...'),
-> ('MySQL Full-Text Indexes', 'MySQL fulltext indexes use a ..');
mysql> SELECT * FROM articles
-> WHERE MATCH (title,body)
-> AGAINST ('database' IN NATURAL LANGUAGE MODE);
+----+------------------------------+-------------------------------+
| id | title | body |
+----+------------------------------+-------------------------------+
| 6 | Database, Database, Database | database database database |
| 3 | Optimizing Your Database | In this database tutorial ... |
| 1 | MySQL Tutorial | This database tutorial ... |
+----+------------------------------+-------------------------------+
MID(str,pos,len)
為SUBSTRING(str,pos,len)
的同義詞。見下
SUBSTR(str,pos,len)
為SUBSTRING(str,pos,len)
的同義詞。見下
SUBSTRING(str,pos)
, SUBSTRING(str FROM pos)
SUBSTRING(str,pos,len)
, SUBSTRING(str FROM pos FOR len)
1.SUBSTRING()有以上幾種形式;
2.FROM pos 的寫法是標準SQL語法;
3.pos也可以是負值,即從尾往前定位pos。
4.pos為0或len小于1,則返回空字符串。
mysql> SELECT SUBSTRING('Quadratically',5),SUBSTRING('Quadratically' FROM 5),SUBSTRING('Quadratically',5,3),SUBSTRING('Quadratically',-5),SUBSTRING('Quadratically',-5,4);
+------------------------------+-----------------------------------+--------------------------------+-------------------------------+---------------------------------+
| SUBSTRING('Quadratically',5) | SUBSTRING('Quadratically' FROM 5) | SUBSTRING('Quadratically',5,3) | SUBSTRING('Quadratically',-5) | SUBSTRING('Quadratically',-5,4) |
+------------------------------+-----------------------------------+--------------------------------+-------------------------------+---------------------------------+
| ratically | ratically | rat | cally | call |
+------------------------------+-----------------------------------+--------------------------------+-------------------------------+---------------------------------+
OCT(N)
返回N的八進制值的字符串表示形式,其中N是一個longlong(BIGINT)數字。 這等效于CONV(N,10,8)。 如果N為NULL,則返回NULL。
mysql> SELECT OCT(8),CONV(8,10,8),OCT(null);
+--------+--------------+----------+
| OCT(8) | CONV(8,10,8) | OCT(null) |
+--------+--------------+----------+
| 10 | 10 | NULL |
+--------+--------------+----------+
QUOTE(str)
引用字符串以產生可在SQL語句中用作正確轉義的數據值的結果。
mysql> SELECT QUOTE('Don\'t!'),QUOTE(NULL),QUOTE('Don\t!');
+---------------+--------------+---------------+
| QUOTE('Don\'t!') | QUOTE(NULL) | QUOTE('Don\t!') |
+---------------+--------------+---------------+
| 'Don\'t!' | NULL | 'Don !' |
+---------------+--------------+---------------+
REPEAT(str,count)
返回一個由重復計數次數count的字符串str組成的字符串。 如果count小于1,則返回一個空字符串。 如果str或count為NULL,則返回NULL。
mysql> SELECT REPEAT('MySQL', 3),REPEAT('MySQL', -1),REPEAT('MySQL', NULL);
+--------------------+---------------------+-----------------------+
| REPEAT('MySQL', 3) | REPEAT('MySQL', -1) | REPEAT('MySQL', NULL) |
+--------------------+---------------------+-----------------------+
| MySQLMySQLMySQL | | NULL |
+--------------------+---------------------+-----------------------+
REPLACE(str,from_str,to_str)
返回字符串str,其中所有出現的字符串from_str都替換為字符串to_str。REPLACE()
執行區分大小寫的匹配。
mysql> SELECT REPLACE('www.mysql.com', 'w', 'Qq'),REPLACE('www.mysql.com', 'W', 'Qq'),REPLACE('www.mysql.com', 'w',NULL);
+-------------------------------------+-------------------------------------+------------------------------------+
| REPLACE('www.mysql.com', 'w', 'Qq') | REPLACE('www.mysql.com', 'W', 'Qq') | REPLACE('www.mysql.com', 'w',NULL) |
+-------------------------------------+-------------------------------------+------------------------------------+
| QqQqQq.mysql.com | www.mysql.com | NULL |
+-------------------------------------+-------------------------------------+------------------------------------+
REVERSE(str)
返回str反轉后的字符串。
mysql> SELECT REVERSE('GoodBoy');
+--------------------+
| REVERSE('GoodBoy') |
+--------------------+
| yoBdooG |
+--------------------+
SOUNDEX(str)
從str返回一個soundex字符串。
1.發音聽起來幾乎相同的兩個單詞應該具有相同的soundex字符串。
2.標準soundex字符串長四個字符,但SOUNDEX()函數返回任意長的字符串。
3.str中的所有非字母字符都將被忽略。
4.所有A-Z范圍以外的國際字母字符都被視為元音。
5.此函數轉換時是先丟棄元音,然后再去掉重復字符,屬于原始的Soundex算法。增強版本是先去掉重復字符,然后再丟棄元音。
6.函數作用:在做搜尋引擎時面對用戶傳入的英文字符串,可用本函數做類似模糊比對的效果。
mysql> SELECT SOUNDEX('ladygaga');
+---------------------+
| SOUNDEX('ladygaga') |
+---------------------+
| L320 |
+---------------------+
各字符對應數字的轉換規則:
'AEHIOUWY' : 0
'BFPV' : 1
'CGJKQSXZ' : 2
'DT' : 3
'L' : 4
'MN' : 5
'R' : 6
轉換步驟:
1.先將對應0的元音字符去掉,得到 'ldgg';
2.去掉重復字符,得到 'ldg';
3.首字符不變,其他字符轉換為對應數字,得到 'l32';
4.長度不夠4位,后面補0,得到 'l320';
5.首字符大寫,得到最終結果 L320 。
發音相同的單詞具有相同的soundex字符串。
mysql> select soundex('Hunt'),soundex('Hant');
+-----------------+-----------------+
| soundex('Hunt') | soundex('Hant') |
+-----------------+-----------------+
| H530 | H530 |
+-----------------+-----------------+
expr1 SOUNDS LIKE expr2
比較expr1的soundex字符串是否等于expr2的soundex字符串,返回布爾值。相同返回1,不同返回0。和表達式 SOUNDEX(str1) = SOUNDEX(str2) 效果一致。
mysql> SELECT 'Hunt' SOUNDS LIKE 'Hant',SOUNDEX('HUNT') = SOUNDEX('HANT'),'GOOD' SOUNDS LIKE 'BOY' ;
+---------------------------+-----------------------------------+--------------------------+
| 'Hunt' SOUNDS LIKE 'Hant' | SOUNDEX('HUNT') = SOUNDEX('HANT') | 'GOOD' SOUNDS LIKE 'BOY' |
+---------------------------+-----------------------------------+--------------------------+
| 1 | 1 | 0 |
+---------------------------+-----------------------------------+--------------------------+
SPACE(N)
返回由N個空格字符組成的字符串。
mysql> SELECT CONCAT('A',SPACE(6),'B');
+--------------------------+
| CONCAT('A',SPACE(6),'B') |
+--------------------------+
| A B |
+--------------------------+
SUBSTRING_INDEX(str,delim,count)
在出現定界符delim之前,從字符串str返回子字符串。
1.如果count為正,則返回最后定界符左側的所有內容(從左側開始計數)。
2.如果count為負,則返回最后定界符右邊的所有內容(從右邊開始計數)。
3.搜索delim時,SUBSTRING_INDEX()執行區分大小寫。
mysql> SELECT SUBSTRING_INDEX('www.mysql.com', '.', 2),SUBSTRING_INDEX('www.mysql.com', '.', 6),SUBSTRING_INDEX('www.mysql.com', '.', -2);
+------------------------------------------+------------------------------------------+-------------------------------------------+
| SUBSTRING_INDEX('www.mysql.com', '.', 2) | SUBSTRING_INDEX('www.mysql.com', '.', 6) | SUBSTRING_INDEX('www.mysql.com', '.', -2) |
+------------------------------------------+------------------------------------------+-------------------------------------------+
| www.mysql | www.mysql.com | mysql.com |
+------------------------------------------+------------------------------------------+-------------------------------------------+
WEIGHT_STRING()
完整表達式WEIGHT_STRING(str [AS {CHAR|BINARY}(N)] [LEVEL levels] [flags])
WEIGHT_STRING()是供內部使用的調試函數。 不做描述。
二、字符串比較函數
LIKE()
完整表達式expr LIKE pat [ESCAPE 'escape_char']
1.使用SQL模式進行匹配。 返回布爾值,匹配到則為1(TRUE),否則為0(FALSE);如果expr或pat為NULL,則結果為NULL;
mysql> select 'good' like 'good','good' like 'god','good' like NULL;
+--------------------+-------------------+------------------+
| 'good' like 'good' | 'good' like 'god' | 'good' like NULL |
+--------------------+-------------------+------------------+
| 1 | 0 | NULL |
+--------------------+-------------------+------------------+
2.默認不區分大小寫匹配,如果字符串比較中的任何表達式區分大小寫,則以區分大小寫的方式執行比較;
SELECT 'abc' LIKE 'ABC','abc' LIKE BINARY 'ABC','abc' LIKE _latin1 'ABC' COLLATE latin1_general_cs;
+------------------+-------------------------+----------------------------------------------------+
| 'abc' LIKE 'ABC' | 'abc' LIKE BINARY 'ABC' | 'abc' LIKE _latin1 'ABC' COLLATE latin1_general_cs |
+------------------+-------------------------+----------------------------------------------------+
| 1 | 0 | 0 |
+------------------+-------------------------+----------------------------------------------------+
3.LIKE在每個字符的基礎上執行匹配,因此它可以產生與=比較運算符不同的結果;
SELECT '?' LIKE 'ae' COLLATE utf8mb4_german2_ci,'?' = 'ae' COLLATE utf8mb4_german2_ci;
+------------------------------------------+---------------------------------------+
| '?' LIKE 'ae' COLLATE utf8mb4_german2_ci | '?' = 'ae' COLLATE utf8mb4_german2_ci |
+------------------------------------------+---------------------------------------+
| 0 | 1 |
+------------------------------------------+---------------------------------------+
4.對于非二進制字符串,末尾空格需要參與到比較中。
MySQL8版本中則取決于排序集collations的PAD屬性,有以下兩個值:
> PAD SPACE 比較字符串時不考慮尾隨空格
> NO PAD 比較字符串時考慮尾隨空格
mysql> SELECT 'a' = 'a ', 'a' LIKE 'a ';
+------------+---------------+
| 'a' = 'a ' | 'a' LIKE 'a ' |
+------------+---------------+
| 1 | 0 |
+------------+---------------+
5.通配符
% 匹配任意數量的字符,甚至零個字符
_ 精確匹配一個字符
mysql> SELECT 'David!' LIKE '%D%v%','David!' LIKE 'David_','David!!' LIKE 'David_';
+-----------------------+------------------------+-------------------------+
| 'David!' LIKE '%D%v%' | 'David!' LIKE 'David_' | 'David!!' LIKE 'David_' |
+-----------------------+------------------------+-------------------------+
| 1 | 1 | 0 |
+-----------------------+------------------------+-------------------------+
6.要測試通配符的文字實例,請在其前面加上轉義符。 如果未指定ESCAPE字符,則假定\。
% 匹配一個%字符
_ 匹配一個_字符
mysql> SELECT 'David%' LIKE 'David\%','David_' LIKE 'David\_';
+-------------------------+-------------------------+
| 'David%' LIKE 'David\%' | 'David_' LIKE 'David\_' |
+-------------------------+-------------------------+
| 1 | 1 |
+-------------------------+-------------------------+
7.要指定其他轉義字符,請使用ESCAPE子句
mysql> SELECT 'David_' LIKE 'David|_' ESCAPE '|';
+------------------------------------+
| 'David_' LIKE 'David|_' ESCAPE '|' |
+------------------------------------+
| 1 |
+------------------------------------+
8.作為對標準SQL的擴展,MySQL允許對數字表達式使用LIKE。
mysql> SELECT 10 LIKE '1%';
+--------------+
| 10 LIKE '1%' |
+--------------+
| 1 |
+--------------+
NOT LIKE()
完整表達式expr NOT LIKE pat [ESCAPE 'escape_char']
與NOT(expr LIKE pat [ESCAPE'escape_char'])
相同,可參考LIKE用法。
注意字段包含NULL的情況,日常工作中也會經常遇到。
like 的數據量 + not like 的數據量 <> 總量,就是因為字段存在NULL導致。
有表數據如下:
mysql> select * From foo ;
+------+
| bar |
+------+
| NULL |
| NULL |
+------+
mysql> select count(*) from foo where bar like '%ba%';
+----------+
| count(*) |
+----------+
| 0 |
+----------+
mysql> select count(*) from foo where bar not like '%ba%';
+----------+
| count(*) |
+----------+
| 0 |
+----------+
mysql> select count(*) from foo where bar not like '%ba%' or bar is null;
+----------+
| count(*) |
+----------+
| 2 |
+----------+
STRCMP(expr1,expr2)
如果字符串相同,則STRCMP()返回0;根據當前排序順序,如果第一個參數小于第二個參數,則返回-1,否則返回1。
mysql> SELECT STRCMP('text', 'text'),STRCMP('text1', 'text2'),STRCMP('text2', 'text1');
+------------------------+--------------------------+--------------------------+
| STRCMP('text', 'text') | STRCMP('text1', 'text2') | STRCMP('text2', 'text1') |
+------------------------+--------------------------+--------------------------+
| 0 | -1 | 1 |
+------------------------+--------------------------+--------------------------+
指定排序規則的字符串進行比較
mysql> SELECT STRCMP(_latin1 'A' COLLATE latin1_general_ci,_latin1 'a' COLLATE latin1_general_ci),STRCMP(_latin1 'A' COLLATE latin1_general_cs,_latin1 'a' COLLATE latin1_general_cs);
+-------------------------------------------------------------------------------------+-------------------------------------------------------------------------------------+
| STRCMP(_latin1 'A' COLLATE latin1_general_ci,_latin1 'a' COLLATE latin1_general_ci) | STRCMP(_latin1 'A' COLLATE latin1_general_cs,_latin1 'a' COLLATE latin1_general_cs) |
+-------------------------------------------------------------------------------------+-------------------------------------------------------------------------------------+
| 0 | -1 |
+-------------------------------------------------------------------------------------+-------------------------------------------------------------------------------------+
三、正則表達式
見鏈接 http://www.lxweimin.com/p/cc18fd228e88
四、字符集和排序規則函數
1.簡單字符串函數返回的值的字符集與輸入字符串的字符集相同;如 INSTR(), LCASE(), LOWER(), LTRIM(), MID(), REPEAT(), REPLACE(), REVERSE(), RIGHT(), RPAD(), RTRIM(), SOUNDEX(), SUBSTRING(), TRIM(), UCASE(), and UPPER()等。
2.與所有其他函數不同,REPLACE()函數始終忽略字符串輸入的排序規則,并執行區分大小寫的比較。
3.對于多個輸入字符串(多個字符集),一個輸出字符串的情形,滿足以下規則:
> 如果明確COLLATE 為Y,則返回COLLATE 為Y;
> 如果明確COLLATE 為Y 和 Z,則拋出錯誤;
> 否則,如果所有COLLATE 為Y,則返回COLLATE 為Y;
> 否則,返回的結果集沒有COLLATE。
例如,使用CASE ... WHEN a THEN b WHEN b THEN c COLLATE X END,所得的排序規則為X。同樣適用于UNION,||,CONCAT(),ELT(),GREATEST(),IF() 和LEAST()。
4.對于轉換為字符數據的操作,這些操作產生的字符串的字符集和排序規則由character_set_connection和collat??ion_connection系統變量定義,這些系統變量確定默認的連接字符集和排序規則。 僅適用于CAST(),CONV(),FORMAT(),HEX()和SPACE()。
5.從MySQL 5.7.19開始,虛擬生成的列的表達式是以上規則的例外情況。 在這樣的表達式中,表默認的字符集用于CONV()或HEX()的結果,而與連接字符集(character_set_connection和collat??ion_connection)無關。
5.使用CHARSET()或collation()函數查找所屬字符集。
mysql> SELECT CHARSET('a'),CHARSET(BINARY 'a'),CHARSET(COMPRESS('abc')), COLLATION(COMPRESS('abc'));
+--------------+---------------------+--------------------------+----------------------------+
| CHARSET('a') | CHARSET(BINARY 'a') | CHARSET(COMPRESS('abc')) | COLLATION(COMPRESS('abc')) |
+--------------+---------------------+--------------------------+----------------------------+
| utf8mb4 | binary | binary | binary |
+--------------+---------------------+--------------------------+----------------------------+