中文汉字的正则字符编码范围
双字节字符编码范围:
1. GBK (GB2312/GB18030)
\x00-\xff GBK双字节编码范围
\x20-\x7f ASCII
\xa1-\xff 中文gb2312
\x80-\xff 中文 gbk
2. UTF-8 (Unicode)
\u4e00-\u9fa5 (中文)
\x3130-\x318F (韩文)
\xAC00-\xD7A3 (韩文)
\u0800-\u4e00 (日文)
判断字符串是否全是汉字,代码如下:
- <?php
- $str = '全部是汉字测试';
- if (preg_match_all("/^([x81-xfe][x40-xfe])+$/", $str, $match)) {
- echo '全部是汉字';
- } else {
- echo '不全是汉字';
- }
- ?>
码字很辛苦,转载请注明来自NAERENET的《中文汉字的正则字符编码范围》