使用 mb_detect_encoding() 函数来判断字符串是什么编码的
作者:会飞的
注意:要把php.ini中 extension=php_mbstring.dll 前的;号去掉,重启apache就可以了。
我创建三个文件:text1.txt text2.txt text3.txt
分别以ASCII UTF-8 UNICODE 的编码方式保存
代码如下:
<?php
define ('UTF32_BIG_ENDIAN_BOM' , chr(0x00) . chr(0x00) . chr(0xFE) . chr(0xFF));
define ('UTF32_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE) . chr(0x00) . chr(0x00));
define ('UTF16_BIG_ENDIAN_BOM' , chr(0xFE) . chr(0xFF));
define ('UTF16_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE));
define ('UTF8_BOM' , chr(0xEF) . chr(0xBB) . chr(0xBF));
function detect_utf_encoding($text) {
$first2 = substr($text, 0, 2);
$first3 = substr($text, 0, 3);
$first4 = substr($text, 0, 3);
if ($first3 == UTF8_BOM) return 'UTF-8';
elseif ($first4 == UTF32_BIG_ENDIAN_BOM) return 'UTF-32BE';
elseif ($first4 == UTF32_LITTLE_ENDIAN_BOM) return 'UTF-32LE';
elseif ($first2 == UTF16_BIG_ENDIAN_BOM) return 'UTF-16BE';
elseif ($first2 == UTF16_LITTLE_ENDIAN_BOM) return 'UTF-16LE';
}
function getFileEncoding($str){
$encoding=mb_detect_encoding($str);
if(empty($encoding)){
$encoding=detect_utf_encoding($str);
}
return $encoding;
}
$file = 'text1.txt';
echo getFileEncoding(file_get_contents($file)); // 输出ASCII
echo '<br />';
$file = 'text2.txt';
echo getFileEncoding(file_get_contents($file)); // 输出UTF-8
echo '<br />';
$file = 'text3.txt';
echo getFileEncoding(file_get_contents($file)); // 输出UTF-16LE
echo '<br />';
?>
猜你喜欢
您可能感兴趣的文章:
- PHP面试题,PHP程序员面试题及答案
- php数组分页
- php四舍五入函数round()
- PHP中$_SERVER的详细参数与说明
- PHP中mysql_connect与mysql_pconnect的区别
- php中print_r、var_dump和var_export
- PHP中strtr和str_replace比较
- PHP中超时提示Fatal error Maximum execution time of 30 seconds exceeded的解决方案
- PHP中的stristr(),strstr(),strpos()速度比较
- rawurlencode()和urlencode()函数区别
- Smarty优缺点
- Warning Cannot modify header information - headers already sent by
- 编写安全 PHP 应用程序的七个习惯
- 二维数组的array_unique函数
- 截取中文字符串时屏蔽乱码
- 静态页面已不利于搜索引擎优化和收录和排名
- 企业网站优化的弊端如何改变
- 去掉桌面图标阴影
- 如何针对MSN搜索进行网站优化