PHP 5.4.3 環(huán)境中測試了一個(gè)在 PHP 5.2 環(huán)境下運(yùn)行正常的程序,卻發(fā)現(xiàn)本應(yīng)正常提交一個(gè)中文字符串到數(shù)據(jù)庫的代碼卻提交了一個(gè)空字符串,經(jīng)過排查,該字符串在經(jīng) htmlspecialchars 函數(shù)轉(zhuǎn)義之前正常,而在轉(zhuǎn)義之后卻變成了空字符串。調(diào)用例子如下:
$str = '中文字符串';
$str_converted = htmlspecialchars($str);
echo $str_converted; 遂查看PHP手冊,獲知 htmlspecialchars 函數(shù)原型如下:
string htmlspecialchars ( string $string [, int $flags = ENT_COMPAT | ENT_HTML401 [, string $encoding = 'UTF-8' [, bool $double_encode = true ]]] ) 更新日志里面又有提到:
5.4.0 The default value for the encoding parameter was changed to UTF-8.
5.4.0 The constants ENT_SUBSTITUTE, ENT_DISALLOWED, ENT_HTML401, ENT_XML1, ENT_XHTML and ENT_HTML5 were added. PHP 從 5.4.0 版本開始第三個(gè)參數(shù)字符串編碼的默認(rèn)值改成了 UTF-8,而我這段代碼中的中文編碼正好是 GB2312 編碼的,跟現(xiàn)在的默認(rèn)參數(shù)不一致,于是更改調(diào)用參數(shù)如下:
$str = '中文字符串';
# 為了與舊環(huán)境兼容,這里第二個(gè)參數(shù)沒有組合使用 PHP 5.4 新加入的 ENT_HTML401 常量
$str_converted = htmlspecialchars($str, ENT_COMPAT ,'GB2312');
echo $str_converted; 這樣,“中文字符串”就可以正常顯示了。為了使 PHP 5.4 之前環(huán)境中編寫的代碼能夠向前兼容,建議調(diào)用 htmlspecialchars 函數(shù)的的時(shí)候都提供字符串編碼參數(shù)。
發(fā)表評論