概述
在我正在解析的一些
XML文件中(通常是RSS),我运行的文本包含像今天最新的字符,在我从节点中提取文本后,它变成了今天的最新版本.这告诉我,我正在错误地处理解码过程.
我可以简单地用patch my script修复这个错误,但是如果还有许多其他字符变得乱码呢?在将XML文件转换为UTF-8脚本时,如何在不破坏编码的情况下消化XML文件的正确方法是什么?
以下是我尝试过的一些看似不太合适的事情:
$xml = file_get_contents($file);
// One: still contains ’
//$xml = @iconv('UTF-8', 'UTF-8//IGNORE', $xml);
// Two: LibXMLError Entity 'rsquo' not defined
//$xml = htmlentities($xml, null, 'UTF-8');
//$xml = htmlspecialchars_decode($xml, ENT_QUOTES);
// Three: still contains ’
//$xml = mb_convert_encoding($xml, "UTF-8", "UTF-8");
$xml = simplexml_load_string($xml, null, LIBXML_NOCDATA | LIBXML_NOENT);
最后
以上就是义气白云为你收集整理的php xml特殊字符处理,php – 如何正确解码XML文件中的特殊字符?的全部内容,希望文章能够帮你解决php xml特殊字符处理,php – 如何正确解码XML文件中的特殊字符?所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复