如何删除XML开始和结束之间的特殊字符?
我试过使用递归函数。所以在这种情况下它对我不起作用。
$sampleXML = '<?xml version="1.0" encoding="ISO-8859-1"?>
<mainTag type="user">
<note>
<PersonName>
<GivenName>Replace & this</GivenName>
<MiddleName>Replace < this</MiddleName>
</PersonName>
<Aliases>
<PersonName>
<GivenName>Replace > this</GivenName>
<FamilyName>Replace " this</FamilyName>
</PersonName>
</Aliases>
<DemographicDetail>
<GovernmentId countryCode="US">testIDs data </GovernmentId>
<DateOfBirth>2000-12-12</DateOfBirth>
</DemographicDetail>
</note>
<anothertag>
<data type="credit">
<Vendor score="yes"> vendor name </Vendor>
</data>
</anothertag>
</mainTag>';
$doc = new DOMDocument;
$doc->loadXML($xml);
$this->removeSpecialCharacterNodes($doc);
$xpath = new DOMXpath($doc);
$xml = $doc->saveXML($doc, LIBXML_NOEMPTYTAG);
替换以下内容
& by &
> by <
< by >
" by "
' by '
我已经使用了下面的递归代码,但它返回空值
public function removeSpecialCharacterNodes(DOMNode $node) {
// echo "aa";
// var_dump($node->childNodes);
$str = $node->childNodes;
var_dump($node->childNodes);
foreach ($node->childNodes as $child){
if($child->hasChildNodes()) {
$this->removeSpecialCharacterNodes($child);
} else{
$child->nodeValue = str_ireplace('&', '&', $child->nodeValue);
}
}
}
更新:我已经使用了字符串替换和htmlspecialchars仍然没有更新特殊字符。
$doc = new DOMDocument;
$doc->loadXML( $sampleXML);
foreach ($doc->documentElement->childNodes as $node) {
if($node->nodeType==1){
$oldAddressLine = $node->getElementsByTagName('AddressLine')->Item(0);
// $elle = str_ireplace(
// array( "'"),
// array( "'"),
// $oldAddressLine->nodeValue
// );
// $newelement = $doc->createElement('AddressLine', $elle);
$chk = $oldAddressLine->nodeValue;
$newelement = $doc->createElement('AddressLine', htmlspecialchars( $chk, ENT_XML1 ));
if ($oldAddressLine->parentNode != null) {
$oldAddressLine->parentNode->replaceChild($newelement, $oldAddressLine);
}
}
}
$xpath = new DOMXpath($doc);
$finalVal = $doc->saveXML($doc, LIBXML_NOEMPTYTAG);
echo "<pre>".htmlentities($finalVal)."</pre>"; exit;
2条答案
按热度按时间o4hqfura1#
所谓的特殊字符必须是xml中的实体。为此,只需将这些字符编码为htmlspecialchars()。
jei2mxaa2#
从PHP 5.4开始,您可以用途:
($字符串,ENT_XML1);您应该指定编码方式,例如:
'UTF-8'是一个字符串,它是一个字符串。请注意,上述内容仅转换为:
&到&〈到〈
to〉如果要对用双引号括起来的属性中使用的文本进行转义:
html特殊字符($string,ENT_XML1| 'UTF-8');除了&,之外,还会将“转换为“< and >。
如果您的属性用单引号括起来:
html特殊字符($string,ENT_XML1|“输入参数”除了&、〈、〉和“之外,还将”转换为“。
(Of当然,您甚至可以在属性之外使用它)。
请参阅htmlspecialchars的手动输入。