matlab XML中的错误:不允许空的XML命名空间

ohtdti5x  于 2023-05-01  发布在  Matlab
关注(0)|答案(1)|浏览(191)

我,我试图用matlab读取网页(这是字典网页)并使用extractHTMLText将html数据转换为文本以获取一些信息,但MATLAB给出了此错误:“XML中的错误:不允许空的XML命名空间。“由于我不是专业的程序员,我不熟悉名称空间及其错误。验证码:

url='https://www.vocabulary.com/dictionary/river';
    options = weboptions('Timeout', 10);
    code = webread(url,options);
    textData = extractHTMLText(code);

完整错误(test是我的脚本名):

Error using htmlTree (line 67)
    Error in XML: xmlns:fb: Empty XML namespace is not allowed
    
    Error in extractHTMLText (line 40)
    tree = htmlTree(code);
    
    Error in test (line 12)
    textData = extractHTMLText(code)

正如您所看到的,MATLAB仅在阅读网页的文本分析部分有问题(空命名空间错误)。
有人能帮我解决这个错误吗?谢谢。
注意:我检查了“code”变量,看看webread函数是否正常工作,然后在命令窗口中打印了这个变量。变量包含HTML代码,这意味着HTML代码中可能没有问题。

4si2a6ki

4si2a6ki1#

如果你用curl查看网页的内容,你会看到它是这样开始的:

<!DOCTYPE html>
<html lang="en-US" xmlns:vcom xmlns:fb>
<head>

这不是格式良好的XML --属性必须有一个名称和一个值--所以如果你试图用XML解析器解析它,你会得到一个错误。

相关问题