我,我试图用matlab读取网页(这是字典网页)并使用extractHTMLText将html数据转换为文本以获取一些信息,但MATLAB给出了此错误:“XML中的错误:不允许空的XML命名空间。“由于我不是专业的程序员,我不熟悉名称空间及其错误。验证码:
url='https://www.vocabulary.com/dictionary/river';
options = weboptions('Timeout', 10);
code = webread(url,options);
textData = extractHTMLText(code);
完整错误(test是我的脚本名):
Error using htmlTree (line 67)
Error in XML: xmlns:fb: Empty XML namespace is not allowed
Error in extractHTMLText (line 40)
tree = htmlTree(code);
Error in test (line 12)
textData = extractHTMLText(code)
正如您所看到的,MATLAB仅在阅读网页的文本分析部分有问题(空命名空间错误)。
有人能帮我解决这个错误吗?谢谢。
注意:我检查了“code”变量,看看webread函数是否正常工作,然后在命令窗口中打印了这个变量。变量包含HTML代码,这意味着HTML代码中可能没有问题。
1条答案
按热度按时间4si2a6ki1#
如果你用curl查看网页的内容,你会看到它是这样开始的:
这不是格式良好的XML --属性必须有一个名称和一个值--所以如果你试图用XML解析器解析它,你会得到一个错误。