我目前正在使用刮刀从https://scrapy.org/下python 3.x和ubuntu环境,不知何故,我想得到用户的意见在论坛,其中包含文本以及表情符号.
想知道我们如何将这些emoji保存到数组中,以便我可以在cvs或json中看到它?
谢谢
我目前正在使用刮刀从https://scrapy.org/下python 3.x和ubuntu环境,不知何故,我想得到用户的意见在论坛,其中包含文本以及表情符号.
想知道我们如何将这些emoji保存到数组中,以便我可以在cvs或json中看到它?
谢谢
2条答案
按热度按时间uqdfh47h1#
可能是HTML结构造成的。如果子元素中提供了emoji,则可以在
xpath
表达式中使用string()
函数。vs3odd8k2#
如果你至少能提供页面的HTML,那就太好了。
如果emoji和text包含在父元素中,比如说div和comment类,如下所示。
然后你可以使用下面的XPath或CSS选择器。
或