一些上下文,我有一些数据,我正在做一些文本分析,我刚刚对它们进行了标记化,我想合并dataframe列中的所有列表,以便进行进一步的处理。
我的df是:
df = pd.DataFrame({'title': ['issue regarding app', 'graphics should be better'], 'text': [["'app'", "'load'", "'slowly'"], ["'interface'", "'need'", "'to'", "'look'", "'nicer'"]]})`
我想将"文本"列中的所有列表合并为一个列表,并删除左/右引号。
大概是这样的
lst = ['app', 'load', 'slowly', 'interface', 'need', 'to', 'look', 'nicer']`
谢谢你的帮助!
3条答案
按热度按时间flvlnr441#
您可以使用
apply
和lambda
来完成此操作使用
apply
方法是将函数应用于'text'
列中的每个元素,而sum
函数是将所有列表连接在一起输出:
如果你想替换多个元素,比如
"'“
和"a"
,那么translate
比replace
更有效:eulz3vhy2#
使用简单的列表解析:
输出:
f8rj6qna3#
我们还可以迭代序列中的每个列表,并使用append()将它们连接起来,最后使用concat()将它们转换成一个列表,产生与上面相同的输出。