我想看看字典里的单词。这是我的字典:
Name Type Value
dict_lg list [2] (quanteda::dictionary2) List of length 2
NEGATIVE character [2867] 'à côrnes' 'à court de personnel'
POSITIVE list [1] (quanteda::dictionary2) List of length 1
VÉRITÉ* (1)) character [0]
字符串
我希望看到每个列表中包含的单词(消极,积极)。如果我这样做:
dict_lg <- dictionary(file = "frlsd/frlsd.cat", encoding = "UTF-8")
dict_lg$NEGATIVE
型
它会给我打印一个否定词的列表,但是如果我这样做了:
dict_lg$POSITIVE
型
本人获得:
Dictionary object with 1 key entry.
- [VÉRITÉ* (1))]:
型
如果我真这么做了
dict_lg[["POSITIVE"]][["VÉRITÉ* (1))"]]
型
我获得
character(0)
型
如何查看积极词汇列表?原始字典文件如下:https://www.poltext.org/fr/donnees-et-analyses/lexicoder
2条答案
按热度按时间u5rb5r591#
你可以像这样检查字典的列表结构:
字符串
...这表明结构被打乱了(在生成cat-file时或导入时):
型
...但是,您可以像这样从列表项'POSITIVE'中提取所有术语:
型
edit将字典转换为术语和情感的 Dataframe ,e. g.过滤掉负面情绪的术语:
uxh89sit2#
这里的问题在于您在https://www.poltext.org/fr/donnees-et-analyses/lexicoder处引用的文件。对于键“POSITIVE”下的值“VÉRITÉ”,它有一个额外的“)”。消除这一点,字典将正常运行。
x1c 0d1x的数据
我消除了额外的“)”,然后加载在编辑的文件中,它工作得很好。
字符串
创建于2023-07-24带有reprex v2.0.2