我正在尝试使用docvars(),因为我想在R中使用Seeded LDA包。但是我遇到了一个问题,我无法搜索修复此错误的方法。
首先,我做了这样的语料库。
combined_df %>%
+ corpus(text_field = "text2") -> c_corp
结果是这样的。
c_corp %>% glimpse()
'corpus' Named chr [1:965] ...
- attr(*, "names")= chr [1:965] "text1" "text2" "text3" "text4" ...
- attr(*, "docvars")='data.frame': 965 obs. of 6 variables:
..$ docname_: chr [1:965] "text1" "text2" "text3" "text4" ...
..$ docid_ : Factor w/ 965 levels "text1","text2",..: 1 2 3 4 5 6 7 8 9 10 ...
..$ segid_ : int [1:965] 1 1 1 1 1 1 1 1 1 1 ...
..$ ID : Factor w/ 965 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10 ...
..$ text : chr [1:965] | __truncated__ ...
- attr(*, "meta")=List of 3
..$ system:List of 6
.. ..$ package-version:Classes 'package_version', 'numeric_version' hidden list of 1
.. ..$ r-version :Classes 'R_system_version', 'package_version', 'numeric_version' hidden list of 1
.. ..$ system : Named chr [1:3] "Linux" "x86_64" "r1373953"
.. .. ..- attr(*, "names")= chr [1:3] "sysname" "machine" "user"
.. ..$ directory : chr "/cloud/project"
.. ..$ created : Date[1:1], format: ...
.. ..$ source : chr "data.frame"
..$ object:List of 2
.. ..$ unit : chr "documents"
.. ..$ summary:List of 2
..$ user : list()
我尝试使用docvars()。
c_corp %>% docvars() %>% glimpse()
但我得到了这个错误。
Error in UseMethod("docvars") :
no applicable method for 'docvars' applied to an object of class "c('corpus', 'character')"
任何帮助将不胜感激。
1条答案
按热度按时间inkz8wg91#
如果你使用的是
quanteda
,你应该指定你想要的quanteda::docvars
包。来自其他包(包括
readtext::docvars
)的docvars
实现不支持quanteda
的docvars
支持的数据。