我的计划是使用Quanteda包在R中处理一个语料库。我使用poliblogs.csv数据库,可通过from here访问,使用下面的脚本。过去,该脚本运行顺畅,但现在出现了一条错误消息。当我试图获取语料库的统计信息或试图修剪它时,错误就会发生。
我运行的脚本如下所示:
require("quanteda")
require("readtext")
require("topicmodels")
require("stm")
blog.dat <- readtext("poliblogs2008.csv",
textfield="documents")
meta.list <- list(blog=blog.dat$blog,
day=blog.dat$day,
rating= blog.dat$rating)
names(meta.list)
blogcorpus <- corpus(blog.dat,
meta=meta.list)
meta <- meta(blogcorpus)
mycorpus.stats <- summary(blogcorpus)
blog.dfm <- dfm(blogcorpus, remove=stopwords("english"),
stem= TRUE,
removePunct= TRUE)
当我运行这些行时出现错误:
mycorpus.stats <- summary(blogcorpus)
以及
blog.dfm <- dfm(blogcorpus, remove=stopwords("english"),
stem= TRUE,
removePunct= TRUE)
在这两种情况下,都会出现以下相同的错误消息:
Error in if (...length() && any(...names() == "Dimnames")) .Object@Dimnames <- fixupDN(.Object@Dimnames) :
missing value where TRUE/FALSE needed
同样的错误也会出现在多重数据集上,因此它似乎与数据无关。
更新:实际上,这个问题是由RStudio本身的一个bug引起的。卸载并重新安装R和RStudio解决了这个问题,并使错误消失。感谢每一个寻找并提供解决方案的人。
1条答案
按热度按时间omhiaaxx1#
require(quanteda)
非常好,但是您应该更新包。应该是