R语言 如何在xlsx库中运行此命令?

vcudknz3  于 2023-06-19  发布在  其他
关注(0)|答案(2)|浏览(110)

我试图在RMANOVA上运行本教程中的一个命令:
https://finnstats.com/index.php/2021/04/06/repeated-measures-of-anova-in-r/
但是,当我尝试运行此命令时:

data <- read.xlsx("D:/RStudio/data.xlsx",sheetName="Sheet1")

它给了我以下错误:
loadWorkbook错误(file,password = password):找不到D:/RStudio/data.xlsx
看来这是没有加载,因为它需要一个本地数据文件,我没有。但是,我没有看到教程页面中有这个数据文件。我假设文件丢失了是正确的吗?还是这个命令应该用来构建电子表格?
任何帮助将是伟大的。谢谢!

ocebsuys

ocebsuys1#

简而言之

你认为文件丢失了是对的。此命令不会创建任何电子表格,但会读取存储在"D:/RStudio/data.xlsx"中的电子表格。

可能的解决方案

您可以自己创建一个数据集,例如,像这样:

# Treatment A: Samples for the different time steps T0, T1, and T2
T0A <- rnorm(12, mean = 7.853, sd = 3.082)
T1A <- rnorm(12, mean = 9.298, sd = 2.090)
T2A <- rnorm(12, mean = 5.586, sd = 0.396)
# Treatment B: Samples for the different time steps T0, T1, and T2
T0B <- rnorm(12, mean = 7.853, sd = 3.082)
T1B <- rnorm(12, mean = 9.298, sd = 2.090)
T2B <- rnorm(12, mean = 5.586, sd = 0.396)

# Combine the values in a data.frame
data <- data.frame(time = c(rep("T0", 12), rep("T1", 12), rep("T2", 12),
                            rep("T0", 12), rep("T1", 12), rep("T2", 12)),
                   score = c(T0A, T1A, T2A, T0B, T1B, T2B),
                   Treatment = c(rep("A", 36), rep("B", 36))
)
# make time and Treatment factors
data$time <- as.factor(data$time)
data$Treatment <- as.factor(data$Treatment)

# Here, we are at the Summary Statistics step of the tutorial already
library(dplyr)
library(rstatix)
summary<-data %>%
  group_by(time) %>%
  get_summary_stats(score, type = "mean_sd")
data.frame(summary)

注意,在这种情况下,治疗A和B完全相同。根据您想要测试的内容,您可以更改不同处理的均值和标准差。

其他想法

您还可以将离群值引入到自己创建的数据集中。在下文中,我只选择T0A的平均值和T0A标准差的4倍。然后,我们可以设置一个值N来表示我们想要多少个潜在的离群值。随后,我们创建可以比T0A的平均值高或低4个标准差的随机值,并使用这些值来替换data.frame中的随机score值。在这种情况下,我们设置N = 1个离群值的最大值。当然,这个脚本可以根据timeTreatment因子来设置某些潜在值的范围(但这超出了这个答案的范围)。

mean_value <- 7.853
extreme <- 4*3.082
N <- 1
outlier_values <- runif(N, min = mean_value - extreme, max = mean_value + extreme)
outliers <- round(runif(N, min = 1, max = nrow(data)), digits = 0)
data$score[outliers] <- outlier_values

在我看来,这个数据集比任何示例数据集都更有用,因为你现在可以更改均值和标准差值,并引入离群值等,所以你可以对数据进行实验,看看你的统计测试在各种情况下如何响应。

5gfr0r5j

5gfr0r5j2#

例如,使用file选择读取文件
data <- read.xlsx(file.choose(),sheetName=“Sheet 1”)#选择您想要打开的Excel文件,同时还包括图纸编号。或使用图纸编号

相关问题