我有5个数据库(DEMOGRAPHIE, CARACTERISTIQUE, FIN, EI ,EIG
)都在同一个excel工作表上。我将不得不检索每个数据库,而不必复制和粘贴。
这是不同数据库在Excel工作表上的外观。
我认为每个数据库之间有3个空行(但我不知道是否总是这样)。
每个数据集之前都有一行对应于数据集的标题。有一个通用模式指示一个数据集结束和另一个数据集开始的位置,但我不知道如何在检索每个数据库的同时将列名保留在标题中
这就是导入后数据集的显示方式。
我想知道在R中导入后或导入过程中是否更容易选择每一个
1条答案
按热度按时间iyzzxitl1#
如果始终有3个空白行分隔表,并且始终以表名开头,然后是列名,则应执行以下操作。
在这里,我们首先读入原始数据,然后解析它来找到每个表的位置(使用3个空行规则)。这是通过为3个
NA
值的字符串找到match
来完成的,这就是read_excel()
读取空行的方法。对于宽度,这个解决方案利用了这样一个事实,即如果你指定了起始行和结束行,
read_excel()
就可以猜到宽度。因此,只要表格中没有其他东西会混淆它,你就不必弄清楚宽度。出于演示的目的,我制作了一个最小的示例文件,其中只有前3行
mtcars
和iris
,但它应该可以缩放到任意大小。创建于2022年11月17日,使用reprex v2.0.2