R语言拆分数据集以实现可视化[已关闭]

tkclm6bt 于 2023-10-13 发布在其他

关注(0)|答案(1)|浏览(102)

已关闭，此问题需要details or clarity。它目前不接受回答。
**想改善这个问题吗？**通过editing this post添加详细信息并澄清问题。

7小时前关闭
Improve this question
我试图找到两个数据集之间的重叠，数据集A是电子书，数据集B是印刷和有声读物。我已经通过标题和作者匹配了两个数据集，并删除了任何不匹配的值。问题是，我试图通过比较A和B数据集的使用情况来为新数据集C创建可视化，但现在数据集C中有两个单独的列。所以，我想我会再次打破数据集除了现在我已经把它降到我需要的位。
新的数据集C包含1567个值，看起来像这样：
| 标题|作者|结账|格式|作者|第二章|使用|
| --|--|--|--|--|--|--|
| 横|Patt| 46 |电子书|Patt|打印| 2 |
| 最大|Patt| 246 |电子书|Patt|有声读物| 38 |
我希望数据集看起来像这样，有重复的标题和作者字段：
| 标题|作者|使用|格式|
| --|--|--|--|
| 横|Patt| 46 |电子书|
| 横|Patt| 2 |打印|
| 最大|Patt| 246 |电子书|
| 最大|Patt| 38 |有声读物|
我试过pivot_longer，但我总是得到一个错误，不能合并，因为一列是字符，另一列是整数。

r

来源：https://stackoverflow.com/questions/77283577/break-apart-dataset-for-visualizations

1条答案

按热度按时间

ix0qys7i1#

你可以这样做。

library(dplyr)
#> 
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#> 
#>     filter, lag
#> The following objects are masked from 'package:base':
#> 
#>     intersect, setdiff, setequal, union

df <-
  data.frame(
       Title = c("Cross", "Maximum"),
      Author = c("Patt", "Patt"),
   Checkouts = c(46L, 246L),
      Format = c("Ebook", "Ebook"),
      Author = c("Patt", "Patt"),
    Format.2 = c("Print", "Audiobook"),
       Usage = c(2L, 38L)
  )

df2 <-
  df %>% 
    select(
        Title, 
        Author, 
        'Format' = Format.2, 
        Usage 
    )

df3 <-
  df %>% 
    select(
      Title,
      Author, 
      Format, 
      'Usage' = Checkouts
    )

bind_rows(df2, df3)
#>     Title Author    Format Usage
#> 1   Cross   Patt     Print     2
#> 2 Maximum   Patt Audiobook    38
#> 3   Cross   Patt     Ebook    46
#> 4 Maximum   Patt     Ebook   246

创建于2023-10-12使用reprex v2.0.2

赞(0）回复(0）举报 2023-10-13

我来回答

R语言拆分数据集以实现可视化[已关闭]

1条答案

相关问题

热门标签

最新问答

R语言 拆分数据集以实现可视化[已关闭]

1条答案

相关问题

热门标签

最新问答

R语言拆分数据集以实现可视化[已关闭]