在R中连接Fasta文件

68de4m5k 于 2023-04-03 发布在其他

关注(0)|答案(2)|浏览(234)

我有多个fasta格式的核苷酸序列文件。我需要将这些文件连接成一个fasta文件。另外，我想相应地重新标记这些序列。
是否有可用的R包或任何可执行软件可以在R中工作？

r

来源：https://stackoverflow.com/questions/49841921/concatenate-fasta-files-in-r

2条答案

按热度按时间

ijnw1ujt1#

seqinr package中的read.fasta()函数用于读取fasta格式的文件。
这个函数的输出是一个包含字符向量的列表。这些列表可以在R中用c()这样的函数组合成一个列表。数据可以用seqinr包中的其他函数操作。
如果你发布了一些来自几个文件的示例数据，或者在你的原始帖子中发布了一些示例数据的链接，我可以演示如何连接这些文件。
同时，下面是一些示例代码，说明如何使用readLines()读取一组原始数据文本向量，并将它们组合成一个列表。

file1 <- "aaa
bbb
ccc
ddd"

file2 <- "eee
fff
ggg
hhh"

file3 <- "iii
jjj
kkk
lll"

file4 <- "mmm
nnn
ooo"

list1 <- lapply(c(file1,file2),function(x){readLines(textConnection(x))})
list2 <- lapply(c(file3,file4),function(x){readLines(textConnection(x))})
c(list1,list2)

...和输出：

> c(list1,list2)
[[1]]
[1] "aaa" "bbb" "ccc" "ddd"

[[2]]
[1] "eee" "fff" "ggg" "hhh"

[[3]]
[1] "iii" "jjj" "kkk" "lll"

[[4]]
[1] "mmm" "nnn" "ooo"

>

赞(0）回复(0）举报 2023-04-03

3yhwsihp2#

老问题，但在谷歌有很好的SEO，所以这里有一个新的答案：
有一个名为EnvNJ的包，它有一个专门的函数。请参阅EnvNJ包中的fastaconc（）：https://rdrr.io/cran/EnvNJ/man/fastaconc.html

赞(0）回复(0）举报 2023-04-03