在R中连接Fasta文件

68de4m5k  于 2023-04-03  发布在  其他
关注(0)|答案(2)|浏览(234)

我有多个fasta格式的核苷酸序列文件。我需要将这些文件连接成一个fasta文件。另外,我想相应地重新标记这些序列。
是否有可用的R包或任何可执行软件可以在R中工作?

ijnw1ujt

ijnw1ujt1#

seqinr package中的read.fasta()函数用于读取fasta格式的文件。
这个函数的输出是一个包含字符向量的列表。这些列表可以在R中用c()这样的函数组合成一个列表。数据可以用seqinr包中的其他函数操作。
如果你发布了一些来自几个文件的示例数据,或者在你的原始帖子中发布了一些示例数据的链接,我可以演示如何连接这些文件。
同时,下面是一些示例代码,说明如何使用readLines()读取一组原始数据文本向量,并将它们组合成一个列表。

file1 <- "aaa
bbb
ccc
ddd"

file2 <- "eee
fff
ggg
hhh"

file3 <- "iii
jjj
kkk
lll"

file4 <- "mmm
nnn
ooo"

list1 <- lapply(c(file1,file2),function(x){readLines(textConnection(x))})
list2 <- lapply(c(file3,file4),function(x){readLines(textConnection(x))})
c(list1,list2)

...和输出:

> c(list1,list2)
[[1]]
[1] "aaa" "bbb" "ccc" "ddd"

[[2]]
[1] "eee" "fff" "ggg" "hhh"

[[3]]
[1] "iii" "jjj" "kkk" "lll"

[[4]]
[1] "mmm" "nnn" "ooo"

>
3yhwsihp

3yhwsihp2#

老问题,但在谷歌有很好的SEO,所以这里有一个新的答案:
有一个名为EnvNJ的包,它有一个专门的函数。请参阅EnvNJ包中的fastaconc():https://rdrr.io/cran/EnvNJ/man/fastaconc.html

相关问题