我有多个fasta格式的核苷酸序列文件。我需要将这些文件连接成一个fasta文件。另外,我想相应地重新标记这些序列。是否有可用的R包或任何可执行软件可以在R中工作?
ijnw1ujt1#
seqinr package中的read.fasta()函数用于读取fasta格式的文件。这个函数的输出是一个包含字符向量的列表。这些列表可以在R中用c()这样的函数组合成一个列表。数据可以用seqinr包中的其他函数操作。如果你发布了一些来自几个文件的示例数据,或者在你的原始帖子中发布了一些示例数据的链接,我可以演示如何连接这些文件。同时,下面是一些示例代码,说明如何使用readLines()读取一组原始数据文本向量,并将它们组合成一个列表。
read.fasta()
c()
seqinr
readLines()
file1 <- "aaa bbb ccc ddd" file2 <- "eee fff ggg hhh" file3 <- "iii jjj kkk lll" file4 <- "mmm nnn ooo" list1 <- lapply(c(file1,file2),function(x){readLines(textConnection(x))}) list2 <- lapply(c(file3,file4),function(x){readLines(textConnection(x))}) c(list1,list2)
...和输出:
> c(list1,list2) [[1]] [1] "aaa" "bbb" "ccc" "ddd" [[2]] [1] "eee" "fff" "ggg" "hhh" [[3]] [1] "iii" "jjj" "kkk" "lll" [[4]] [1] "mmm" "nnn" "ooo" >
3yhwsihp2#
老问题,但在谷歌有很好的SEO,所以这里有一个新的答案:有一个名为EnvNJ的包,它有一个专门的函数。请参阅EnvNJ包中的fastaconc():https://rdrr.io/cran/EnvNJ/man/fastaconc.html
2条答案
按热度按时间ijnw1ujt1#
seqinr package中的
read.fasta()
函数用于读取fasta格式的文件。这个函数的输出是一个包含字符向量的列表。这些列表可以在R中用
c()
这样的函数组合成一个列表。数据可以用seqinr
包中的其他函数操作。如果你发布了一些来自几个文件的示例数据,或者在你的原始帖子中发布了一些示例数据的链接,我可以演示如何连接这些文件。
同时,下面是一些示例代码,说明如何使用
readLines()
读取一组原始数据文本向量,并将它们组合成一个列表。...和输出:
3yhwsihp2#
老问题,但在谷歌有很好的SEO,所以这里有一个新的答案:
有一个名为EnvNJ的包,它有一个专门的函数。请参阅EnvNJ包中的fastaconc():https://rdrr.io/cran/EnvNJ/man/fastaconc.html