我是靠谱客的博主 沉默流沙,最近开发中收集的这篇文章主要介绍java对象序列提取_如何使用带有awk语句的fasta头提取两种类型的序列,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

我一直在运行一个名为genewise的程序,将核苷酸序列翻译成基因的蛋白质序列 . 输入包括来自许多样品的组装的核苷酸序列 . 为了解析genewise输出,我一直在使用以下命令选择fasta标头:

for i in `ls`; do (cd "$i" && awk '/^>*/{flag=1;} //// {flag=0}flag' out_genewise > out_genewise_prot.fa);done

我被要求对每个基因重新运行,以便输出包括翻译的蛋白质序列和所有样品的cDNA序列 . 我无法创建两个awk语句来解析输出 .

对于在genewise输出用于基因各样品,蛋白质FASTA报头具有在.sp.tr端部与核苷酸具有的.sp在可在两种序列之间进行区分的端部 .

以下是其中一个序列的示例 .

>303.1_assembled_PF3D7_1477500.[1:1643].sp.tr

MNLRLSNYSLFQNILDKTNKSNCIYSTHSSYEEYHDEKVRTGSFFYSKKFRRYMLPIMGI

LYIIILNLLHLKGILSTEVQRSYTFSRNLSDNEKEKEKEKENKEFYKCYKKKGIKKLTIE

EEDLYPRHPGLYNSYYDYERPYLLTPEMLEYIEKAVEENVEKEVERRAIESFENRMLKQF

VDEIRDKRLRKGTI

//

>303.1_assembled_PF3D7_1477500.[1:1643].sp

ATGAATTTAAGGCTATCAAACTATAGTTTGTTTCAAAATATTCTTGATAAAACGAATAAA

TCGAATTGTATTTATTCTACACACAGTTCTTACGAAGAATATCATGATGAAAAAGTAAGA

GAAAAAGAAGTTGAAAGGAGAGCTATAGAATCATTTGAAAATAGAATGCTAAAACAGTTT

GTAGATGAAATAAGAGATAAAAGATTAAGAAAAGGTACCATT

//

我尝试了下面的命令来解析数据,但没有创建任何文件 . 有人可以帮我修理命令吗?

for i in `ls`; do (cd "$i" && awk '/^>*.sp.tr/{flag=1;} //// {flag=0}flag' out_genewise > out_genewise_prot.fa);done

for i in `ls`; do (cd "$i" && awk '/^>*.sp$/{flag=1;} //// {flag=0}flag' out_genewise > out_genewise_nt.fa);done

在此先感谢您的帮助 .

最后

以上就是沉默流沙为你收集整理的java对象序列提取_如何使用带有awk语句的fasta头提取两种类型的序列的全部内容,希望文章能够帮你解决java对象序列提取_如何使用带有awk语句的fasta头提取两种类型的序列所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(51)

评论列表共有 0 条评论

立即
投稿
返回
顶部