基于宏基因组的菌株级别基因组成分析

最后发布时间 : 2025-04-25 14:05:44 浏览量 :

panphlan用于鉴定宏基因组样本中单个菌株基因组成分析. panphlan能够对未知病原体进行菌株追踪和功能分析,是进行无培养微生物种群研究的有效工具。

UniRef 基因家族级泛基因组构建和注释

ref
该工具提供了将输入和聚类输入基因组序列序列序列到UNIREF90/UNIREF50基因家族并聚类未知编码序列的管道。 提供的输出是现成的Panphlan Pangenome。 因此,它将在multi-FASTA文件,预计算的Bowtie2索引和重叠群上的Pangenome TSV文件映射基因位置中计数所有基因组重叠群。

Pipeline

  • Prokka 运行所提供的基因组,对其进行注释
  • 利用 UniRef 注释器和 UniRef DIAMOND 数据库,将序列与 UniRef90 和 UniRef50 ID 关联起来
  • 其余(未被 UniRef 注释者映射的)序列以相同的阈值(相似度分别为 90% 和 50%)聚类在一起。这导致 UniRef90_UNK 和 UniRef50_UNK(未知)ID 的归属
  • 然后生成 PanPhlAn 泛基因组:连接所有基因组的 contigs,生成 tsv 映射文件,建立 bowtie2 索引。