红粉体育

网站首页 首页 > 篮球 > 正文

转录组在哪个数据库里面_转录组的功能

2024-06-02 08:13 篮球 来源:

转录组数据在论文里要放什么序列

转录组数据在论文里要放的序列有:原始序列、清洗后的序列、拼接后的序列。

转录组在哪个数据库里面_转录组的功能转录组在哪个数据库里面_转录组的功能


1、原始序列:包括测序平台产生的原始序列数据,可以存放在公共数据库中,如NCBISRA,ENA等。需要提供测序的ID号、库名、测序平台、测序长度等信息。

2、清洗后的序列:清洗后的序列文件,包括去除接头序列、低质量序列、低复杂度序列等处理的结果。需要提供序列清洗的方法、参数、清洗后的序列长度、数量等信息。

3、拼接后的序列:使用拼接工具对原始序列进行拼接,需要提供拼接后的序列文件,包括拼接率、平均长度、N50等统计信息。

转录组原始数据包括什么

转录组原始数据包括递交原始序列。

转录组有两部分数据要递交,首先是拼接的转录组序列,一般递交到tsa上,另一个是fastq的原始测序数据,一般递交到sra上。前两年还有论文只提交tsa不递交原始数据,目前发表的论文基本都要提交。这也是便于其他人可以完全重复你的实验和数据分析的必要要求。

GSA(Genome Sequence Archive)是一个存储基因组、转录组以及其他Omics原始序列数据的数据库。GSA允许用户创建、上传并存储序列数据。GSA提供对项目信息(BioProject)、样本信息(BioSample)、实验信息(Experiment)以及测序数据的有效组织与管理。

转录组测序所得的数据,怎样传到NCBI的SRA数据库

转录组测序所得的数据,怎样传到NCBI的SRA数据库

Unigene其实没有一个标准的定义。大体的概念是经过去冗余之后得到的基因序列,这条序列和其他的序列是非冗余的,也就是理论上其他序列都和此序列代表的不是同一个基因。或者是经过聚类后得到的不同的类,类和类之间是非冗余的,每个类可以认为的代表一个基因。不同的去冗余和聚类的方法得到的结果都可以称为unigene。

另外NCBI上也有Unigene的概念,是NCBI用自己的方法对序列进行聚类,它认为每一个类都的代表一个基因,并赋予一个编号:物种名字.数字,比如小麦的一个例子:Ta.191,这也是较常用的Unigene.

转录组异基因表达的nr注释是什么意思

NR是一个数据库,是NCBI中蛋白质数据库,了许多其他数据库中的蛋白质的注释信息。异基因注释简单来说就是把有表达异的Unigene的物种、分子功能、生物学途径等等信息通过从数据库中比对,得到的结果。

unigene怎么翻译好 具体是什么意思

unigene是Universal Gene的英文缩写,意为广泛通用的基因数据库,通过电脑对相同基因座(Locus)的收集整理形成一个非冗余的基因数据库一种生物信息学数据库(基因数据库)


免责声明: 本文由用户上传,如有侵权请联系删除!


标签:

最新文章
热评文章
随机文章