在不同物种、不同进化水平的生物的相关基因之间进行比较分析,是基因研究的重要手段。目前,我们有了越来越多的模式生物全基因组序列数据,因此,基因的比较研究,也必须从基因的比较,上升到对不同进化水平的生物在全基因组水平上的比较研究。这样的研究将更有效地揭示基因在生命系统中的地位和作用,解释整个生命系统的组成和作用方式。
对伴随人类基因组而完成的大量微生物完整基因组的信息分析,不仅将直接帮助破译人类遗传密码,其本身也可能解决重大的科学问题。因此,由完整基因组研究所导致的比较基因组学必将为后基因组研究开辟新的领域。 数据挖掘研究院
11.6.4 SNP的发现 数据挖掘实验室
人类基因组计划持续产生大量序列数据,清楚表明不同个体在整个基因组有许多点存在DNA序列的基本变异。最常见的变异发生在分散的单个核苷酸位置,即单核苷酸多态性(SNPs),估计发生频率大约每1000个核苷酸有1个。那么,没每1000个核苷酸,具有一个群体的基本频率的任何一个双拷贝染色体之间的在任一个位置平均核苷酸的一致性是不同的。SNPs是双等位基因多态性,即多原则上态性位点的核苷酸一致性通常在人类中倾向于二分之一的机率,而不是四核苷酸机率。 数据挖掘实验室
SNPs在人类遗传学研究中有重要意义。首先,一组SNPs发生在蛋白质编码区。特定的SNPs等位基因可被认为是人类遗传疾病的致病因子。在个体中筛选这类等位基因可以检查其对疾病的遗传易感性。其次,SNPs可作为遗传作图研究中的遗传标记,帮助定位和鉴定功能基因。推算3000个双等位SNP标记将足够进行人类全基因组作图;100,000或更多的SNPs能够在更大的群体中进行有效的遗传作图研究。因此,需要发展进行大量SNP分析的廉价高效技术,包括DNA芯片技术,MALDI-TOF质谱等。 数据挖掘实验室
SNPs是人类遗传多样性最丰富的形式,可用做复杂遗传性状作图。通过高通量的测序项目的得到的大量数据是丰富的大部分没接上的SNP来源。这里介绍一种认一DNA来源的遗传序列数据变异发现的整体途径。计划用迅速出现的基因组序列作为模板放置没有作图片段化的序列数据,并用碱基质量数值区别真正的等位基因变异与测序错误。

