您想要的就是我们正在做的...

人类基因组的测序和分析

    新华社华盛顿2月11日专电
    
    在人类基因组探索过程中,人类基因组工程的科学家和美国塞莱拉公司的科学家采用了两种不同的测序和分析的方法。塞莱拉公司的核心分析方法被称为“霰弹法”,人类基因组工程则采用了“克隆法”。
    塞莱拉公司研究组包括282位来自美国、欧洲、澳大利亚、以色列和西班牙的研究机构的人员,他们代表了12个不同的学术机构、非盈利机构和商业性组织。科学家们从3女2男5位志愿者体内提取了DNA样品,他们包括1名非洲裔美国人,1名亚裔、1名拉美裔和2名白人。
    霰弹法是一个高度计算机化的方法,它是先把基因组随机分成已知长度(2000个碱基对、1万个碱基对、5万个碱基对)的片段,然后用数学算法将这些片段组装成毗邻的大段并确定它们在基因组上的正确位置。
    由公共经费支持的人类基因组工程则采用另一种方法,即先复制更大段的人类基因序列,然后将它们绘制到基因组的适当区域,这种方法需要研究人员在早期把较多的时间和精力放到克隆和绘制草图上,而塞莱拉公司的方法是在后期需要做大量的计算工作。
    塞莱拉公司的科学家先用霰弹法测序DNA,并将整个基因组覆盖8次,然后用两个数学公式将人类基因组序列多次组装起来,确定出了基因中的转录单元,预测出了60%的已识别基因的分子功能。最后研究人员将人类基因组信息与此前已完成的果蝇和线虫的基因组序列进行比较,从而找出了三者共有的核心功能。
    两个研究组将数据进行的对比以及人类基因组工程的科学家、《科学》和《自然》杂志高级指导编辑的评估表明,塞莱拉公司的基因组分析与人类基因组工程的分析结果虽然存在一些差异,但大部分地方都有极高的吻合度。
    塞莱拉公司测定的序列覆盖了95%以上的人类基因组,其中约85%的人类基因组存在于按照正确顺序排列、至少包含50万个碱基对的片段中。这一序列为人类至少拥有2.6383万个控制合成蛋白质的基因提供了有力的证据,也为另外1.2731万个假设基因的存在提供了较弱的证据。因此,人类基因数最多可能是3.9114万个,最少可能是2.6383万个。(完)

新华社记者吴伟农