《ABI与Illumina、454测序仪比较.docx》由会员分享,可在线阅读,更多相关《ABI与Illumina、454测序仪比较.docx(26页珍藏版)》请在三一办公上搜索。
1、ABI与Illumina、454测序仪比较Illumina测序仪Illumina公司的新一代测序仪Genome Analyzer最早由 Solexa公司研发,利用其专利核心技术“DNA簇”和“可逆性 末端终结(reversible terminator)”,实现自动化样本制备及 基因组数百万个碱基大规模平行测序。川umina公司于2007 年花费6亿美金的巨资收购了 Solexa,就是为了促成 Genome Analyzer 的商品化。Genome Analyzer 作为新一 代测序技术平台,具有高准确性,高通量,高灵敏度,和低 运行成本等突出优势,可以同时完成传统基因组学研究(测 序和注释)
2、以及功能基因组学(基因表达及调控,基因功 能,蛋白/核酸相互作用)研究。Genome Analyzer自上市以来,已经为千人基因组计划 立下了赫赫战功。今年早期,荷兰科学家利用它首次绘出女 性的基因组图谱。而就在前两周,Nature杂志上一连出 现三个人类基因组图谱:炎黄一号-第一个亚洲人图谱;第一 个癌症病人图谱;第一个非洲人图谱。它们全是依赖 Genome Analyzer完成的。哗,一下就来仨!这和第一个人 类基因组图谱的13年形成了多么鲜明的对照。根据去年底的数据,Genome Analyzer已售出约200 台,估计是市场占有率最广的。前不久,华大基因再添置了 12台,准备放在香港和
3、深圳的实验室,至此华大基因已经有 29台Genome Analyzer。而著名的麻省理工学院和哈佛大 学Broad研究院拥有47台Illumina测序仪。众多实验室之 所以选择Illumina,看中的无疑是Genome Analyzer的高性 价比。上个月,Illumina 将 Genome Analyzer II 升级到 Genome Analyzer IIx,距年底实现单次运行获得95 GB数 据的宏伟目标又近了一步。Genome Analyzer IIx有两个核 心特征:其一是更大的试剂冷却器,支持超过100个测序循 环,进一步提升了系统的易用性和自动化;其二是全新的流 动池支架,让每轮
4、运行所得的高质量数据增加20%。依靠系 统软件和试剂的改进,Genome Analyzer IIx现在能够支持 100 bp以上的配对末端读长,并在每次运行中产生超过20 GB的高质量数据。Genome Analyzer技术的基本原理:1. 文库制备将基因组DNA打成几百个碱基(或更短)的小片段, 在片段的两个末端加上接头(adapter)。2.产生DNA簇利用专利的芯片,其表而连接有一层单链引物,DNA片 段变成单链后通过与芯片表面的引物碱基互补被一端“固定” 在芯片上。另外一端(5或3)随机和附近的另外一个引物 互补,也被“固定”住,形成“桥(bridge) “。反复30轮扩增, 每个单分
5、子得到了 100。倍扩增,成为单克隆DNA簇。DNA 簇产生之后,扩增子被线性化,测序引物随后杂交在目标区 域一侧的通用序列上。3.测序Genome Analyzer系统应用了边合成边测序 (Sequencing By Synthesis)的原理。加入改造过的DNA 聚合酶和带有4种荧光标记的dNTP。这些核苷酸是“可逆 终止子”,因为3羟基末端带有可化学切割的部分,它只容许 每个循环掺入单个碱基。此时,用激光扫描反应板表面,读 取每条模板序列第一轮反应所聚合上去的核苷酸种类。之 后,将这些基团化学切割,恢复3端粘性,继续聚合第二个 核苷酸。如此继续下去,直到每条模板序列都完全被聚合为 双链。
6、这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。目前的配对末端读长可达到 2x50 bp,更长的读长也能实现,但错误率会增高。读长会 受到多个引起信号衰减的因素所影响,如荧光标记的不完全 切割。富BGCA呷GGA年TATCAGAGz# 5H-CTCGTCTfe,CO* 1. FL1+ FL2-dGT(Ukf) +FFL3dCTP-(Wock&r) + F L4-dTTP- (bbdfflF)( 2, Huqfewenoe imaging tn four $hannh、3. Chemically cleave Ubeh and+ .rriar-i 行卅二二4.数据分析自动
7、读取碱基,数据被转移到自动分析通道进行二次分析。Genome Analyzer系统之所以如此畅销,关键在于其技 术上的优势。1.可扩展的超高通量Genome Analyzer系统目前每次运行后可获得超过20 GB的高品质过滤数据。这个技术的可扩展性保证了更高的 数据密度和输出,能用更少的经费完成更复杂的项目。到今 年底,通量还有望上升到95 GB,相当于人类基因组的30 倍覆盖度。2. 需要样品量少Genome Analyzer系统需要的样品量低至100ng,能应 用在很多样品有限的实验(比如免疫沉淀、显微切割等)中。 这也是很多研究人员所考虑的因素。3. 简单、快速、自动化Genome An
8、alyzer系统提供了最简单和简洁的工作流 程。即使是最小的实验室也能像大型基因组中心一样进行大 规模的实验。制备样品文库可以在几小时内完成,一个星期 内就能得到高精确度的数据。Cluster Station可以说是 Genome Analyzer的核心。由独立软件控制的自动生成DNA 簇的过程可以在5小时之内(30分钟手工操作)完成。这个 自动化的流程不需要进行Emulsion PCR,减少了手工操作 误差和污染可能性,也不需要机器人操作或洁净室。快速的 实验流程使Genome Analyzer的能力增至最大,而自动化 步移降低了项目的时间和费用。4. 新颖的测序化学技术Genome Ana
9、lyzer通过合成测序来支持大规模并行测 序。利用新颖的可逆荧光标记终止于,可以在DNA链延伸 的过程中检测单个碱基掺入。由于四个可逆终止于dNTP在 每个测序循环都存在,自然的竞争减少了掺入的误差。5. 单个或配对末端支持Genome Analyzer系统支持单个片段或配对末端文库。 文库构建过程简单,减少了样品分离和制备的时间。制备基 因组DNA的单个片段或配对末端文库需要6个小时,只有3 个小时需要手工操作。2x50个碱基或更长的读长增加了比 对基因组的能力,并拓展了在其他方面的应用。然而,精明的用户更看重的是性价比,这也是他们选择 Illumina的重要原因。川umina的售价约为45
10、万美元,低于 454 GS FLX的50万和SOLiD系统的59万(以上皆为美国 的售价)。此外,运行成本也是一个关键因素。美国凤凰城 翻译基因组学研究院(TGen)的主管David Duggan曾表示, 当年购买新一代测序仪时,每次运行的费用就成为他下决定 的主要因素。他最终选择了 Illumina Genome Analyzer,因 为每轮的运行费用为3000-4000美元(2007年的数据), 较为合理,而其他测序仪可能更高。当然,他也综合考虑了 通量、运行时间和样品量。弗吉尼亚联邦大学的高原(音译)博士认为:“Genome Analyzer的操作费用、易用性和可扩展性让我实现了大规模
11、基因组实验。现在,我的小型实验室正在进行过去只能在大 型基因组中心才能完成的实验。低样品需求、简单的流程、高质量的数据以及应用灵活性让Illumina Genome Analyzer 从其他高通量测序技术中脱颖而出。”ROCH-454 测序仪454公司可谓新一代测序技术的奠基人。2005年底,454 公司推出了革命性的基于焦磷酸测序法的超高通量基因组 测序系统Genome Sequencer 20 System,被Nature杂志以里程碑事件报道,开创了边合成边测序(sequencing-by-synthesis)的先河。之后,454 公司被罗 氏诊断公司以1.55亿美元收购。一年后,他们又推
12、出了性能 更优的第二代基因组测序系统Genome SequencerFLX System (GS FLX)。去年 10 月,全新的 GS FLX Titanium系列试剂和软件的补充,让GS FLX的通量一下子 提高了 5倍,准确性、读长也进一步提升。想当年,GS 20的出现,揭开了测序历史上崭新的一页。 Jonathan Rothberg博士就是大规模并行测序的发明者,同 时也是454的创始人。上世纪90年代,很多学者也都想到 了大规模并行测序,他们试图将Sanger测序移到芯片上, 但都以失败告终,因为这项技术没有可扩展性。1999年, Rothberg的儿子出世,他放了两个星期的陪产假。
13、小家伙出 生后被送入婴儿特护病房,Rothberg非常担心,甚至想获取 儿子的基因组信息。这段担惊受怕的经历给了他灵感,他突 然意识到焦磷酸测序(pyrosequencing )不仅简单,而且具 有可扩展性。两个星期之后,Rothberg就开始设计芯片和流 动室,让测序在更小的反应室中进行,并同时进行几百万个 反应。硬件的设计和制造也只是成功的一半,在样品制备上还 有同样漫长的路要走。Rothberg摒弃了传统的细菌克隆与挑 选,将DNA打断成随机片段,并寻找一种方法来克隆每个 片段。受到其他学者乳液实验的启发,他也想将DNA放入 油包水的乳液中,这样就省去了反应管。一个好汉三个帮。 在Joe
14、l Bader等人的帮助下,Rothberg验证了这些想法的 可行性,并利用了炸药中的表面活性剂来维持乳液的热稳定 性。就这样,乳液PCR终于诞生了。之后,454生命科学公司用新一代测序仪对DNA双螺 旋结构的发明者James Watson进行了基因组测序。第一份 个人基因组图谱的绘制只用了两年时间,花费不到100万美 元。虽然现在看来这并不算什么,但就当时而言,它相对于 人类基因组计划已是质的飞跃。GS FLX系统的工作流程GS FLX系统的流程概括起来,就是“一个片段=一个 磁珠=一条读长(One fragment = One bead = One read) ”。1)样品输入并片段化:G
15、S FLX系统支持各种不同来源的样 品,包括基因组DNA、PCR产物、BAC、cDNA、小分子 RNA等等。大的样品例如基因组DNA或者BAC等被打断 成300-800 bp的片段;对于小分子的非编码RNA或者 PCR扩增产物,这一步则不需要。短的PCR产物则可以直 接跳到步骤3)。2)文库制备:借助一系列标准的分子生物学技术,将A和 B接头(3和5端具有特异性)连接到DNA片段上。接头也 将用于后续的纯化,扩增和测序步骤。具有A、B接头的单 链DNA片段组成了样品文库。3)一个DNA片段=一个磁珠:单链DNA文库被固定在特 别设计的DNA捕获磁珠上。每一个磁珠携带了一个独特的 单链DNA片段
16、。磁珠结合的文库被扩增试剂乳化,形成油 包水的混合物,这样就形成了只包含一个磁珠和一个独特片 段的微反应器。4)乳液PCR扩增:每个独特的片段在自己的微反应器里进 行独立的扩增,而没有其他的竞争性或者污染性序列的影 响。整个片段文库的扩增平行进行。对于每一个片段而言, 扩增后产生了几百万个相同的拷贝。随后,乳液混合物被打 破,扩增的片段仍然结合在磁珠上。5)一个磁珠=一条读长:携带DNA的捕获磁珠随后放入 PTP板中进行后继的测序。PTP孔的直径(29um)只能容 纳一个磁珠(20um)。然后将PTP板放置在GS FLX中, 测序开始。放置在四个单独的试剂瓶里的四种碱基,依照T、 A、C、G的
17、顺序依次循环进入PTP板,每次只进入一个碱 基。如果发生碱基配对,就会释放一个焦磷酸。这个焦磷酸 在ATP硫酸化酶和萤光素酶的作用下,经过一个合成反应和 一个化学发光反应,最终将萤光素氧化成氧化萤光素,同时 释放出光信号。此反应释放出的光信号实时被仪器配置的高 灵敏度CCD捕获到。有一个碱基和测序模板进行配对,就 会捕获到一分子的光信号;由此一一对应,就可以准确、快 速地确定待测模板的碱基序列。这也就是大名鼎鼎的焦磷酸 测序。6)数据分析:GS FLX系统在10小时的运行当中可获得100 多万个读长,读取超过4-6亿个碱基信息。GS FLX系统提 供两种不同的生物信息学工具对测序数据进行分析,
18、适用于 不同的应用:达400 MB的从头拼接和任何大小基因组的重 测序。GS FLX系统的准确率在99%以上。其主要限制来自同 聚物,也就是相同碱基的连续掺入,如AAA或GGG。由于 没有终止元件来阻止单个循环的连续掺入,同聚物的长度就 需要从信号强度中推断出来。这个过程就可能产生误差。因 此,454测序平台的主要错误类型是插入-缺失,而不是替换。新升级让性能全面提升去年底发布的Titanium系列试剂,是对现有GS FLX平台的 重要升级。升级内容包含耗材、试剂和软件。你无需对仪器 的硬件做任何昂贵的升级,只改进试剂和软件,就能立刻实 现性能提升。升级之后,每轮测序能产生100万个读长片段,
19、 高质量(Q20)的读长增加至400 bp。第400个碱基的准确 率是99%,之前的更高。通量也提高了 5倍,目前每轮运彳丁 能获得4-6亿个碱基对,所需时间为10小时。PTP平板的创新重设计 重新设计之后,PTP平板上孔 的密度更高,利用更小的DNA捕获磁珠进行金属覆盖,改 善了信号质量,因此读长的数量和长度都明显改善,同时 准确性更高。目前孔的直径是29 um, DNA捕获磁珠的大 小是20 um。改进的测序试剂 改进的GS FLX Titanium试剂显著降 低了背景噪音,因此在几乎相同的运行时间内,读长更加 长。升级的软件 优化用于超高通量测序的软件,能轻松对 更大、更复杂的基因组进行
20、拼接和作图。GS FLX 2.0版 它与以前版本的输出数据也完全兼容, 让片段能够共同拼接和作图。广阔的应用天地在新一代测序技术中,GS系统是最多产的。截至2008 年9月,已经发表了 250多篇高质量的paper。其中Nature 20 篇、Science 13 篇、Cell 6 篇、Genome Research 20 篇、PNAS 24篇。光是这些数据就让人咂舌。这些研究跨越 了测序应用的多个方面:82篇全基因组测序论文包括比较基 因组学的从头测序和重测序;54篇小分子RNA研究;37篇 聚焦快速兴起的宏基因组学;27篇关于转录组图谱分析,包 括全转录组拼接和表达图谱;13篇研究染色体结
21、构和表观遗 传学;10篇有关稀有变异检测的超深度测序这个新领域;11 篇研究古老RNA。其余的文章关注454测序系统的技术和 生物信息学。多种多样的应用彰显出454测序系统的能力, 那些传统意义上无法用测序来解决的问题现在也一并解决 了。454测序系统除了为多项研究领域开辟了基因组分析之 路,同时也加速了探索的步伐。一般来说,研究、分析、撰 写并提交论文,经同行评议后发表,需要一年左右的时间。 而利用Genome Sequencer系统发表论文的速度,显然表明 454测序结果的数据质量高,且分析简单。超长读长与易用 的分析工具相结合,让研究人员能更集中精力于科学研究, 而不是研究测序过程中的某
22、个技术细节。这样研究项目能快 速完成,接着踏上新的研究道路。与其他新一代测序平台相比,454平台的突出优势是读 长。目前GS FLX系统的序列读长已超过400 bp。虽然454 平台的测序成本比其他平台要高很多,不过对于那些需要长 读长的应用,如从头拼接和宏基因组学,它仍是最理想的选 择。去年底,美国加利福尼亚大学的研究小组利用全新的 GS FLX Titanium系列试剂对海洋样品的宏基因组进行测 序,发现了一种全新的蓝藻物种,文章发表在11月14日的 Science杂志上。这项研究是系统升级后发表的首篇文 章。首席研究员Jonathan Zehr对于获得数据及分析结果的 速度非常震惊。他表
23、示:“多年来我们一直试图培养这种微生 物,但都没有成功。有了 GS FLX Titanium,我们在几天之 内就通过单次测序运行,从环境样品直接获得了宝贵的基因 组信息。这个系统超长的读长对于我们从复杂的微生物群体 中鉴定并分析这种独特的细菌基因组来说非常关键。”最近,在454测序平台的协助下,研究人员完成了油棕 榈的全基因组测序、拼接和注释。油棕榈是一种重要的经济 作物,它的基因组很大,达17 GB。基因组的测序工作是由 GS FLX Titanium系统完成的,拼接和分析则是由马来西亚 一家生物信息学公司完成的。值得注意的是,这是史上第一 次在没有添加传统Sanger测序数据的情况下,完成
24、了对大 且非常复杂的植物基因组进行从头拼接。这种快速经济的方 法为了解多种经济作物的遗传结构打开了大门。此外,罗氏旗下的另一家公司NimbleGen正在全球性 地捕获定向重测序市场。NimbleGen序列捕获芯片与454 的测序仪结合,能让完整的人外显组测序成为现实,最终将 为研究流水线输送技术,并促进个性化医疗的开发.ABI测序仪过去20年,美国应用生物系统公司(ABI)在测序方面 一直占据着垄断地位。自公司的共同创始人Leroy Hood在 上世纪80年代中期设计了第一台自动荧光测序仪之后,生 命科学研究就摆脱了手工测序的繁琐和辛劳,骄傲地迈入自 动测序的新时代。直到2005年,454推出
25、了 FLX焦磷酸测 序平台,ABI的领先地位开始有些动摇。之后,ABI迅速收 购了一家测序公司 Agencourt Personal Genomics,并 在2007年底推出了 SOLiD新一代测序平台。从SOLiD到 如今的SOLiD 3,短短一年多时间,它已经上演了一出精彩 的“一级方程式赛车”。SOLiD 全称为 supported oligo ligation detetion,它的 独特之处在于以四色荧光标记寡核苷酸的连续连接合成为 基础,取代了传统的聚合酶连接反应,可对单拷贝DNA片 段进行大规模扩增和高通量并行测序。就通量而言,SOLiD 3 系统是革命性的,目前SOLiD 3单
26、次运行可产生50GB的序 列数据,相当于17倍人类基因组覆盖度。而其无以伦比的 准确性、系统可靠性和可扩展性更让它从其他新一代测序平 台中脱颖而出。为什么SOLiD能轻松实现貌似不可能的任 务?让生物通带你从测序原理入手,一探究竟。SOLID工作流程a.文库制备SOLiD系统能支持两种测序模板:片段文库(fragment library )或配对末端文库(mate-paired library)。使用哪一种文 库取决于你的应用及需要的信息。片段文库就是将基因组 DNA打断,两头加上接头,制成文库。如果你想要做转录组 测序、RNA定量、miRNA探索、重测序、3,-RACE、甲 基化分析、ChI
27、P测序等,就可以用它。如果你的应用是全 基因组测序、SNP分析、结构重排/拷贝数,则需要用配对 末端文库。配对末端文库是将基因组DNA打断后,与中间 接头连接,再环化,然后用EcoP15酶切,使中间接头两端 各有27bp的碱基,再加上两端的接头,形成文库。b乳液PCR/微珠富集在微反应器中加入测序模板、PCR反应元件、微珠和引物,进行乳液PCR(Emulsion PCR)。PCR完成之后,变 性模板,富集带有延伸模板的微珠,去除多余的微珠。微珠 上的模板经过3修饰,可以与玻片共价结合。看到这里,是 不是有一种似曾相识的感觉呢?那就对了,此步骤与454的 GS FLX基本相同。不过SOLiD系统
28、的微珠要小得多,只有 1 um。乳液PCR最大的特点是可以形成数目庞大的独立反应 空间以进行DNA扩增。其关键技术是“注水到油”,基本过程 是在PCR反应前,将包含PCR所有反应成分的水溶液注入 到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油 包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。 理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠, 由于水相中的P2引物和磁珠表面的P1引物所介导的PCR 反应,这个DNA模板的拷贝数量呈指数级增加,PCR反应 结束后,P1磁珠表面就固定有拷贝数目巨大的同来源DNA 模板扩增产物。c. 微珠沉积3修饰的微珠沉积在一块玻片上。在微珠上样
29、的过程中, 沉积小室将每张玻片分成1个、4个或8个测序区域。SOLiD 系统最大的优点就是每张玻片能容纳更高密度的微珠,在同 一系统中轻松实现更高的通量。d. 连接测序这一步可就是SOLiD的独门秘笈了。它的独特之处在于 没有采用惯常的聚合酶,而用了连接酶。SOLiD连接反应的 底物是8碱基单链荧光探针混合物。连接反应中,这些探针 按照碱基互补规则与单链DNA模板链配对。探针的5末端 分别标记了 CY5、Texas Red、CY3、6-FAM这4种颜色的 荧光染料。探针3端15位为随机碱基,可以是ATCG四 种碱基中的任何一种碱基,其中第1、2位构成的碱基对是 表征探针染料类型的编码区,下图的
30、双碱基编码矩阵规定了 该编码区16种碱基对和4种探针颜色的对应关系,而35 位的“n”表示随机碱基,68位的“z”指的是可以和任何碱基 配对的特殊碱基。2nd BaseA C GIlillllll了 IHHIiiHlIlllMllll山111山1 山 11心网1 SequenooIcflisba- $湖行欢单向SOLiD测序包括五轮测序反应,每轮测序反应含有 多次连接反应。第一轮测序的第一次连接反应由连接引物“n” 介导,由于每个磁珠只含有均质单链DNA模板,所以这次 连接反应掺入一种8碱基荧光探针,SOLiD测序仪记录下探 针第1、2位编码区颜色信息,随后的化学处理断裂探针3 端第5、6位碱
31、基间的化学键,并除去68位碱基及5末端 荧光基团,暴露探针第5位碱基5磷酸,为下一次连接反应 作准备。因为第一次连接反应使合成链多了5个碱基,所以 第二次连接反应得到模板上第6、7位碱基序列的颜色信息, 而第三次连接反应得到的是第11、12位碱基序列的颜色信 息mi 11 in 八 uiiu. miniiHiiiiHiHiiiiiniiniAdaa:r Sdcusncelernpla $如而做_+J 7TTTTTTTT - $ iiiiinimiiniuiiii【iiiiimiiim 丁AdapJef Soquelliwnpfew Seou&w几个循环之后,引物重置,开始第二轮的测序。由于第
32、二轮连接引物n-1比第一轮错升一位,所以第二轮得到以0, 1位起始的若干碱基对的颜色信息。五轮测序反应反应后, 按照第0、1位,第1、2位.的顺序把对应于模板序列的颜色信息连起来,就得到由“0, 1, 2, 3.”组成的SOLiD原 始颜色序列。e. 数据分析SOLiD测序完成后,获得了由颜色编码组成的SOLiD 原始序列。理论上来说,按照“双碱基编码矩阵”,只要知道 所测DNA序列中任何一个位置的碱基类型,就可以将SOLiD 原始颜色序列“解码”成碱基序列。但由于双碱基编码规则中 双碱基与颜色信息的简并特性(一种颜色对应4种碱基对), 前面碱基的颜色编码直接影响紧跟其后碱基的解码,所以一 个
33、错误颜色编码就会引起“连锁解码错误”,改变错误颜色编 码之后的所有碱基。和其它所有测序仪一样,测序错误在所难免,关键是对 测序错误的评价和后续处理。由于SOLiD系统采用了双碱基 编码技术,在测序过程中对每个碱基判读两遍,从而减少原 始数据错误,提供内在的校对功能。这样,双保险确保了 SOLiD系统原始碱基数据的准确度大于99.94%,而在15X 覆盖率时的准确度可以达到99.999%,是目前新一代基因分 析技术中准确度最高的。为避免“连锁解码错误”的发生,SOLiD数据分析软件不 直接将SOLiD原始颜色序列解码成碱基序列,而是依靠 reference序列进行后续数据分析。SOLiD序列分析
34、软件首 先根据“双碱基编码矩阵”把reference碱基序列转换成颜色 编码序列,然后与SOLiD原始颜色序列进行比较,来获得 SOLiD原始颜色序列在reference的位置,及两者的匹配性 信息o Reference转换而成的颜色编码序列和SOLiD原始序 列的不完全匹配主要有两种情况:“单颜色不匹配”和“两连续 颜色不匹配”。由于每个碱基都被独立地检测两次,且SNP 位点将改变连续的两个颜色编码,所以一般情况下SOLiD 将单颜色不匹配处理成测序错误,这样一来,SOLiD分析软 件就完成了该测序错误的自动校正;而连续两颜色不匹配也 可能是连续的两次测序错误,SOLiD分析软件将综合考虑该
35、 位置颜色序列的一致性及质量值来判断该位点是否为SNPo在初步了解了 SOLiD系统的工作原理之后,我们才能明 白它的魅力所在。系统可扩展性SOLiD系统采用开放玻片式的结构,使用包被DNA样 品的微珠来输入基因组信息。微珠密度并不是一成不变的, 系统支持更高密度的微珠富集。开放式玻片形式、微珠富集、 以及软件算法的结合,能使平台轻松升级到更高的通量,而 无需对基础技术和配置做重大改变。这也是SOLiD系统平均 每季度将通量扩大一倍的原因所在。无以伦比的通量目前SOLiD 3系统单次运行能产生50 GB的人基因组 序列数据,相当于基因组的17倍覆盖度,这显然是其他任 一台新一代测序系统都无法达
36、到的。今年初,ABI公司和贝 勒医学院人类基因组测序中心(HGSC)的科学家总结了他 们在千人基因组计划首次数据发布中的贡献。作为商业参与 者以及与HGSC共同协作,ABI公司利用SOLiD系统产生 了超过460 GB可作图的序列数据,比这两个机构的预定目 标高出了 65%。而通量的升高也有望进一步降低基因组测序 的费用,成本只需1万美元的人类基因组测序指日可待。最大的灵活性SOLiD 3系统具有两个独立的流动室,让用户能在一台 SOLiD分析仪中运行两个完全独立的实验一一同时提供两 套仪器。玻片也能分成1个、4个或8个小室。而20个条 形码序列则提供了额外的灵活性,显著增加了定向重测序、 表
37、达和ChIP分析的经济性。目前最多能同时运行320个样 品(2x8x20)。至此,SOLiD系统已不再是一台单纯的测序仪,而是成为功 能更全面的基因分析仪。除了测序和重测序,还能进行全基 因表达图谱分析、SNP、microRNA、ChIP、甲基化等多种 分析。全基因表达图谱分析芯片大概是目前应用最广泛的从全局角度分析基因表 达整体模式的方法。然而,基于杂交技术的微阵列技术只限 用于已知序列,无法检测新的mRNA;而且杂交技术灵敏度 有限,难以检测低丰度的目标(需要更多的样品量),难以 检测重复序列;也无法捕捉到目的基因表达水平的微小变化 -而这恰恰是研究在刺激下或环境变化时的生物反应所 必需的
38、。与芯片技术相比,基于测序的高灵敏SOLiD技术可对单 个细胞和癌症样品中存在的痕量RNA进行整体的全基因组 表达图谱分析,每次运行能定位高达2亿4千万个标签 (mRNA的相对表达水平可通过系统产生的序列标签数目 来计算),可检测低至每个细胞中10-40pg的总RNA,即 使mRNA表达水平很低,SOLiD系统也能够无偏向性地分 析样品中存在的已知和未知mRNA,从而定量特定mRNA 的差异表达模式。起始样品比微阵列技术要少得多,尤其适 用于来源极为有限的生物样品分析,如癌症干细胞-分析其 基因和非编码RNA的表达图谱有助于有助于加速发掘潜在 的生物标志物,从而更准确区分不同的疾病类型以及识别
39、疾 病易感性,帮助于研究人员更好地了解病变细胞的特性。更多RNA研究除了单细胞基因表达图谱分析,SOLiD系统在RNA方 面的其他应用还包括利用SOLiD Small RNA Expression Kit 来发现和筛选小分子RNA,实现在无需预先知道序列信息的 情况下高通量发现新的RNA分子。这个方案有望显著地提 高研究人员鉴别小分子RNA的能力,将过去不可能完成的 实验变为可能。目前已发现的microRNAs还非常有限, SOLiD可在不知道目标分于DNA序列的情况下进行检测和 定量小的RNA分子,可将样品制备工作从常规方法的四天 缩短为仅需一天,是分析在生物样品中表达的已知和未知 miRN
40、A及其它小分子RNAs的有效工具。利用SOLiD Whole Transcriptome Kit还可以探索和鉴定全转录本。SOLiD无可 比拟的高通量和测序数据的高精确性使得可以用短序列读 长即可测序整个转录组。了解转录组对有助于解升导致复杂 疾病的分子通路的秘密。这一系列应用补充使研究人员能在 单个超高通量平台上开展综合的RNA研究。SNP分析尽管绝大多数的人类遗传信息在所有人中都相同,但是 研究人员通常更感兴趣的是研究个体之间微小的遗传差异。 这种差异包括单碱基变异,以及被称为结构变异的各种较大 片段DNA序列变异。结构变异包括DNA片段的插入、缺失、 倒位和易位,结构变异的DNA片段范围
41、可从几个碱基对到 数百万个碱基对,可能对基因产生重要影响,并导致人类疾 病的发生。SOLiD流程获得的严密的片段范围,使研究人员 可以鉴别出很宽范围内的插入和缺失片段,结构重排也能很 容易鉴别出来。这个平台的超高通量使研究人员可轻而易举 地获得高度基因组覆盖率的数据,精确鉴定个体基因组中存 在的数百万个单碱基多态性SNP,揭示大量此前未知、具有 潜在医学价值的遗传变异,从而促进我们对正常/疾病状态下 DNA结构变异的了解,以及在更高的分辨率下对结构变异进 行深入分析,解释个体之间的易感性差异和对疾病治疗应答 的差异,最终实现个性化医疗。甲基化分析甲基化是自然发生的DNA化学修饰的一种。已知抑癌 基因的失活与DNA序列特定区域的甲基化有关。而去甲基 化则可能导致基因组不稳定和表达模式变化。DNA甲基化区 域可能作为基因在癌症过程中的标记。研究人员一直致力研 究从正常到癌变过程中甲基化模式如何变化的,原癌基因异 常甲基化模式在癌变过程中扮演怎样的角色。SOLiD系统运 行通量非常惊人,很快就可以做多个样本全基因组甲基化模 式检测,使得研究人员可以鉴别基因组中对应元件的甲基化 状态,从而帮助研究人员检测甲基化模式是否可以作为癌症 的生物标识,以及更好了解甲基化在癌变过程中扮演的角 色。