《第十二章非编码RNA与复杂疾病ppt课件.ppt》由会员分享,可在线阅读,更多相关《第十二章非编码RNA与复杂疾病ppt课件.ppt(189页珍藏版)》请在三一办公上搜索。
1、第十二章 非编码RNA与复杂疾病,生物信息学,人类基因组的蛋白质编码区的总和占总基因组长度为12,那么其他98的基因组有什么功能呢(junk dna)?(1)42的基因组是插入编码序列的内含子序列;人类基因平均每个基因有7个内含子。但这么冗长的内含子序列有什么生物学功能呢?(2)其他55%的基因组的功能是什么?【注:90%以上的基因组都是转录的!】,人类基因组草图带给科学家们的困惑,人类基因组绝大部分都被转录成RNA,细胞内非编码RNA的数量是编码RNA的上百倍。这促使许多科学家认为生物体复杂性被隐藏在它们所输出的非编码RNA内,而非编码序列内。,non-coding RNA,ncRNA,不能
2、翻译成蛋白的功能性RNA分子Housekeeping non-coding RNAtRNAs、rRNAs、snRNAs etc.Regulatory non-coding RNAsmall non-coding RNAsiRNA、miRNA、piRNA etc.Long non-coding RNA(lncRNA,200 nt),第一节 引言,Section 1 Introduction,随着ncRNA在复杂疾病中的研究深入,研究者发现其在疾病的发生发展过程中起着巨大的作用,其功能异常能够导致各种人类复杂疾病的发生。这将使ncRNA可能成为疾病诊断、预后的新的生物学标记(biomark),并为
3、更进一步理解复杂疾病的发病机理提供了新的手段。,第二节 非编码RNA与其靶基因,Section 2 Non-coding RNAs and Targets,(一)miRNA的发现,一、miRNA概述,miRNA was first discovered in 1993 by Victor Ambros at Harvard(lin-4)The second miRNA Let-7 was discovered in 2000 by Frank Slack as a postdoc at Harvard(Gary Ruvkun lab),The discovery of miRNAs,Victo
4、r Ambros,Gary Ruvkun,microRNAs had been neglected for so many years because of their small size.,The underlying reason is:people never dream that small RNAs will have important biological roles.,The number of the identified miRNAs is growing rapidly in recent years.Release 21(July 2014)of the miRBas
5、e database have added 4196 new hairpin sequences and 5441 new mature productsRelease 20 contains 24521 entries representing hairpin precursor miRNAs,expressing 30424 mature miRNA products,in 206 species.,These miRNAs are from primates,rodents啮齿类,birds,fish,worms,flies,plants and viruses.The data are
6、 freely available to all through the web interface at http:/www.mirbase.org/.,Since around 2007,the overwhelming majority of microRNAs deposited in miRBase have been predicted from small RNA deep sequencing experiments.,miRNA的生物合成过程,mature miRNA,Precursor miRNA,Primary miRNA,miRNA gene,转录,剪切,剪切,miRN
7、A,(二)miRNA的生物合成,几百几千碱基,约70 90碱基,约22碱基,miRNA 例子,The miRNA genes and Structure of pri-miRNAs,Pri-miRNAs bear the 5 cap and 3 poly(A)tails,(三)miRNA的特点、作用机制及分类,microRNA命名规则,hsa-miR-181a-2*hsa人,mus小鼠,rat大鼠let,lin,mir,miR,181:编号,按注册顺序a:与已注册的miRNA序列高度同源,2:由不同染色体上的DNA序列转录加工而成的具有相同成熟体序列的 miRNA,则在后面加上阿拉伯数字以区分
8、*:如果一个前体的2个臂分别产生miRNA,则根据克隆实验,在表达水平较低的miRNA 后加“*”;或进行如下命名 hsa-miR-188-5p(或hsa-miR-188-3p)5p:表示从 5 端的臂加工而来;3p:表示从 3 端的臂加工而来,miRNA/miRNA-star VS-5p/-3p,the dominant strand could change in different biological settings leading to different names describing the same molecule,5p arm(placenta)to the 3p ar
9、m(heart,liver,and kidney),物理位置特点miRNA基因以单拷贝、多拷贝和基因簇等多种形式存在于基因组中。miRNA簇(miRNA clusters)是指在染色体上彼此紧密相邻的两个或者多个miRNA构成的miRNA群miRNA倾向于成簇出现在染色体上;通常定义50kb的距离为一簇同一簇中的miRNA倾向是共表达的,miRNA一般特点 miRNA家族/簇,序列(特别是种子序列)高度同源的miRNA被归为一个miRNA家族同一家族中的miRNA并不一定是成簇的。,seed,miRNA的一般特点,序列特点非编码性成熟的miRNA 5 端为单一磷酸基团,3端为羟基,这一特点使它
10、与大多数寡核苷酸和功能RNA 的降解片段区别开来;,表达特点miRNA具有时序性以及组织特异性在特定的时间,组织中才会表达保守性特点在物种间高度保守,miRNA的作用机制,通过和靶基因3UTR(3非翻译区)结合导致RNA诱导的沉默复合体(RNA-induced silencing complex,简称RISC)降解其靶mRNA或阻碍其靶的翻译。,RISC,转录后层面调控基因表达,二、基于序列的miRNA靶基因预测方法,miRNA靶基因预测遵循的基本原则 miRanda TargetScan,Three Classes of miRNA Target Sites(Brennecke et al.
11、Plos Biology 2005),(一)miRNA靶基因预测遵循的原则和基本步骤,miRNA的“种子区”与mRNA的3UTR序列碱基互补靶点在多物种间的序列保守性miRNA与mRNA形成双链结构的热力学稳定性靶基因二级结构和靶点外的序列对靶基因预测的影响,遵循的原则,miRNA靶位点预测的难点:miRNA与靶位点的不完全互不配对,基本步骤,在3UTR上探寻和miRNA“种子区”完全互补的序列;计算miRNA和这些序列结合产生的自由能下降值,对靶点进行筛选;对靶点进行物种间序列比对,利用物种保守性进一步筛选。,(三)TargetScan,TargetScan主要考虑物种间保守的miRNA靶基
12、因,并且在TargetScan中首次提出了“种子匹配”(seed match)的概念。,http:/www.targetscan.org/,TargetScan算法的基本步骤,在TargetScan算法中,“种子匹配”被定义为miRNA 5端的第28位碱基与mRNA 3UTR 上的一段7nt(nucleotide)序列完全互补,miRNA上的这7个核苷酸被称为miRNA“种子区”。从种子区开始向miRNA两侧寻找互补碱基,允许G-U配对,直到出现碱基错配为止。在物种保守方面,TargetScan算法发现随着物种数目的增多,预测的靶基因数目逐渐减少,但预测结果的准确率得到提高。,三、基于表达信息
13、预测miRNA靶基因,Huang等人利用在88个组织中同时检测了miRNA和mRNA表达的数据,并结合贝叶斯方法开发了靶基因预测算法GenMiR+,得到了104个人类miRNA的高精度靶基因,并通过实验证实了预测的let-7b靶基因,结果表明,与基于序列的方法相比,利用相同样本中同时检测miRNA和mRNA的表达谱可以更准确的预测miRNA靶基因。(Huang,Using expression profiling data to identify human microRNA targets.Nat.Methods.),四、基于高通量测序结果预测miRNA靶基因,Argonaute CLIP-
14、SeqRIP-CLIPpSILACDegradome-Seq,Ago binds in a ternary 三元的 complex to both miRNA and mRNA,with sufficiently close contacts to allow UV-crosslinking to either RNA;mRNA tags will be in the immediate vicinity of miRNA binding sites.,Argonaute CLIP-Seq,Argonaute CLIP-Seq,Argonaute CLIP-Seq,又称为HITS-CLIP(u
15、ltraviolet cross-linking and immune-precipitationand and high-throughput sequencing),即紫外交联免疫共沉淀与高通量测序偶联技术。CLIP 技术是研究RNA结合蛋白(或者RNA)体内结合靶标的新技术。通过紫外交联将RNA结合蛋白与体内结合的RNA分子进行固定,用Ago蛋白的抗体免疫共沉淀之后酶解未受蛋白保护的RNA,可以获得Ago蛋白直接结合的RNA序列。,针对AGO蛋白的CLIP-seq技术能够在全基因组范围内鉴定与AGO蛋白结合的小RNA及其mRNA靶标。Chi,SW,Zang,JB,Mele,A,Darne
16、ll,RB.2009.Argonaute HITS-CLIP decodes microRNA-mRNA interaction maps.Nature.460:479-86。,Furthermore HITS-CLIP reads do not precisely pinpoint the position of crosslinking between the RNA and protein,and thus can only identify a targeted region(100-nt)as opposed to a specific target site.,2010年,Gene
17、 W.Yeo采用AGO-CLIPseq技术在线虫中鉴定了Argonaute的结合位点,发现其不仅结合mRNA的3UTR区域,也会结合编码外显子区域,还发现Argonaute大量结合的区域对于miRNA 的功能非常重要,揭示了其新的自我调控的功能。,要想获得检测区域被哪个miRNA调控,还需结合预测算法,五、整合已有知识预测miRNA靶基因,在当前的miRNA靶基因预测研究中,研究人员逐渐意识到单一依靠序列信息或表达信息已不能继续提高miRNA靶基因预测效能。整合功能信息、蛋白质互作信息、表达信息、序列信息以及当前实验证实的miRNA靶基因等已有资源预测miRNA靶基因十分必要。,miRNA靶点
18、优化算法,六、lncRNA概述及靶基因识别,lncRNA定义lncRNA特点lncRNA作用机制,Definition of lncRNA,Long non-coding RNAs(long ncRNAs,lncRNAs)are non-protein coding transcripts longer than 200 nucleotides(Perkel 2013).lncRNAs are transcripts that are 200 nucleotides in length and do not have the potential to encode for proteins e
19、xceeding lengths of 30 amino acids(Mercer TR.Nat.Rev.Genet.2009,Li X Med.Res.Rev.2012).,This somewhat arbitrary limit distinguishes long ncRNAs from small regulatory RNAs such as miRNAs,siRNAs,piRNAs,snoRNAs,and other short RNAs.,Large scale RNA-seqindicate that lncRNA number in the order of tens of
20、 thousands in mammals.9277 manually annotated genes producing 14880 transcripts(GENCODE v7).The number of protein coding genes in our genome has been revised downward multiple timeswhereas the number of known non protein coding transcripts has increased exponentially over the past decade.,Features o
21、f lncRNAs,Features of lncRNAs,lncRNAs are generated by the same transcriptional machinery as are other mRNAs lncRNAs are with similar histone-modification profiles,splicing signals.H3K4me3,H3K36me3lncRNAs are predominantly localized in the chromatin and nucleus,and a fraction appear to be preferenti
22、ally processed into small RNAs.,lncRNA expression,Tissue-specific lncRNAs expressed in the brain.,conservation,Many small RNAs,such as miRNAs or snoRNAs,exhibit strong conservation across diverse species(Bentwich 2005).In contrast,in general lncRNAs lack strong conservation,which is often cited as e
23、vidence of non-functionality(Brosius 2005;Struhl 2007).Despite low conservation of long ncRNAs in general,it should be noted that many long ncRNAs still contain strongly conserved elements,生化鉴定和功能研究尚处于起步阶段,目前仅有大约100多种已知功能的lncRNAs。As of December 2012,127 LncRNAs have been functionally annotated inLnc
24、RNAdb(a database of literature described LncRNAs)(Amral 2011).lncRNA通过表观遗传学调控、转录调控、转录后调控、蛋白活性调控等多种方式调控相关基因的作用,LncRNA as Scaffold for Transcription Repression,HOTAIR and PRC2,lncRNA as miRNA Decoy,Poliseno et al,Nat 2011,lncRNA研究存在的问题,lncRNA的定义 200nt,过于武断lncRNA的命名原则:目前根据功能、结构、作用方式等命名lncRNA相关数据库的内容不够全
25、,注释内容不够丰富,lncRNA生物学功能的阐明lncRNA功能预测的工具不多区分功能性和非功能性非编码转录本种类和功能复杂,使不同的lncRNA研究结果之间的借鉴意义并不高,七、ncRNA数据资源,ncRNA常用数据库,miRBase是一个集miRNA序列、注释信息以及预测的靶基因数据为一体的数据库,是目前存储miRNA信息最主要的公共数据库之一网址:http:/www.mirbase.org/,(一)miRBase数据库,TarBase是一个目前使用广泛的存储实验检测的miRNA与靶基因间关系的数据库,涵盖多种实验方法检测的超过65000个miRNA与靶基因关系对。其网址为:http:/d
26、iana.cslab.ece.ntua.gr/tarbase/,(二)TarBase数据库,TarBase数据库界面介绍,(三)microRNA.org数据库,microRNA.org数据库包含miRNA靶基因以及表达谱数据网址:http:/www.microrna.org/microrna/home.domiRNA靶基因数据主要是利用miRanda算法预测得来 miRNA表达谱数据来自一个针对人类主要器官和细胞系的小RNA库测序计划,(四)lncRNA相关数据库,因为lncRNA是一个非常新的研究领域,lncRNA在疾病中的作用的研究还是起步阶段,数据量还不够大,因此,相关的数据库也是处于起
27、步阶段,相关数据库还不多,也不够丰富。,第三节 非编码RNA多态和复杂疾病,Section 3 Non-coding RNA Polymorphisms and Complex Disease,miRNA多态(miRNA polymorphisms)是影响miRNA功能的多态,可能发生在miRNA形成和行使功能的任一个过程,以插入、删除、扩增或染色体异位的形式出现,最终导致miRNA绑定位点或者功能的缺失(获得),是人类基因组一类新的功能多态。不仅会影响miRNA的产生和表达,而且会影响miRNA与靶基因的结合从而影响靶基因的表达。,介绍,影响蛋白质参与miRNA合成与成熟,导致新的miRNA
28、生成和靶基因的调控。,一、位于miRNA基因内部影响miRNA生物学形成的多态,在染色体基因组水平上单个核苷酸变异引起的miRNA序列多态性对miRNA的转录、形成、输出和调控具有重要影响。,Saunders,M.A.等对人类474个miRNAs的SNPs进行系统的分析发现单核苷酸多态在miRNA序列内的密度低于其周围的侧翼序列。,49个pre-miRNA内存在65个SNPs位点,其中3个miRNAs的种子序列存在SNPs。,(一)位于pri/pre-miRNA基因序列内部,Saunders,M.A.和Duan等人利用生物信息学的方法研究发现在pri/pre-miRNA内部存在单核苷酸多态。位
29、于pri/pre-miRNA内部的多态会影响miRNA的表达,产生新的miRNA以及影响miRNA与靶基因的结合,甚至与疾病的风险相关。,1.影响miRNA的表达,Duan等人在研究miR-125时发现,该基因位点存在SNP,含有miR-125a-G/U两种等位,其中miR-125a-U能够显著影响DGCR8与pri-miRNA-125a的结合与剪接,使成熟的miR-125a生成减少,使miR-125a对靶基因Lin-128的翻译抑制作用减弱。,2.产生新的miRNA,miR-146a前体会产生miR-146a(正链)和miR-146a*(负链)两种miRNA。在miR-146a前体的茎环上存
30、在的SNP(rs2910164)不仅会影响miR-146a的表达,而且会导致miR-146a*C和miR-146a*G两种miRNA的产生。,(二)位于成熟的miRNA序列内部,成熟的miRNA与mRNA的3UTR区域结合对mRNA进行转录后调控。miRNA与mRNA结合的区域包括两部分:种子区域,这一部分区域要求与mRNA严格匹配;种子区域附近的3端方向,允许一定的程度的错配位于成熟miRNA序列的这些多态会影响对靶基因的调控,消除、弱化、增强或者产生新的结合靶点。,目前的研究发现,位于miRNA种子区域的多态不仅会影响靶结合位点,还影响miRNA的表达。例如位于miR-125a种子区域的多
31、态显著的抑制了pri/pre-miRNA过程,导致miRNA表达的减少。,二、miRNA靶点的多态,miRNA靶点的多态性靶基因上影响miRNA与靶基结合的序列多态性。这些多态性位点可以影响miRNA对靶基因表达的调控。越来越多研究发现与多种疾病的发病风险有关。,miRNA靶点多态可分为:miRNA结合位点上的多态性miRNA结合位点上下游的多态性,miRNA结合位点上(或上下游)的多态性与疾病,与疾病相关的miRNA结合位点上的多态性举例位于整联蛋白基因-4(IGBT-4)miRNA结合位点的SNP(rs743553)与乳腺癌发病密切相关(Brendle等)。位于GEMIN3基因miRNA结
32、合位点的SNP(rs197414)与膀胱癌发病密切相关(Yang等)。,位于靶点附近的多态位点可能会改变mRNA的二级结构从而影响miRNA与靶基因的结合;或影响miRNA与3UTR上其他调控元件的协同作用(间接影响)例如,HLA-G基因3UTR区的SNP影响miR-148a,miR-148b和miR-152与HLA-G结合,从而与哮喘的发病风险相关(Zheng等)。,五、lncRNA多态与复杂疾病,近些年,高通量技术(如GWAS,全基因组关联分析)已经确定大量和疾病相关的SNP。因此,如果该SNP是位于一个lncRNA上的话,很可能是该SNP影响了该lncRNA的功能,从而和疾病有关。,乳头
33、状甲状腺癌(papillary thyroid carcinoma,PTC)相关的风险SNP(rs944289)位于一个lncRNA(PTCSC3)的上游3.2kb处,这个风险SNP可以影响该lncRNA的表达,并阐明了这个SNP通过影响lncRNA功能导致乳头状甲状腺癌发生的致病机制。,例子,数据资源,miRNASNPmiRNA-related SNPs their potential target loss and gain informationdbSMR数据库http:/miracle.igib.res.in/polyreg/一个分析基因3UTR上的SNP对miRNA与靶点结合关系影响
34、的数据库。,PolymiRTS数据库http:/compbio.utmem.edu/miRSNP/整合了序列多态性位点数据、表型数据和基因表达谱数据,来挖掘潜在的可以用于解释表达数量性状位点和表型数量性状位点效应的miRNA靶基因的结合区域上的多态性位点,并把这些多态称作PolymiRTS。,lincSNP数据库简介,LincSNP是一个整合的数据库,为了识别和注释人类lncRNA上疾病相关的SNP而构建的全面的综合数据库。目前该数据库中包括大约140,000疾病相关的SNP,这些SNP位于大约5000个人类的lncRNA周围。这个数据库也包含了注释的,实验证实的SNP-lncRNA-疾病的关
35、联数据以及疾病相关的lncRNA数据,并提供了友好的界面和有效的工具获得疾病相关的SNP以及lncRNA。,LincSNP数据库(http:/,Ning,et al,BMC bioinformatics,2014,第四节 非编码RNA表达谱与复杂疾病,Section 4 Non-coding RNA Expression Profile and Complex Disease,癌症的本质归结为各种原因引起的基因结构和功能的异常,一、ncRNA表达谱识别癌症相关ncRNA,致癌基因的高表达抑癌基因的低表达,miRNA和lncRNA作为两类重要的基因调控子,其表达变化将会对靶基因的活动产生深远的影
36、响,复杂疾病的诊断和治疗研究中必定会引入miRNA及lncRNA,(一)miRNA表达谱,1.ncRNA的特征,低丰度、组织特异性、发育阶段特异性、疾病状态特异性,2.ncRNA表达检测技术,Northern印迹、克隆(cloning)、定量PCR扩增、SAGE技术、磁珠技术和寡核苷酸芯片技术、新一代测序技术,miRNA表达谱,microRNA芯片制作和分析流程,制作芯片,1.ncRNA表达数据来源,Gene Expression Omnibus(GEO)数据库、ArrayExpress 数据库、Sequence Read Archive(SRA),2.miRNA表达谱数据标准化 中值处理,m
37、RNA表达谱数据标准化方法并不能简单地应用于miRNA表达谱数据,目前仍没有统一有效的标准化方法可用于miRNA表达谱,small RNAseq library preparation(Directional),A pipeline for small RNA annotation(see in GED Galaxy),丰度数据(count)预处理,数据过滤-去除低质量的或噪声数据点,去除序列标签匹配性差的表达值重复数据合并 加和,代表同一个基因的标签的tag(或完全相同读段)的表达数目相加缺失数据的处理 一般不补缺失值,因为0是有意义的,可以发现某种条件下不表达的基因数据标准化 RPM(Re
38、ads Per Million reads),miRNA表达谱,M个miRNAN1个疾病样本、N2个正常样本,利用表达谱寻找复杂疾病相关miRNA,差异表达分析 寻找异常表达miRNAFold change、T-test、ANOVA、SAM等低通量实验证实,miRNA功能预测和病理假设miRNA表达的失调和许多复杂疾病相关,比如心血管类疾病和癌症等,miRNA与癌症,miRNA表达谱的基因组范围研究指出原发癌中存在miRNA的表达变化特异的miRNA表达谱与特定类型的癌症有关,提示其有用于诊断的潜能,癌症的本质归结为各种原因引起的基因结构和功能的异常致癌基因的高表达抑癌基因的低表达某些miRN
39、A作用靶基因是重要的癌通路组成部分,参与了癌基因网络调控,miRNA表达的变化认为是发生癌症的共同特征oncogenic miRNAs(oncomiRs),ProliferationInvasion metastasis Angiogenesis Apoptosis,OncogenicmiRNAs,Tumor SuppressormiRNAs,Cancer,表达降低,表达升高,mir-17-92 cluster as oncogenic miRNAs,mir-17-92 cluster is located at a amplified region DNA in B-cell lymphom
40、as.Here,we have shown that one miRNA polycistron is not only the subject of tumour-specific amplification,but that it is also overexpressed in tumours and tumour cell lines,and can act as an oncogene in vivo.A detailed,mechanistic understanding of how this non-coding RNA cluster acts as an oncogene
41、is at present hampered by the lack of a validated biochemical strategy for identifying miRNA targets.,mir-17-92 cluster as tumour suppressor,Loss-of-heterozygosity of the chromosomal region encompassing the mir-17 cluster(13q31)has been observed in human malignancies.Negative regulation of E2F1 tran
42、slation by miR-17-5p and miR-20a provides a mechanism to dampen this reciprocal activation,promoting tightly controlled expression of c-Myc and E2F1 gene products.It suggests that the mir-17 cluster,by decreasing E2F1 expression,tightly regulates c-Myc-mediated cellular proliferation.,It is thus lik
43、ely that these miRNAs influence cell proliferation and tumorigenesis in a cell-type specific manner,depending on the milieu of target mRNAs that are expressed.,与癌症相关的miRNA,Journal of Thoracic Oncology:December 2011-Volume 6,癌症中的ncRNA表达,ncRNA表达谱可作为特定癌症的表型标签癌症中的ncRNA表达变化是因还是果,需要对ncRNA功能的进一步研究,二、ncRNA表
44、达谱分类人类癌症,许多研究已经表明编码蛋白的转录本(mRNA)可以有效地区分各种癌症。这些与癌症相关的转录本作为一种可靠的生物学标记(biomark)已被广泛应用于各种癌症的分型研究。我们将采用Lu等人发表于2005年nature期刊miRNA表达谱数据来探索基于miRNA表达水平的癌症分类。,首先GEO数据库GSE2564获取所有相关数据,其中包括334个样本的原始miRNA表达数据,预处理后的miRNA表达数据,探针信息,样本信息等。该表达谱数据包含用两个芯片平台检测的334个样本的miRNA表达谱。所采用的预处理过程包括基于控制探针的标准化,修正表达强度偏低的探针,删除所有控制探针,以及
45、对表达值进行以2为底的对数转换。,采用层次聚类方法平均链路算法,皮尔森相关系数可以明显看出具有共同组织发育起源的样本被聚到一起。,除了上述所用到218个样本,该数据还包括了检测自73个急性淋巴细胞白血病患者骨髓样本的miRNA表达水平。,利用t检验方法对正常组织与肿瘤组织的miRNA表达水平进行比较,并使用随机扰动的方法为每个miRNA产生一个p值,最后对p值进行bonferroni校正。,2012年8月28日Genome Biology,斯坦福大学医学院研究人员进行首个大型的癌症lncRNA表达谱分析。对64个肿瘤样品高通量RNA-seq测序,在各种肿瘤类型之间找出差异表达的1065个lnc
46、RNA(图12-13)。因此lncRNA可以成为生物标志物。,图12-13 lncRNA表达谱分类人类癌症,Glioma gene expression data used in this study were obtained from the publicly available GEO.Affymetrix HG-U133 Plus 2.0 platform2448 lncRNA transcripts with corresponding Affymetrix probe IDsSignificance Analysis of Microarrays was used to deter
47、mine the differentially expressed lncRNAs2-fold,FDR10%,Differentially expressed lncRNA probe sets between normal brains and gliomas,A total of 129 lncRNA probe sets(corresponding to 102 lncRNAs)identified as significantly different between normal brain tissues and gliomas by SAM.,Blue-normal brain t
48、issues;yellow-glioma samples.,三、ncRNA表达谱与mRNA表达谱的整合分析,随着检测技术的不断发展,生物学资源的大量涌现,生物信息学研究者已经不仅仅局限于使用一种数据资源,表型数据,互作网络,表达数据,SNP,整合,整合多种类型的生物数据(如各种表达谱数据、互作网络、调控网络、SNP数据、表型数据等)来解决特定复杂的生物医学问题,剖析重大疾病相关miRNA的调控机制和功能,Target genes,miRNA,功能1,功能n,功能2,背景信息?,HITS-CLIP,It is clear that miRNAs have many different targe
49、ts dozens in some cases,hundreds in others but depending on the cells involved,it seems likely that only a small number of them have a crucial role in cancer pathogenesis.nature reviews genetics(2009),预测疾病背景下miRNA调控的靶基因,数据mRNA表达谱,miRNA表达谱,miRNA-mRNA靶向关系,皮尔森相关系数,A hub miRNA signature predicts surviva
50、l in glioma,前提假设miRNAs implicated in a specific tumor phenotype will show aberrant regulation of their target genesA key difference from other methods is that we identified dysregulated network edges(regulations)instead of dysregulated nodes(miRNAs)to assemble disease-related signatures.,miRNA famil