基于全基因组信息鉴定中国荷斯坦牛产奶性状基因及功能注释.doc

上传人:文库蛋蛋多 文档编号:3925545 上传时间:2023-03-28 格式:DOC 页数:8 大小:106KB
返回 下载 相关 举报
基于全基因组信息鉴定中国荷斯坦牛产奶性状基因及功能注释.doc_第1页
第1页 / 共8页
基于全基因组信息鉴定中国荷斯坦牛产奶性状基因及功能注释.doc_第2页
第2页 / 共8页
基于全基因组信息鉴定中国荷斯坦牛产奶性状基因及功能注释.doc_第3页
第3页 / 共8页
基于全基因组信息鉴定中国荷斯坦牛产奶性状基因及功能注释.doc_第4页
第4页 / 共8页
基于全基因组信息鉴定中国荷斯坦牛产奶性状基因及功能注释.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《基于全基因组信息鉴定中国荷斯坦牛产奶性状基因及功能注释.doc》由会员分享,可在线阅读,更多相关《基于全基因组信息鉴定中国荷斯坦牛产奶性状基因及功能注释.doc(8页珍藏版)》请在三一办公上搜索。

1、发表于:畜牧兽医学报, 43(6):872-877, 2012.基于全基因组信息鉴定中国荷斯坦牛产奶性状基因及功能注释齐 超1,谢 岩1,吴晓平1,姜 力1,刘剑锋1,孙东晓1*,张 勤1,张 沅1(1中国农业大学动物科技学院,北京 100193)摘 要:(目的)课题组前期研究基于中国荷斯坦牛女儿设计资源群体,采用Illumina公司Bovine50K微珠芯片对产奶性状进行了全基因组关联分析(GWAS),利用传递不平衡(L1-TDT)和回归分析(MMRA)两种统计分析方法共同检测到35个显著SNP位点,本研究旨在基于该GWAS结果进一步对产奶性状基因进行鉴定及功能注释。(方法)基于牛基因组序列

2、草图(Btau4.2),采用生物信息学和比较基因组学方法进行显著SNPs位置候选基因筛查和功能预测。(结果)分析发现,12个SNP位点位于基因内部,23个位于基因侧翼,最终鉴定到28个位置候选基因并确定了其物理位置、基因类型及潜在功能。基因功能可归纳为7种类型:调节机体营养成分代谢和平衡、细胞骨架或基质成分、调节细胞增殖和周期及凋亡、参与细胞信号转导和盐离子通道构成、具有激酶活性和参与mRNA转录调控。(结论)该研究为进一步鉴定中国荷斯坦牛产奶性状主效基因及功能验证打下了基础。关键词:中国荷斯坦牛;全基因组关联分析;产奶性状;功能注释中图分类号: 文献标识码:A 文章编号:Identifica

3、tion and Annotation of Genes Affecting Milk Production Traits in Chinese Holstein Based on GWASAbstract: (Objective) Our previous genome-wide association studies (GWAS) with Illumina Bovine50K chip have identified 35 significant SNPs associated with one or multiple milk production traits in a Chines

4、e Holstein population from Beijing region with daughter design. The purpose of this study was to determine potential genes affecting milk yield and milk composition and function annotation based on such GWAS results. (Methods) Through bioinformation and comparative analysis, potential genes and func

5、tion prediction were performed. (Results) We found that 12 of 35 significant SNPs were located within genes and 23 were in the flanking region based on Btau 4.2 database. As a result, total 28 genes corresponding to the aforementioned 35 SNPs were determined. The functions of such genes were classif

6、ied into 7 categories, including regulate body metabolism and nutrient balance; cytoskeleton or extracellular matrix, regulation of proliferation, cell cycle and apoptosis; cell signal基金项目: 国家自然科学基金(31072016)、国家科技支撑项目(2011BAD28B02)、农业部948项目(2011-G2A)、转基因生物新品种培育重大专项(2009ZX08009-156B)和教育部新世纪优秀人才支持计划资助

7、。第一作者简介:齐超(1986-),男,山东商河县人,硕士,Tel:010-62732768,Email: lssqc;谢岩(1985-),女,河北兴隆县人,硕士,Tel:010-62732768,Email: xiey.300822。*通讯作者:孙东晓,女,教授,博导, E-mail:sundx。transduction and saltion channel composition; kinase activity; mRNA transcription and translation regulation. (Conclusion) Our findings could be usefu

8、l for further investigations on gene identification and function validation for milk production traits in dairy cattle.Key words:Chinese Holstein; GWAS; milk product trait; function annotation模拟研究证明实施标记辅助选择以进行青年公牛预选可加快奶牛产奶性状遗传进展1,但标记辅助选择的前提是产奶性状主效基因的挖掘和鉴定。过去十几年中,产奶性状QTL(quantitative trait locus)定位研究

9、已取得了显著进展。大量研究显示奶牛的29条常染色体上几乎均有对奶牛乳脂量、乳蛋白量、乳脂率、乳蛋白率等产奶性状具有较大效应的主效基因存在27。但是,在这些所检测的主效基因染色体区段,究竟包括哪些影响乳脂和乳蛋白代谢的功能基因及其作用机理,目前国际上尚无明确定论,迄今为止只有位于14和20号染色体上的DGAT1和GHR被证明是产奶性状主效基因8。而大部分基因定位结果仍然只是将基因定位在一个较大的区间之内,不足以进行可操作性的位置候选克隆分析。近几年,全基因组关联分析(most recently, genome-wide association studies,GWAS) 日益成为复杂性状基因鉴定

10、的有效策略,在人类、小鼠和畜禽中已有很多应用915。在奶牛上,作者所在课题组基于女儿设计中国荷斯坦牛资源群体,采用美国Illumina公司的牛高密度SNP微珠芯片(BovineSNP50 BeadChip)对产奶性状进行了全基因组关联分析,共检测到105个SNPs与单个或多个产奶性状基因组水平显著相关,其中35个SNP位点由基于家系传递不平衡(L1-TDT)和基于混合模型回归分析(MMRA)两种方法同时检测到16。本研究旨在基于前期中国荷斯坦牛产奶性状GWAS结果,进一步对产奶性状功能基因进行位置候选鉴定及功能注释,为产奶性状主效基因鉴定及功能验证提供研究基础。1. 材料与方法1.1 前期GW

11、AS结果本课题组前期的全基因组关联分析(GWAS)利用牛高密度BovineSNP50芯片(Illumina USA)。基于中国荷斯坦牛女儿设计资源群体,包括14个公牛半同胞家系的共计2093头中国荷斯坦母牛,每个公牛家系女儿数为83358。牛只来自北京地区三元绿荷奶牛养殖中心下属35个奶牛场。产奶性状DHI数据及估计育种值(EBV)由北京奶牛中心提供。通过质控,共计1815个体和40220个SNPs位点用于GWAS分析。使用基于家系传递不平衡(L1-TDT)与基于混合模型的回归分析(MMRA)两种统计分析方法对单标记与产奶性状进行关联分析,Bonferroni校正P值。显著SNP位点筛选标准为

12、:TDT方法的P23.4。与产奶量、乳脂量、乳蛋白量、乳脂率和乳蛋白率性状显著关联的SNPs数目分别为8、1、5、32和8个,见表1。表1 TDT与MMRA方法检测得到的显著SNP数目Table 1 Number of significant SNPs based on TDT and MMRA methods统计方法Statistical method产奶量Milk yield乳脂量Fat yield乳蛋白量Protein yield乳脂率Fat percentage乳蛋白率Protein percentage总计TotalL1-TDT1015361243MMRA189206027101总计

13、待添加的隐藏文字内容1815328351.2 生物信息学和比较基因组学分析将显著SNP位点上下游各60 bp碱基序列与UCSC(http:/genome.ucsc.edu/)和NCBI(www.ncbi.nlm.nih.gov)网站数据库中牛BTAU4.0基因组序列数据集进行比对,确定各SNP的物理位置。根据NCBI(www.ncbi.nlm.nih.gov)和Ensembl(www.ensembl.org)数据库中牛基因组序列草图,推断SNP位点所在或最临近基因。通过搜索牛、人类和小鼠的同源序列,根据NCBI、Ensembl、Uniprot(www.uniprot.org)、KEGG(www

14、.genome.jp/ KEGG/)、GeneCards(www.genecards.org)和维基(www.wikipedia.org)等网站信息,对每个基因进行功能注释。2. 结果2.1位置候选基因鉴定前期GWAS研究基于家系传递不平衡(L1-TDT)与混合模型回归分析(MMRA)两种统计方法共同检测得到35个显著SNP位点。其中,34个SNPs位于第11号(1个)、14号(30个)和20号(3个)染色体上;1个SNP(ARS-BFGL-NGS-18858)的染色体定位未知。通过生物信息学和比较基因组学分析发现:35个显著SNP位点中,12个位于基因内含子区域;23个位于基因侧翼区域,其中

15、19个SNPs与相邻基因的距离小于100 kb (9个基因的距离小于10 kb),1个SNP(Hapmap30383-BTC-005848)距离C14H8orf33基因仅87 bp。由于存在多个SNP位点指向相同基因,本研究最终确定了28个位置候选基因,其中26个基因为蛋白质编码类基因,1个基因为micRNA基因(MIRN30D),1个为假基因(LOC786966)。 2.2基因功能注释通过生物信息学和比较基因组学分析,对上述28个基因进行了功能注释。发现其中4个基因(对应6个SNPs)无相关功能信息;另外24个基因具有功能信息,其功能注释可分为7类:调节机体营养成分代谢和平衡、细胞骨架或基质

16、成分、调节细胞增殖和周期及凋亡、参与细胞信号转导和盐离子通道构成、具有激酶活性、参与mRNA转录调控、运输或脂肪颗粒蛋白转导及转录和翻译调控。24个基因的染色体定位及功能信息见表2。表2 24个位置候选基因的信息Table 2 Information of 24 genes identified in this studySNP名称Name1显著性状Traits染色体Chr鉴定基因Identified gene距离Distance功能FunctionARS-BFGL-NGS-18858乳脂率未知LOC5299195052 bp蛋白序列推定假定基因BFGL-NGS-119907乳脂率11GFI1

17、B3773 bp编码独立生长因子1B;能与 核酸结合,金属离子结合,核酸结合;是红细胞系和巨核细胞系生成和分化过程的重要转录因子 Hapmap30381-BTC-005750乳脂率14C14H8orf3323701 bp编码C8orf33 homolog蛋白Hapmap30383-BTC-005848产奶量,乳蛋白量,乳蛋白率14C14H8orf3387 bpBTA-34956-no-rs乳脂率14ZNF73479 bp编码锌指蛋白7;参与转录调控;能与DNA结合,锌离子结合ARS-BFGL-NGS-57820产奶量 乳蛋白量 乳蛋白率 乳脂率14FOXH13396 bp编码叉头框H1蛋白;一

18、种转录因子,与Smad蛋白一起在生物早期发育过程中通过TGF-b信号通路调节蛋白质的表达ARS-BFGL-NGS-34135产奶量, 乳脂率,乳蛋白率14CYHR1within编码半胱氨酸和组氨酸丰富蛋白1;能与金属离子结合,激活泛素-蛋白连接酶ARS-BFGL-NGS-94706乳脂量,乳脂率,乳蛋白率14VPS28within编码膜泡蛋白28;ESCRT- I复合物组成成分;参与蛋白泛素化负调控,蛋白运输; ARS-BFGL-NGS-4939产奶量,乳蛋白量乳脂率,乳蛋白率14DGAT1160 bp编码甘油二脂酰转移酶1;甘油三脂最终合成的关键酶Hapmap52798-ss46526455

19、乳脂率14MAF1within编码RNA聚合酶III 的一种负调控因子;依据细胞环境变化表达,抑制RNA聚合酶III转录ARS-BFGL-NGS-71749乳脂率14OPLAH3237 bp编码5-氧-脯氨酸;参与谷胱甘肽的代谢过程,催化5-氧-L-脯氨酸分离形成藕合的L-谷氨酸盐伴随ATP水解为ADP. ARS-BFGL-NGS-107379产奶量,乳蛋白量乳脂率,乳蛋白率14LOC786966460 bp蛋白序列推定假定基因ARS-BFGL-NGS-18365乳脂量14EPPK115242 bp编码外血小板溶素1。蛋白结合,细胞骨架成分,属于结构分子BTA-35941-no-rs乳脂量14

20、ZNF6238779 bp编码锌指蛋白623;能与核酸结合,锌指结合ARS-BFGL-NGS-26520乳脂量14ZC3H3within编码锌指CCCH域携带蛋白3;能与核酸结合,锌离子结合UA-IFASA-6878产奶量,乳脂量14GRINA15662 bp编码谷氨酸受体相关蛋白1Hapmap25486-BTC-072553乳脂率14GMLwithin编码糖基化磷脂酰肌醇锚定分子样蛋白;可能参与DNA损伤后TP53/p53引起的凋亡或细胞周期调控Hapmap29758-BTC-003619乳脂率14CYP11B136652 bp编码糖基化磷脂酰肌醇锚定高密度脂蛋白结合蛋白1;参与乳糜微粒加工

21、,并在将油脂营养成分传递到细胞的过程中发挥重要作用Hapmap30086-BTC-002066产奶量,乳脂率14GLI41776 bp编码锌指蛋白GLI4;能与DNA结合,金属离子结合Hapmap30374-BTC-002159乳脂率14RHPN1within编码GTP-Rho-结合蛋白1;GTP酶调控激活,参与Rho相关的信号转导ARS-BFGL-NGS-22111乳脂率14EIF2C225806 bp编码AGO-2蛋白;能与RNA 7-甲基鸟甘帽子结合,包含PAZ 和PIWI域,可能与Dicer1互作参与小干扰RNA介导的基因沉默,参与蛋白生物合成。UA-IFASA-7269乳脂率14EI

22、F2C22769 bpARS-BFGL-NGS-100480产奶量,乳蛋白量,乳脂率14TRAPPC9within编码运输蛋白微粒复合物9;随IKK复合物磷酸化作为NF-kappa-B激活剂,参与内质网到高尔基体的囊泡转移和神经细胞的分化Hapmap27703-BTC-053907乳脂率14TRAPPC9withinUA-IFASA-6329乳脂率14COL22A19864 bp编码胶原XXII型1蛋白;是皮肤上皮细胞和成纤维细胞的细胞一种粘附基质ARS-BFGL-NGS-3571乳脂率14COL22A1withinBFGL-NGS-110563乳脂率14COL22A184554 bpHapm

23、ap27709-BTC-057052乳脂率14LOC10013844038554 bp编码核酸内切酶逆转录酶类似物(根据逆转录得到基因序列)Hapmap30988-BTC-056315乳脂率14LOC100138440374566 bpHapmap32234-BTC-048199乳脂率14KHDRBS3124471 bp编码KH域携带,RNA结合,信号转导相关蛋白3;属于RNA-结合蛋白,可调节可变剪接和影响mRNA剪接位点的选择,可能对细胞生长和增殖有负调控作用UA-IFASA-6647乳脂率14KHDRBS3withinARS-BFGL-BAC-8730乳脂率14MIRN30D221420

24、 bp编码miscRNA;识别目标mRNA和并导致目标mRNA转录抑制或使其不稳定BFGL-NGS-118998乳蛋白率20GHRwithin编码生长激素受体蛋白;可与生长激素结合,在动物生长、发育等代谢过程中起重要作用BTB-00778154乳蛋白率20C910219 bp 编码补体元件9;C9是免疫受体的MAC成孔亚基,MAC通过在靶细胞质膜上形成微孔而在先天免疫和适应性免疫反应中发挥重要作用。BTB-00778141乳蛋白率20FYB35360 bp编码FYN结合蛋白;是T细胞中FYN and LCP2信号级联反应的接头蛋白,调节IL-2d的表达等免疫过程。3. 讨论本研究首次基于全基因

25、组关联分析结果对中国荷斯坦牛产奶性状位置候选基因进行了系统筛查和功能注释。生物信息学分析发现显著SNPs的位置分布规律为:内含子(12;34.3),基因间隔区(23;65.7),编码区且错义突变(0;0),编码区且同义突变(0;0),5或3非翻译区(0;0)。只有12个SNPs位于基因内部,且均为内含子区,占显著SNPs位点总数的34.3%。这是因为,商业化SNP芯片开发尽量考虑了SNP标记的平均分布并尽量避免SNP位于外显子(此外,大多数显著标记(33个)位于基因间隔区或内含子,均不能直接调控基因表达或改变氨基酸序列和蛋白质结构。而且,从功能注释结果可以看出,绝大多数位置候选基因参与基本的生

26、物学功能,难以判断其是否参与泌乳过程或影响产奶性状形成,只能推测具备运输或脂肪颗粒蛋白转导及转录和翻译调控功能的基因可能与乳脂和乳蛋白合成有关。该结果与人类及鸡、猪重要性状GWAS研究结果类似18,19。其原因可能是目前畜禽基因组数据库信息仍不够充分,或芯片SNP标记密度不足够大(60 kb左右)及分布不均匀20。因此,还需开展更多基因功能研究充实现有数据库,采用更高密度SNP芯片进行基因鉴定以及采用基因表达、RNA干扰和细胞转染等功能基因组手段提供更多试验证据,最终鉴定奶牛产奶性状功能基因并进行功能验证。4. 结论本研究基于课题组前期GWAS研究结果,针对35个显著SNP位点,通过生物信息学

27、和比较基因组学方法进行了基因鉴定和功能注释,最终确定了28个位置候选基因,其功能可归纳为7类:调节机体营养成分代谢和平衡、细胞骨架或基质成分、调节细胞增殖和周期及凋亡、参与细胞信号转导和盐离子通道构成、具有激酶活性、参与mRNA转录调控、运输或脂肪颗粒蛋白转导及转录和翻译调控。为进一步鉴定中国荷斯坦牛产奶性状主效基因及功能验证打下了基础。主要参考文献:1Khatkar MS, Thomson PC, Tammen I, et al. Quantitative trait loci mapping in dairy cattle: review and meta-analysis J. Gene

28、t. Sel. Evol., 2004, 39:163-190.2Georges M, Nielsen D, Mackinnon M, et al. Mapping quantitative trait loci controlling milk production in dairy cattle by exploiting progeny testing J.Genetics,1995,139:907-920.3Zhang Q, Boichard D, Hoeschelea I, et al. Mapping quantitative trait Loci for milk product

29、ion and health of dairy cattle in a large outbred pedigree J. Genetics, 1998, 149:1959-1973.4Bovenhuis H, Schrooten C. Quantitative trait loci for milk production traits in dairy cattle C. Proceedings of the 7th World Congress on Genetics Applied to Livestock Production, 2002, 9:0-8. 5Viitala SM, Sc

30、hulman NF, Koning DJ, et al. Quantitative trait loci affecting milk production traits in Finnish Ayrshire dairy cattle J. J Dairy Sci., 2003, 86:1828-36.6Khatkar MS, Thomson PC, Tammen I, et al. Quantitative trait loci mapping in dairy cattle: review and meta-analysis J. Genet. Sel. Evol., 2004, 39:

31、163-190.7Schopen GCB, Koks PD, Arendonk JAMV, et al. Whole genome scan to detect quantitative trait loci for bovine milk protein composition J. Anim. Genet., 2009, 40(4):524537.8Sun DX, Jia J, Ma Y, et al. Effects of DGAT1 and GHR on milk yield and milk composition in the Chinese dairy population J.

32、 Anim. Genet., 2009, 40:9971000.9Sladek R, Rocheleau G, Rung J, et al. A genome-wide association study identifies novel risk loci for type 2 diabetes J. Nature, 2007, 445:881-88510Duijvesteijn N, Knol EF, Merks JWM, et al. A genome-wide association study on androstenone levels in pigs reveals a clus

33、ter of candidate genes on chromosome 6 J. Genetics, 2010, 11:42.11 Abasht B, Lamont SJ. Genome-wide association analysis reveals cryptic alleles as an important factor in heterosis for fatness in chicken F2 population J. Anim. Genet., 2007, 38:491498.12Su WL, Sieberts SK, Kleinhanz RR, et al. Assess

34、ing the prospects of genome-wide association studies performed in inbred mice J. Mamm. Genome, 2010,21:143-152.13Snelling WM, Allan MF, Keele JW, et al. Genome-wide association study of growth in crossbred beef cattle J. Anim. Sci., 2010, 88:837-848.14Pausch H, Flisikowski K, Jung S, et al. Genome-w

35、ide association study identifies two major loci affecting calving ease and growth-related traits in cattle J. Genetics Society of America, 2011, 187:289297.15Mai MD, Sahana G, Christiansen FB, et al. A genome-wide association study for milk production traits in Danish Jersey cattle using a 50K singl

36、e nucleotide polymorphism chip J. J Anim Sci., 2010, 88:3522-3528.16Jiang L, Liu JF, Sun DX, et al. Genome wide association studies for milk production traits in Chinese Holstein population J. PLoS ONE, 2010, 5: e13661.17Matukumalli LK, Lawley CT, Schnabel RD, et al. Development and characterization

37、 of a high density SNP genotyping assay for cattle J. PLoS ONE, 2009, 4:e5350.18Manolio T A, Collins FS, Cox NJ, et al. Finding the missing heritability of complex disease J. Nature, 2009, 461:747-753.19Hindorff LA, Sethupathy P, Junkins HA, et al. Potential etiologic and functional implications of genome-wide association loci for human diseases and traits J. Proc. Natl. Acad. Sci. USA, 2009, 106:9362-9367.20Fan B, Du ZQ, Gorbach DM, et al. Development and application of high-density SNP arrays in genomic studies of domestic animals J. Asian-Aust. J. Anim. Sci, 2010, 23:833847.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号