生物信息学

2020/1/12 18:52:43

背景[1-5]

生物信息学是生物学,计算机科学,信息工程,数学和统计学的综合学科,主要内容是使用生物算法和相关的软件工具采集、处理、存储、分析和解释生物数据。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。生物信息学已成为许多生物学领域的重要组成部分。

在实验分子生物学中,生物信息学技术如图像和信号处理可以从大量原始数据中提取有用的结果。在遗传学领域,它有助于测序和注释基因组及其观察到的突变。它在生物文学的文本挖掘和生物学基因本体的发展中起着重要作用。它还在基因和蛋白质表达和调节的分析中起着重要作用作用。生物信息学工具有助于比较遗传和基因组数据,更普遍地用于理解分子生物学的进化方面。

在更综合的层面上,它有助于分析和编目作为系统生物学重要组成部分的生物途径和网络。在结构生物学中,它有助于DNA,RNA,蛋白质的建模以及分析生物分子的相互作用。基本生物信息学服务按EBI分为三类:SSS(序列搜索服务),MSA(多序列比对)和BSA(生物序列分析)。

应用[6][7][8]

1. 基因序列分析

大多数DNA测序技术产生需要组装的短序列片段以获得完整的基因或基因组序列。这些片段的末端重叠,并且当通过基因组装配程序适当比对时,可用于重建完整的基因组。随着数据量的不断增加,很久以前人工分析DNA序列变得不切实际。今天计算机程序如BLAST每天用于从多于260个000有机体查询序列,含有超过190十亿个核苷酸。这些程序可以补偿DNA序列中的突变(交换,缺失或插入的碱基),以识别相关但不相同的序列。

1.1. DNA测序序列分析;

1.2. 基因组注释;

1.3.比较基因组学分析;

1.4.比较基因组学分析;

1.5.泛基因组学分析;

1.6.疾病遗传及癌症突变分析;

2.基因和蛋白质表达分析

2.1基因表达分析;

2.2蛋白质表达分析;

2.3表达信号通路分析

3.结构生物信息学

蛋白质的氨基酸序列,即所谓的一级结构,可以从编码它的基因上的序列容易地确定。在绝大多数情况下,该主要结构唯一地确定其原生环境中的结构。这种结构的知识对于理解蛋白质的功能至关重要。在生物信息学的结构分支中,同源性用于确定蛋白质的哪些部分在结构形成和与其他蛋白质的相互作用中是重要的。

在称为同源建模的技术中,一旦已知同源蛋白质的结构,该信息用于预测蛋白质的结构。这目前仍然是可靠地预测蛋白质结构的唯一方法。结构生物信息学的另一方面包括将蛋白质结构用于虚拟筛选模型,例如定量结构-活性关系模型和蛋白质化学模型(PCM)。

4. 网络和系统生物学

网络分析旨在了解生物网络中的关系,如代谢或蛋白质-蛋白质相互作用网络。尽管生物网络可以由单一类型的分子或实体(例如基因)构建,但网络生物学通常会尝试整合许多不同的数据类型,例如蛋白质,小分子,基因表达数据等。系统生物学涉及使用计算机模拟的蜂窝子系统也可以用人工智能或虚拟进化试图简单模拟其进化过程。

参考文献

[1] Lesk,A.M.(26 July 2013)."Bioinformatics".Encyclopaedia Britannica.Retrieved 17 April 2017.

[2] Sanger F,Air GM,Barrell BG,Brown NL,Coulson AR,Fiddes CA,Hutchison CA,Slocombe PM,Smith M(February 1977)."Nucleotide sequence of bacteriophage phi X174 DNA".Nature.265(5596):687–95.Bibcode:1977Natur.265.687S.

[3] Benson DA,Karsch-Mizrachi I,Lipman DJ,Ostell J,Wheeler DL(January 2008)."GenBank".Nucleic Acids Res.36(Database issue):D25–30.doi:10.1093/nar/gkm929.PMC 2238942.PMID 18073190.

[4] Grau,J.;Ben-Gal,I.;Posch,S.;Grosse,I.(1 July 2006)."VOMBAT:prediction of transcription factor binding sites using variable order Bayesian trees"(PDF).Nucleic Acids Research.34(Web Server):W529–W533.

[5] "The Human Protein Atlas".www.proteinatlas.org.Retrieved 2017-10-02.

[6] Nisbet,Robert(14 May 2009)."BIOINFORMATICS".Handbook of Statistical Analysis and Data Mining Applications.John Elder IV,Gary Miner.Academic Press.p.328.ISBN 9780080912035.Retrieved 9 May 2014.

[7] Fleischmann RD,Adams MD,White O,Clayton RA,Kirkness EF,Kerlavage AR,Bult CJ,Tomb JF,Dougherty BA,Merrick JM(July 1995)."Whole-genome random sequencing and assembly of Haemophilus influenzae Rd".Science.269(5223):496–512.Bibcode:1995Sci.269.496F.

[8] Carter,N.P.;Fiegler,H.;Piper,J.(2002)."Comparative analysis of comparative genomic hybridization microarray technologies:Report of a workshop sponsored by the Wellcome trust".Cytometry Part A.49(2):43–8.

免责申明 ChemicalBook平台所发布的新闻资讯只作为知识提供,仅供各位业内人士参考和交流,不对其精确性及完整性做出保证。您不应 以此取代自己的独立判断,因此任何信息所生之风险应自行承担,与ChemicalBook无关。如有侵权,请联系我们删除!
阅读量:2445 0

欢迎您浏览更多关于生物信息学的相关新闻资讯信息

生物信息学 2020/01/12