全部評(píng)論(1條)
-
- 飯桶877 2017-09-21 00:00:00
- 1,測(cè)序與序列比對(duì)(Sequence Alignment) 測(cè)序是生物信息學(xué)的基礎(chǔ)和主要數(shù)據(jù)來源,可以是人類數(shù)據(jù)也可以是其他的數(shù)據(jù)。序列比對(duì)的基本問題是比較兩個(gè)或兩個(gè)以上符號(hào)序列的相似性或不相似性.從生物學(xué)的初衷來看,這一問題包含了以下幾個(gè)意義:從相互重疊的序列片斷中重構(gòu)DNA的完整序列.在各種試驗(yàn)條件下從探測(cè)數(shù)據(jù)(probe data)中決定物理和基因圖存貯,遍歷和比較數(shù)據(jù)庫中的DNA序列比較兩個(gè)或多個(gè)序列的相似性在數(shù)據(jù)庫中搜索相關(guān)序列和子序列尋找核苷酸(nucleotides)的連續(xù)產(chǎn)生模式找出蛋白質(zhì)和DNA序列中的信息成分序列比對(duì)考慮了DNA序列的生物學(xué)特性,如序列局部發(fā)生的插入,刪除(前兩種簡(jiǎn)稱為indel)和替代,序列的目標(biāo)函數(shù)獲得序列之間突變集Z小距離加權(quán)和或Z大相似性和,對(duì)齊的方法包括全局對(duì)齊,局部對(duì)齊,代溝懲罰等.兩個(gè)序列比對(duì)常采用動(dòng)態(tài)規(guī)劃算法,這種算法在序列長(zhǎng)度較小時(shí)適用,然而對(duì)于海量基因序列(如人的DNA序列高達(dá)109bp),這一方法就不太適用,甚至采用算法復(fù)雜性為線性的也難以奏效.因此,啟發(fā)式方法的引入勢(shì)在必然,的BALST和FASTA算法及相應(yīng)的改進(jìn)方法均是從此前提出發(fā)的. 2, 蛋白質(zhì)結(jié)構(gòu)比對(duì)和預(yù)測(cè) 基本問題是比較兩個(gè)或兩個(gè)以上蛋白質(zhì)分子空間結(jié)構(gòu)的相似性或不相似性.蛋白質(zhì)的結(jié)構(gòu)與功能是密切相關(guān)的,一般認(rèn)為,具有相似功能的蛋白質(zhì)結(jié)構(gòu)一般相似.蛋白質(zhì)是由氨基酸組成的長(zhǎng)鏈,長(zhǎng)度從50到1000~3000AA(Amino Acids),蛋白質(zhì)具有多種功能,如酶,物質(zhì)的存貯和運(yùn)輸,信號(hào)傳遞,抗體等等.氨基酸的序列內(nèi)在的決定了蛋白質(zhì)的3維結(jié)構(gòu).一般認(rèn)為,蛋白質(zhì)有四級(jí)不同的結(jié)構(gòu).研究蛋白質(zhì)結(jié)構(gòu)和預(yù)測(cè)的理由是:醫(yī)藥上可以理解生物的功能,尋找dockingdrugs的目標(biāo),農(nóng)業(yè)上獲得更好的農(nóng)作物的基因工程,工業(yè)上有利用酶的合成.直接對(duì)蛋白質(zhì)結(jié)構(gòu)進(jìn)行比對(duì)的原因是由于蛋白質(zhì)的3維結(jié)構(gòu)比其一級(jí)結(jié)構(gòu)在進(jìn)化中更穩(wěn)定的保留,同時(shí)也包含了較AA序列更多的信息.蛋白質(zhì)3維結(jié)構(gòu)研究的前提假設(shè)是內(nèi)在的氨基酸序列與3維結(jié)構(gòu)一一對(duì)應(yīng)(不一定全真),物理上可用Z小能量來解釋.從觀察和總結(jié)已知結(jié)構(gòu)的蛋白質(zhì)結(jié)構(gòu)規(guī)律出發(fā)來預(yù)測(cè)未知蛋白質(zhì)的結(jié)構(gòu).同源建模(homology modeling)和指認(rèn)(Threading)方法屬于這一范疇.同源建模用于尋找具有高度相似性的蛋白質(zhì)結(jié)構(gòu)(超過30%氨基酸相同),后者則用于比較進(jìn)化族中不同的蛋白質(zhì)結(jié)構(gòu).然而,蛋白結(jié)構(gòu)預(yù)測(cè)研究現(xiàn)狀還遠(yuǎn)遠(yuǎn)不能滿足實(shí)際需要. 3, 基因識(shí)別,非編碼區(qū)分析研究. 基因識(shí)別的基本問題是給定基因組序列后,正確識(shí)別基因的范圍和在基因組序列中的精確位置.非編碼區(qū)由內(nèi)含子組成(introns),一般在形成蛋白質(zhì)后被丟棄,但從實(shí)驗(yàn)中,如果去除非編碼區(qū),又不能完成基因的復(fù)制.顯然,DNA序列作為一種遺傳語言,既包含在編碼區(qū),又隱含在非編碼序列中.分析非編碼區(qū)DNA序列目前沒有一般性的指導(dǎo)方法.在人類基因組中,并非所有的序列均被編碼,即是某種蛋白質(zhì)的模板,已完成編碼部分僅占人類基因總序列的3~5%,顯然,手工的搜索如此大的基因序列是難以想象的.偵測(cè)密碼區(qū)的方法包括測(cè)量密碼區(qū)密碼子(codon)的頻率,一階和二階馬爾可夫鏈,ORF(Open Reading Frames),啟動(dòng)子(promoter)識(shí)別,HMM(Hidden Markov Model)和GENSCAN,Splice Alignment等等. 4, 分子進(jìn)化和比較基因組學(xué) 分子進(jìn)化是利用不同物種中同一基因序列的異同來研究生物的進(jìn)化,構(gòu)建進(jìn)化樹.既可以用DNA序列也可以用其編碼的氨基酸序列來做,甚至于可通過相關(guān)蛋白質(zhì)的結(jié)構(gòu)比對(duì)來研究分子進(jìn)化,其前提假定是相似種族在基因上具有相似性.通過比較可以在基因組層面上發(fā)現(xiàn)哪些是不同種族中共同的,哪些是不同的.早期研究方法常采用外在的因素,如大小,膚色,肢體的數(shù)量等等作為進(jìn)化的依據(jù).近年來較多模式生物基因組測(cè)序任務(wù)的完成,人們可從整個(gè)基因組的角度來研究分子進(jìn)化.在匹配不同種族的基因時(shí),一般須處理三種情況:Orthologous: 不同種族,相同功能的基因;Paralogous: 相同種族,不同功能的基因;Xenologs: 有機(jī)體間采用其他方式傳遞的基因,如被病毒注入的基因.這一領(lǐng)域常采用的方法是構(gòu)造進(jìn)化樹,通過基于特征(即DNA序列或蛋白質(zhì)中的氨基酸的堿基的特定位置)和基于距離(對(duì)齊的分?jǐn)?shù))的方法和一些傳統(tǒng)的聚類方法(如UPGMA)來實(shí)現(xiàn). 5, 序列重疊群(Contigs)裝配 根據(jù)現(xiàn)行的測(cè)序技術(shù),每次反應(yīng)只能測(cè)出500 或更多一些堿基對(duì)的序列,如人類基因的測(cè)量就采用了(shortgun)方法,這就要求把大量的較短的序列全體構(gòu)成了重疊群(Contigs).逐步把它們拼接起來形成序列更長(zhǎng)的重疊群,直至得到完整序列的過程稱為重疊群裝配.從算法層次來看,序列的重疊群是一個(gè)NP-完全問題. 6, 遺傳密碼的起源 通常對(duì)遺傳密碼的研究認(rèn)為,密碼子與氨基酸之間的關(guān)系是生物進(jìn)化歷史上一次偶然的事件而造成的,并被固定在現(xiàn)代生物的共同祖先里,一直延續(xù)至今.不同于這種"凍結(jié)"理論,有人曾分別提出過選擇優(yōu)化,化學(xué)和歷史等三種學(xué)說來解釋遺傳密碼.隨著各種生物基因組測(cè)序任務(wù)的完成,為研究遺傳密碼的起源和檢驗(yàn)上述理論的真?zhèn)翁峁┝诵碌乃夭? 7, 基于結(jié)構(gòu)的藥物設(shè)計(jì) 人類基因工程的目的之一是要了解人體內(nèi)約10萬種蛋白質(zhì)的結(jié)構(gòu),功能,相互作用以及與各種人類疾病之間的關(guān)系,尋求各種ZL和預(yù)防方法,包括藥物ZL.基于生物大分子結(jié)構(gòu)及小分子結(jié)構(gòu)的藥物設(shè)計(jì)是生物信息學(xué)中的極為重要的研究領(lǐng)域.為了YZ某些酶或蛋白質(zhì)的活性,在已知其蛋白質(zhì)3級(jí)結(jié)構(gòu)的基礎(chǔ)上,可以利用分子對(duì)齊算法,在計(jì)算機(jī)上設(shè)計(jì)YZ劑分子,作為候選藥物.這一領(lǐng)域目的是發(fā)現(xiàn)新的基因藥物,有著巨大的經(jīng)濟(jì)效益. 8.生物系統(tǒng)的建模和仿真 隨著大規(guī)模實(shí)驗(yàn)技術(shù)的發(fā)展和數(shù)據(jù)累積,從全局和系統(tǒng)水平研究和分析生物學(xué)系統(tǒng),揭示其發(fā)展規(guī)律已經(jīng)成為后基因組時(shí)代的另外一個(gè)研究 熱點(diǎn)-系統(tǒng)生物學(xué)。目前來看,其研究?jī)?nèi)容包括生物系統(tǒng)的模擬(Curr Opin Rheumatol,2007,463-70),系統(tǒng)穩(wěn)定性分析(Nonlinear Dynamics Psychol Life Sci,2007,413-33),系統(tǒng)魯棒性分析(Ernst Schering Res Found Workshop, 2007,69-88)等方面。以SBML(Bioinformatics,2007,1297-8)為代表的建模語言在迅速發(fā)展之中,以布爾網(wǎng)絡(luò) (PLoS Comput Biol,2007,e163)、微分方程(Mol Biol Cell,2004,3841-62)、隨機(jī)過程(Neural Comput,2007,3262-92)、離散動(dòng)態(tài)事件系統(tǒng)等(Bioinformatics,2007,336-43)方法在系統(tǒng)分析中已經(jīng)得到應(yīng) 用。很多模型的建立借鑒了電路和其它物理系統(tǒng)建模的方法,很多研究試圖從信息流、熵和能量流等宏觀分析思想來解決系統(tǒng)的復(fù)雜性問題(Anal Quant Cytol Histol,2007,296-308)。當(dāng)然,建立生物系統(tǒng)的理論模型還需要很長(zhǎng)時(shí)間的努力,現(xiàn)在實(shí)驗(yàn)觀測(cè)數(shù)據(jù)雖然在海量增加,但是生物系統(tǒng)的模型辨 識(shí)所需要的數(shù)據(jù)遠(yuǎn)遠(yuǎn)超過了目前數(shù)據(jù)的產(chǎn)出能力。例如,對(duì)于時(shí)間序列的芯片數(shù)據(jù),采樣點(diǎn)的數(shù)量還不足以使用傳統(tǒng)的時(shí)間序列建模方法,巨大的實(shí)驗(yàn)代價(jià)是目前系 統(tǒng)建模主要困難。系統(tǒng)描述和建模方法也需要開創(chuàng)性的發(fā)展。 9.生物信息學(xué)技術(shù)方法的研究 生物信息學(xué)不僅僅是生物學(xué)知識(shí)的簡(jiǎn)單整理和、數(shù)學(xué)、物理學(xué)、信息科學(xué)等學(xué)科知識(shí)的簡(jiǎn)單應(yīng)用。海量數(shù)據(jù)和復(fù)雜的背景導(dǎo)致機(jī)器學(xué)習(xí)、統(tǒng) 計(jì)數(shù)據(jù)分析和系統(tǒng)描述等方法需要在生物信息學(xué)所面臨的背景之中迅速發(fā)展。巨大的計(jì)算量、復(fù)雜的噪聲模式、海量的時(shí)變數(shù)據(jù)給傳統(tǒng)的統(tǒng)計(jì)分析帶來了巨大的困難, 需要像非參數(shù)統(tǒng)計(jì)(BMC Bioinformatics,2007,339)、聚類分析(Qual Life Res,2007,1655-63)等更加靈活的數(shù)據(jù)分析技術(shù)。高維數(shù)據(jù)的分析需要偏Z小二乘(partial least squares,PLS)等特征空間的壓縮技術(shù)。在計(jì)算機(jī)算法的開發(fā)中,需要充分考慮算法的時(shí)間和空間復(fù)雜度,使用并行計(jì)算、網(wǎng)格計(jì)算等技術(shù)來拓展算法的 可實(shí)現(xiàn)性。 10, 生物圖像 沒有血緣關(guān)系的人,為什么長(zhǎng)得那么像呢? 外貌是像點(diǎn)組成的,像點(diǎn)愈重合兩人長(zhǎng)得愈像,那兩個(gè)沒有血緣關(guān)系的人像點(diǎn)為什么重合? 有什么生物學(xué)基礎(chǔ)?基因是不是相似?我不知道,希望專家解答。 11, 其他 如基因表達(dá)譜分析,代謝網(wǎng)絡(luò)分析;基因芯片設(shè)計(jì)和蛋白質(zhì)組學(xué)數(shù)據(jù)分析等,逐漸成為生物信息學(xué)中新興的重要研究領(lǐng)域;在學(xué)科方面,由生物信息學(xué)衍生的學(xué)科包括結(jié)構(gòu)基因組學(xué),功能基因組學(xué),比較基因組學(xué),蛋白質(zhì)學(xué),藥物基因組學(xué),中藥基因組學(xué),腫瘤基因組學(xué),分子流行病學(xué)和環(huán)境基因組學(xué),成為系統(tǒng)生物學(xué)的重要研究方法.從現(xiàn)在的發(fā)展不難看出,基因工程已經(jīng)進(jìn)入了后基因組時(shí)代.我們也有應(yīng)對(duì)與生物信息學(xué)密切相關(guān)的如機(jī)器學(xué)習(xí),和數(shù)學(xué)中可能存在的誤導(dǎo)有一個(gè)清楚的認(rèn)識(shí).
-
贊(5)
回復(fù)(0)
登錄或新用戶注冊(cè)
- 微信登錄
- 密碼登錄
- 短信登錄
請(qǐng)用手機(jī)微信掃描下方二維碼
快速登錄或注冊(cè)新賬號(hào)
微信掃碼,手機(jī)電腦聯(lián)動(dòng)
注冊(cè)登錄即表示同意《儀器網(wǎng)服務(wù)條款》和《隱私協(xié)議》
熱門問答
- 有沒有生物信息學(xué)領(lǐng)域的大神可以解釋下什么是基因本體
2017-09-20 06:00:43
514
1
- 如下哪個(gè)生物信息學(xué)方法可以用來尋找新基因
2016-12-28 23:19:15
321
1
- 求大神解釋下光柵衍射光強(qiáng)分布的圖是怎么形成的
2017-01-01 06:54:16
573
1
- 有沒有磨本體金相的好方法。
- 在工件上做金相。工件很大。十多噸。球鐵。不好制樣
2015-01-19 17:34:34
447
1
- 有能人嗎 解釋下,什么是labview
2017-03-15 10:29:30
398
2
- 解釋下虛擬內(nèi)存
- 解釋下虛擬內(nèi)存,?... 解釋下虛擬內(nèi)存,? 展開
2011-07-23 10:02:50
563
2
- 懂單相電度表的專業(yè)人士請(qǐng)解釋下什么是脈沖
- 看圖!我家新安裝的電度表,打開接線處的蓋子看到的,上面的脈沖“+”、“-”,是調(diào)節(jié)什么的?電度表的走速的快慢嗎?
2013-07-10 05:15:56
581
2
- 對(duì)一種疾病相關(guān)基因或其他感興趣的基因進(jìn)行生物信息學(xué)分析
- 提示:請(qǐng)?jiān)噲D利用已知的OR為查詢序列,發(fā)現(xiàn)其他五中的同源基因,對(duì)其進(jìn)行生物信息學(xué)分析(基因結(jié)構(gòu)、蛋白質(zhì)序列、蛋白質(zhì)二級(jí)結(jié)構(gòu)三級(jí)結(jié)構(gòu)的預(yù)測(cè),蛋白質(zhì)理化性質(zhì),同源基因的多序列對(duì)... 提示:請(qǐng)?jiān)噲D利用已知的OR為查詢序列,發(fā)現(xiàn)其他五中的同源基因,對(duì)其進(jìn)行生物信息學(xué)分析(基因結(jié)構(gòu)、蛋白質(zhì)序列、蛋白質(zhì)二級(jí)結(jié)構(gòu)三級(jí)結(jié)構(gòu)的預(yù)測(cè),蛋白質(zhì)理化性質(zhì),同源基因的多序列對(duì)比,系統(tǒng)發(fā)育樹構(gòu)建,基因表達(dá)情況分析)。 展開
2013-07-26 01:55:29
494
2
- 生物信息學(xué)的應(yīng)用
2010-12-22 15:53:15
384
2
- 光電池對(duì)入射光的波長(zhǎng)有何要求?求大神 詳細(xì)解釋下
2015-03-25 22:37:06
530
2
- 什么是標(biāo)準(zhǔn)氣體的不確定度,主要解釋下這個(gè)定義就可以了。
2011-11-28 14:10:14
586
1
- 在顯微鏡下觀察水中的微小生物,發(fā)現(xiàn)了什么?解釋是?
- 在顯微鏡下觀察水中的微小生物,發(fā)現(xiàn)了什么?解釋是?... 在顯微鏡下觀察水中的微小生物,發(fā)現(xiàn)了什么?解釋是? 展開
2011-03-30 07:55:23
772
2
- 幫忙解釋下吧
2017-08-27 06:09:13
271
2
- 零點(diǎn)能 誰解釋下
- 真空中存在零點(diǎn)能?詳細(xì)解釋下... 真空中存在零點(diǎn)能?詳細(xì)解釋下 展開
2007-08-17 08:00:57
554
3
- 220V可以進(jìn)DCS的DO,前提是DO是干接點(diǎn)輸出?幫忙解釋下
2016-09-21 16:52:38
502
1
- 通俗的解釋下:氫鍵是什么~~
2008-01-05 01:07:42
1845
5
- CODbd的定義 解釋下 謝謝
2011-11-09 20:33:50
533
1
- 什么是基因拷貝數(shù)
- 希望詳細(xì)明白的說明基因拷貝數(shù)的定義。Z好是專業(yè)人士來回答。希望能針對(duì)性的回答我的提問,不要復(fù)制無關(guān)內(nèi)容!文不對(duì)題!... 希望詳細(xì)明白的說明基因拷貝數(shù)的定義。 Z好是專業(yè)人士來回答。 希望能針對(duì)性的回答我的提問,不要復(fù)制無關(guān)內(nèi)容!文不對(duì)題! 展開
2007-04-16 07:12:16
2378
3
- 什么是基因克隆?
2017-11-25 12:37:59
347
1
4月突出貢獻(xiàn)榜
推薦主頁
最新話題





參與評(píng)論
登錄后參與評(píng)論