<noframes id="ixm7d"><noframes id="ixm7d"><rt id="ixm7d"><delect id="ixm7d"></delect></rt><noframes id="ixm7d"><rt id="ixm7d"><rt id="ixm7d"></rt></rt><rt id="ixm7d"></rt> <noframes id="ixm7d"><rt id="ixm7d"><delect id="ixm7d"></delect></rt><delect id="ixm7d"></delect><bdo id="ixm7d"></bdo><rt id="ixm7d"></rt><bdo id="ixm7d"></bdo><noframes id="ixm7d"><rt id="ixm7d"><rt id="ixm7d"></rt></rt><rt id="ixm7d"><rt id="ixm7d"></rt></rt><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><rt id="ixm7d"></rt> <noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><noframes id="ixm7d"><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><noframes id="ixm7d"><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d">

生物信息學論文范文

2023-03-03

生物信息學論文范文第1篇

[摘 要]計算機技術的發展在很大程度上促進了生物信息學的發展。本文基于生物信息學理論,對生物信息學中計算機技術的應用情況和存在問題等進行了深入的分析和探討,同時還強調了在生物信息學研究中引入數據挖掘等計算機技術的必要性,為生物信息學的教學和科研工作提供支持。

[關鍵詞]生物信息學;計算機科學;應用

doi:10.3969/j.issn.1673 - 0194.2017.20.092

隨著人類基因計劃的啟動而興起的學科就是生物信息學,它屬于新興的交叉學科。主要是以計算機為工具,研究DNA和其編碼的大分子蛋白質,通過各種軟件來分析、研究、整理、收集、儲存蛋白質結構、序列和日益增長的DNA,可以更好地了解生命的遺傳、起源和發育等問題。生物信息學在當前數據量呈幾何級數增長的情況下,需要充分依賴計算機科學的發展。生物信息的獲取、存儲和處理需要應用大量的數據信息,這就對軟件、算法和理論提出了新的挑戰和要求。

1 生物信息學研究中計算機技術的應用現狀分析

生物信息學和計算機科學及其應用間存在著很大的聯系,分子生物學可以通過計算機系統獲得高性能的計算平臺。計算機系統可以為分子生物學提供可供操作的計算平臺,同時還能夠為其提供良好的網絡應用環境和高帶寬的分布式計算,分子生物學應用軟件及工具的設計和開發與軟件工程和算法研究有著直接的關系,生物學的檢索和存儲能通過數據庫得到保證。此外,對DNA或者蛋白質分子可以通過圖像處理技術和計算機圖形學理論來進行三維建模,這也是很好的一個應用方向,因為如果僅僅是基因測序,測得的也就是基因中的核苷酸排列的一些線性的信息,還需要將其三維結構弄清楚,以便提供更多的功能信息給研究人員,因為不同的蛋白質分子,其功能也存在很大的差異。國外在這方面的研究發展較快,各種的生物信息部門也在日趨增多。當前,美國、歐洲和日本是蛋白質數據庫和大多數核酸數據庫的所在地,他們能共享數據庫,進行數據交流和更新。其他的一些國家,比如法國、德國和澳大利亞等在資源共享的同時,也將自己的專業數據庫建立起來,以便更好地進行開發和研究,這其中有很大一部分服務是面向全世界的。我國當前對生物信息學的研究已經取得了一定的成績,甚至有的在國際上也占據了一席之地。但是,和國際水平相比,明顯存在較大差距。

2 生物信息學研究面臨的問題

2.1 專業人才匱乏

當前,對于專業人才的需求日益增加,但是全世界范圍內的專業人才培訓中心也只有幾十個,同時這些培訓中心自身還處于惡性循環中,很多經過培訓的人才受到高薪誘惑加入了工業部門。因此,培訓教育人員的數量日趨減少,甚至出現了斷層的情況。對于生命科學工作者來說,分析蛋白質和核酸序列的常規策略是其必須掌握的一項基本技能,但是如果缺乏必要的計算機知識,生物信息學家就很難深入研究生物信息學。另外,隨著計算機科學的不斷發展,如何讓其在生物信息學中更好地發揮出作用,成為了開發人員和計算機研究人員需要面臨的難題。對于生物信息學來說,在其發展的過程中首先需要具備高素質的人才,一旦缺乏人才,它的發展勢必會受到限制。

2.2 投資力度不足

生物信息學雖然已經得到了初步的發展,但是與之相配套的一些工具、設備和人才等不到位,出現這種情況的最主要原因就是沒有充足的資金。很多科研機構雖然已經得到了部分資金投入,但是仍然抱怨投入的資金不到位,政府的資金投入力度不夠大,紛紛要求政府加大資金投入。政府雖然加大了對生物信息學的資金投入,但是要想讓生物信息學研究始終處于非常完備的狀態,在短時間內是做不到的。

2.3 商業競爭激烈

生物信息學產生的社會效益和經濟效益是非常巨大的,特別是將該項研究應用于農業食品、醫療衛生和生命科學中,所帶來的影響將是非常深遠的,因此具有不可估量的商業價值。國際上很多生物工程公司和藥業公司都進軍該領域,因此各個商業機構間存在著激烈的競爭,在之后的商業研發和應用方面還會出現更加激烈的市場競爭。

3 加強計算機技術在生物信息學研究中應用的對策

3.1 培養專業人才

對于生物信息學來說,它在發展中最需要的就是專業人才。因此,需要先將人才問題解決,這樣才能將我國基因工程和人力資源的優勢發揮出來,根據我國生物信息學當前的發展現狀,制定出符合我國國情的長期戰略規劃。將和計算機科學發展相關的學科發展起來,可以聯合各大院校將一些亟待解決的問題解決掉。在高校計算機專業中可以將生物信息學單獨設立出來,或者直接設置和生物信息相關的專業,對相關課題進行研究,這樣便于培養出專業的綜合性人才。

3.2 加大資金的投入力度

國家可以將專門的行政組織機構設立起來,這樣可以更好地研究生物信息學。根據當前的實際情況和我國的戰略規劃來提報和撥付相應的資金。將完整的激勵措施制定出來,這樣可以更好地將科研機構的積極性激發出來,確保能順利實施研究。此外,政府相關部門還需要出臺相關的政策,這樣可以方便各方面的相互協調和配合。

3.3 提高企業的商業競爭力

在生物信息技術方面,我國企業的參與度還遠遠不夠,因此對生物信息技術的發展造成了很大的影響,這也是生物信息技術缺乏動力的主要原因。我國要及時在這方面出臺相應的政策和措施,讓企業能積極參與其中并成為其中的重要組成部分。因為企業在這方面的成功做法和成功經驗較多,人才也是非常專業的,可以將這些轉化成發展的動力,以此來促進生物信息技術在實際生活中的應用。企業也可以據此在激烈的市場競爭中保持自身的優勢地位。

4 結 語

在生物信息學的研究過程中,計算機是重要的手段和方法。對于生物信息學來說,它需要研究生命科學,所以,生物學是生物信息學的根本,計算機科學技術是其應用的基本工具。隨著生物信息學的不斷發展,生物學因為它而帶來了巨大的思想和觀念改變。這是一個由量變到質變的過程,生物信息學會因此得以不斷地進步和發展。

主要參考文獻

[1]何洪波,譚曉超,李斌,等.生物信息學對計算機科學發展的機遇與挑戰[J].生物信息學,2005(1).

[2]郝柏林,張淑譽.生物信息學手冊[M].上海:上??茖W技術出版社,2002.

[3]張春霆.生物信息學的現狀與展望[J].中國青年科技,2000(6).

[4]孫米.計算機科學與生物信息學教育的關系[J].陜西學前師范學院學報,2004(1).

[5]賀林.解碼生命——人類基因組計劃和后基因組計劃[J].北京:科學出版社,2000.

生物信息學論文范文第2篇

摘要:以黃花蒿(Artemisia annua L.) 1-脫氧-D-木酮糖-5-磷酸還原異構酶基因(DXR)為研究對象,利用美國國家生物技術信息中心(NCBI)網站及生物信息學軟件對堿基分布、氨基酸組成、親疏水性及編碼蛋白結構進行預測,用Clustal W進行多序列比對,用MGEA構建系統發育樹,用STRING進行蛋白互作網絡分析,研究黃花蒿DXR基因特征并預測分析DXR蛋白結構與功能。結果表明:黃花蒿DXR基因mRNA序列長度為1 419 bp,編碼蛋白包含472個氨基酸,等電點為6.15;DXR蛋白為疏水性蛋白,無信號肽,無跨膜結構域。多序列比對及系統發育樹分析表明,黃花蒿DXR蛋白與杭白菊DXR(BAE79548.1)的相似度最高,為98%,且處于同一分支,親緣關系較近。蛋白結構分析顯示,α-螺旋、無規則卷曲是黃花蒿DXR蛋白的主要結構元件?;プ骶W絡分析顯示,黃花蒿DXR在2-甲基-D-赤蘚糖醇-4-磷酸(2-C-methyl-D-erythritol-4-phosphate,MEP)代謝途徑中,可與CMS、DXS、HDS等多個蛋白發生互作。黃花蒿DXR基因在進化過程中相對保守,獲得的保守區序列信息為其他物種DXR基因的克隆奠定了基礎,深入研究該蛋白酶的結構和功能特征,也為今后提高青蒿素的生物合成量提供理論支持。

關鍵詞:黃花蒿;DXR基因;生物信息學;同源序列;多重序列比對;蛋白結構;蛋白互作網絡;青蒿素;生物合成量

黃花蒿(Artemisia annua L.)為菊科蒿屬的一年生草本植物,生態適應性非常廣,在我國各地均有分布,已入藥2 000多年,具有清熱解毒的功效,為我國傳統中草藥之一。其主要有效成分青蒿素在抗瘧,治中暑、蕁麻疹和滅蚊等方面具有重要功效,是目前世界衛生組織推薦治療瘧疾的首選藥物[1-2]。中國青蒿素產量占世界總產量的70%左右[3],由于野生資源的黃花蒿中青蒿素含量較低(0.01%~0.8%),致使青蒿素價格較高,很難滿足醫藥需求[4]。近年來,利用環己烯酮[5]、青蒿酸[6-7]等物質化學合成青蒿素取得一定成果,但因青蒿酸的生產主要依賴黃花蒿葉片,青蒿素的全化學合成幾乎不可能[8]。生物合成青蒿素仍是生產青蒿素的主要途徑,培育黃花蒿則成為提高青蒿素產量的關鍵。通過對青蒿素生物合成中關鍵酶的研究,利用基因工程獲得高產轉基因黃花蒿植株是解決這一矛盾的有效途徑。

青蒿素是含有過氧基團的倍半萜內酯,屬于萜類化合物。絕大多數萜類化合物的合成前體是異戊烯基焦磷酸(IPP),植物體內IPP的生物合成主要存在2條不同的代謝途徑:一是定位于細胞質中的甲羥戊酸(mevalonate,MVA)途徑[9];另一條是定位于質體中的2-甲基-D-赤蘚糖醇-4-磷酸(2-C-methyl-D-erythritol-4-phosphate,MEP)途徑[10]。1-脫氧-D-木酮糖-5-磷酸還原異構酶(DXR)催化1-脫氧-D-葡萄糖-5-磷酸(DXP)產生異構并還原生產MEP,是MEP代謝途徑中最重要的限速反應,也是細胞質體內類異戊二烯化合物代謝中的重要調控穩點[11]。DXR在植物類異戊二烯生物合成過程中發揮了重要作用。Mahmoud等發現,薄荷過量表達DXR,可促進葉片中薄荷油等單萜的合成,使薄荷精油量提高50%[12]。Carretero-Paulet等發現,在過量表達DXR的轉基因擬南芥中,葉綠素、類胡蘿卜素水平都顯著提高[13]。Graham等通過對青蒿基因組測序并對青蒿素合成相關基因進行分析表明,DXR與青蒿素合成呈正相關[14]。

近年來,擬南芥、番茄、水稻、玉米、銀杏、橡膠樹及喜樹等多種植物的DXR基因得到解析[15-16],但尚未有報道利用生物信息學的方法系統研究這些基因,制約了其他物種中該基因的克隆與功能驗證。本試驗利用生物信息學方法對黃花蒿DXR基因以及GenBank上已發表的其他植物DXR基因進行序列分析和功能預測,利用分子互作技術對黃花蒿DXR基因進行全面分析,旨在為提高黃花蒿青蒿素產量提供新思路,為其他植物DXR基因的克隆、功能驗證提供理論和實踐參考依據。

1 材料與方法

數據來源于美國國家生物技術信息中心(NCBI)核苷酸和蛋白質數據庫中已登陸的黃花蒿DXR基因的核苷酸序列(GenBank登錄號:AF182287.2)、氨基酸序列(GanBank登錄號:AAD56391.2)[17]。

黃花蒿DXR序列分析:利用NCBI在線工具ORF-Finder翻譯蛋白并進行開放閱讀框(ORF)查找。利用ExPASy ProtParam預測分析編碼蛋白的相對分子量、理論等電點、穩定性等理化性質[18]。用Target 1.1 Server在線軟件分析編碼蛋白的導肽[19]。用SignalP 4.1在線軟件分析編碼蛋白信號肽[20]。用TMHMM Server軟件對編碼蛋白的跨膜結構域進行預測分析[21]。用WOLF PSORT預測蛋白亞細胞定位信號[22]。用ProtScale分析編碼蛋白的親疏水性。用NetPhos 2.0 Server分析編碼蛋白潛在的磷酸化位點[23]。利用NCBI BLAST篩選同源序列,用Bioedit軟件進行多序列比對分析。利用MEGA 5.2 軟件鄰接算法N-J(Neihgbor-Joining)[24],選用JTT+I模型運算1 000次構建系統進化樹,并利用Bootstraping自展法對其進行評估。

蛋白結構預測及互作網絡分析:用NCBI CDD工具對蛋白保守區域進行預測分析;用ExPaSy-SOPMA軟件分析編碼蛋白二級結構;用SWISS-MODEL自動建模方式來篩選構建三維模型,用X射線衍射結構進行模型修飾;用Swiss-Pdb viewer構建拉氏構象圖,對建模準確性進行評估;用STRIG 9.1(http://string.embl.de/)[25]進行蛋白質互作網絡分析。

2 結果與分析

2.1 黃花蒿DXR基因分析和蛋白分析

2.1.1 黃花蒿DXR基因序列分析 NCBI上登錄的黃花蒿DXR序列是從黃花蒿mRNA中克隆得到的全長CDS(coding sequence)序列。序列全長為1 419 bp,其中包含多個起始密碼子(ATG)和1個終止密碼子(TGA)。其中A有379個,T有415個,A+T含量較高,為55.95%;C有292個,G有333個,C+T含量較少,為44.05%。

2.1.2 黃花蒿DXR編碼蛋白的氨基酸組成及其理化性質分析 通過ORF-Finder軟件分析發現,黃花蒿DXR編碼蛋白編碼472個氨基酸。該預測蛋白原子總數為7 204個,分子式為C2 278H3 634N600O677S15,蛋白相對分子量為50.74 ku;理論半衰期為30 h;不穩定系數為33.53,小于40.0,說明該蛋白屬于穩定性蛋白。此外,該蛋白脂肪系數為98.37,親水性系數為0.020,理論等電點(PI)為6.15。由其氨基酸組分可知,丙氨酸Ala(A)、亮氨酸Leu(L)含量最高,為9.70%;半胱氨酸Cys(C)含量最低,為1.50%;帶負電荷總殘基數(Asp+Glu)為49個,帶正電荷總殘基數(Arg+Lys)為44個(圖1)。

2.1.3 DXR蛋白導肽、信號肽及亞細胞定位預測分析 用TargetP 1.1 Server預測DXR導肽,結果顯示,該序列mTP(定位于線粒體)值為0.030,cTP(定位于葉綠體)值為0.691,SP(信號肽)值為0.022,推測該序列不含有線粒體目標肽、分類途徑信號肽,可能為葉綠體轉運肽。SignalP 4.1預測顯示,黃花蒿DXR蛋白為非分泌蛋白。用WOLF PSORT軟件對該蛋白進行亞細胞定位發現,該蛋白最可能定位于細胞質上,可信度高達76%。

2.1.4 DXR蛋白親/疏水性及磷酸化位點分析 利用ProtScale預測黃花蒿DXR蛋白的親/疏水性,由圖2可見:在黃花蒿DXR蛋白氨基酸中,第167~193位氨基酸區域具有很強的疏水性,在第171位氨基酸處達到最強疏水性峰值,為2.444;第32~44位氨基酸區域具有很強的親水性,在第40位氨基酸處達到最強親水性峰值,為-2.224。由于親水性氨基酸的個數多于疏水性氨基酸,預測黃花蒿DXR蛋白為親水性蛋白。

用NetPhos2.0 Server預測結黃花蒿DXR蛋白磷酸化位點發現,在DXR有17個絲氨酸(Ser,S)磷酸化位點、6個蘇氨酸(Thr,T)磷酸化位點、3個酪氨酸(Tyr,Y)磷酸化位點。在整個氨基酸序列中,第7位氨基酸(S)、第40位氨基酸(S)的磷酸化預測值最高,為0.992,可能受蛋白磷酸化激酶磷酸化。

2.2 多序列比對和系統進化樹分析

用NCBI BLAST篩選得到14條黃花蒿DXR同源序列(表1),應用Clustal W進行多重序列比對分析。圖3結果發現,中間功能區域的氨基酸序列較為保守,兩端區域的氨基酸序列差異較大,且N-端差異大于C-端差異。用MEGA5.2 軟件N-J法構建系統進化樹。由圖4結果可知:16個物種的DXR氨基酸序列聚集成2大分支:黃花蒿、艾菊、杭白菊、甜葉菊聚為分支Ⅰ;千金子、蓖麻、毛果楊等聚為分支Ⅱ。由傳統分類學可知,分支Ⅰ中的黃花蒿、艾菊、杭白菊、甜葉菊4個物種均屬菊科,分支Ⅱ中的千金子、蓖麻、毛果楊等11個物種不屬于菊科。這表明DXR是1種相對保守的蛋白,物種的進化速度與物種DXR蛋白的進化速度是一致的,DXR可以作為生物遺傳分析、分子進化研究的重要因子。

2.3 DXR蛋白結構預測及互作網絡分析

2.3.1 黃花蒿DXR蛋白保守區預測 利用NCBI CDD在線分析黃花蒿DXR蛋白保守區域。圖5結果顯示,DXR蛋白含有DXP_reductoisom、DXP_redisom_C、DXPR_C 3個保守結構區域,預測該蛋白屬于SDR 超家族、DXP_redisom_C超家族及DXPR_C超家族。

2.3.2 黃花蒿DXR蛋白結構分析 用ExPaSy-SOPMA軟件分析DXR蛋白二級結構。由圖6可知,該蛋白由37.08%無規則卷曲、28.81% α-螺旋、23.94%延伸鏈、10.17%β-轉角組成,無規則卷曲、α-螺旋是其主要構件,延伸鏈貫穿于整個蛋白質中。

利用Swiss-MODEL根據同源蛋白構建黃花蒿DXR蛋白的三級結構(圖7-A),該蛋白包含28個α-螺旋、25個β-折疊和大量無規則卷曲。通過Swiss-Pdb Wiewer構建拉氏構象圖(圖7-B)對預測的DXR三維模型進行評估發現,預測模型的二面角位于黃色核心區域,其空間結構穩定,該蛋白利用Swiss-MODEL同源建模得到的三維結構的可信度極高。用VAST Search在線軟件預測DXR蛋白的功能位點(圖7-C),預測DXR蛋白兩端的α-螺旋、β-折疊結合部位為主要的功能位點。

2.3.3 黃花蒿DXR蛋白互作網絡分析 根據黃花蒿DXR蛋白質三維結構模型,利用STRING交互式數據庫進行蛋白質互作網絡分析。結果表明,DXR在催化DXP產生異構并還原生產MEP代謝過程中與多個蛋白發生互作,主要包括:CMS、DXS、eugene3.09030001、gw1.III.2599.1、gw1.171.35.1、gw1.VI.2744.1、estExt_Genewise1_v1.C_LG_XVIII1471、MCS、gw1.I.8813.1、HDS等(圖8)。

3 結論與討論

次生代謝產物是地球上最豐富的有機化合物,由于其功能特殊、用途廣泛,現已成為國際上研究的熱點、焦點。目前已經有多種萜類化合物被分離提取,應用到醫學、農業、工業等各領域。青蒿素作為黃花蒿的1萜類次生代謝產物,因其具有抗瘧效率高、速度快、毒性低等優點,已經成為全球抗瘧的主要藥物。2011年,因對青蒿素的抗瘧研究作出貢獻,我國的女藥學家屠呦呦獲得了拉斯克獎[26]。青蒿素的獲取主要依賴于黃花蒿的生物合成,全面了解青蒿素生物合成途徑關鍵酶的功能,通過基因工程等手段調控其在植物體內表達,獲得大量有用的青蒿素,可為提高青蒿素產量開辟新的思路。

DXR在萜類物質MEP合成途徑中具有特殊作用,可將DXP異構化并還原生產MEP。黃花蒿DXR作為青蒿素生物合成的重要限速酶而倍受關注。生物信息學是當今生命科學和自然科學的核心領域,是后基因組時代的重要研究方法。本研究根據NCBI上登錄的黃花蒿DXR基因序列,應用生物信息學技術對該基因及編碼蛋白進行比對、分析、建模等研究,應用STRING對該基因編碼蛋白進行互作網絡分析?;蛐蛄蟹治霭l現,該基因中A+T堿基含量較高,為55.95%,高于50%,且錯配率較低,核苷酸穩定。編碼蛋白氨基酸序列分析發現,DXR蛋白不穩定系數為33.53,屬于不穩定性蛋白。多序列比對及系統發育樹分析發現,黃花蒿DXR與杭白菊DXR同源性最高,為98%,親緣關系最近。DXR在進化上高度保守,可作為其他物種生物遺傳分析和分子進化研究的重要因子。蛋白結構分析顯示,無規則卷曲、α-螺旋是其主要結構元件。蛋白互作網絡分析表明,黃花蒿DXR可能與1-脫氧木桶糖-5-磷酸合成酶(DXS)互作。本研究結果為深入探討黃花蒿DXR蛋白功能和萜類生物合成的分子機制提供重要基礎信息,為提高黃花蒿青蒿素的生物合成量提供了理論支持,也為其他植物萜類等次生代謝產物的研究提供了一定依據。

參考文獻:

[1]Klayman D L.Qinghaosu (artemisinin):an antimalarial drug from China[J]. Science,1985,228(473):1049-1055.

[2]World Health Organization.World malaria report 2010[R]. Geneva:WHO,2010.

[3]White N J.Qinghaosu (artemisinin):the price of success[J].Science,2008,320(5874):330-334.

[4]Liu B,Wang H,Du Z,et al. Metabolic engineering of artemisinin biosynthesis in Artemisia annua L.[J]. Plant Cell Reports,2011,30(5):689-694.

[5]Zhu C,Cook S P.A concise synthesis of (+)-artemisinin[J]. Journal of the American Chemical Society,2012,134(33):13577-13579.

[6]Lévesque F,Seeberger P H.Continuous-flow synthesis of the anti-malaria drug artemisinin[J]. Angewandte Chemie,2012,51(7):1706-1709.

[7]Hao H D,Li Y,Han W B,et al. A Hydrogen peroxide based access to qinghaosu (artemisinin)[J]. Organic Letters,2011,13(16):4212-4215.

[8]Yadav J S,Babu R S,Sabitha G.Stereoselective total synthesis of (+)-artemisinin[J]. Tetrahedron Letters,2003,44(2):387-389.

[9]Newman J D,Chappell J.Isoprenoid biosynthesis in plants:Carbon partitioning within the cytoplasmic pathway[J]. Critical Reviews in Biochemistry and Molecular Biology,1999,34(2):95-106.

[10]馬 靚,丁 鵬,楊廣笑,等. 植物類萜生物合成途徑及關鍵酶的研究進展[J]. 生物技術通報,2006(Z1):22-30.

[11]Takahashi S,Kuzuyama T,Watanabe H,et al. A 1-deoxy-D-xylulose 5-phosphate reductoisomerase catalyzing the formation of 2-C-methyl-D-erythritol 4-phosphate in an alternative nonmevalonate pathway for terpenoid biosynthesis[J]. Proceedings of the National Academy of Sciences of the United States ofAmerica,1998,95(17):9879-9884.

[12]Mahmoud S S,Croteau R B.Metabolic engineering of essential oil yield and composition in mint by altering expression of deoxyxylulose phosphate reductoisomerase and menthofuran synthase[J]. Proceedings of the National Academy of Sciences of the United States of America,2001,98(15):8915-8920.

[13]Carretero-Paulet L,Cairó A,Botella-Pavía P,et al. Enhanced flux through the methylerythritol 4-phosphate pathway in Arabidopsis plants overexpressing deoxyxylulose 5-phosphate reductoisomerase[J]. Plant Molecular Biology,2006,62(4/5):683-695.

[14]Graham I A,Besser K,Blumer S,et al. The genetic map of Artemisia annua L.identifies loci affecting yield of the antimalarial drugartemisinin[J]. Science,2010,327(5963):328-331.

[15]Seetang-Nun Y,Sharkey T D,Suvachittanont W.Molecular cloning and characterization of two cDNAs encoding 1-deoxy-D-xylulose 5-phosphate reductoisomerase from Hevea brasiliensis[J]. Journal of Plant Physiology,2008,165(9):991-1002.

[16]Yao H,Gong Y,Zuo K,et al. Molecular cloning,expression profiling and functional analysis of a DXR gene encoding 1-deoxy-D-xylulose 5-phosphate reductoisomerase from Camptotheca acuminata[J]. Journal of Plant Physiology,2008,165(2):203-213.

[17]Souret F F,Weathers P J,Wobbe K K.The mevalonate-independent pathway is expressed in transformed roots of Artemisia annua and regulated by light and culture age[J]. In vitro Cellular & Developmental Biology-Plant,2002,38(6):581-588.

[18]Wilkins M R,Gasteiger E,Bairoch A,et al. Protein identification and analysis tools in the ExPASy server[J]. Methods in Molecular Biology,1999,112(112):531-552.

[19]Emanuelsson O,Brunak S,Von Heijne G,et al. Locating proteins in the cell using TargetP,SignalP and related tools[J]. NatureProtocols,2007,2(4):953-971.

[20]Petersen T N,Brunak S,Von Heijne G,et al. SignalP 4.0:discriminating signal peptides from transmembrane regions[J]. Nature Methods,2011,8(10):785-786.

[21]Mller S,Croning M D,Apweiler R.Evaluation of methods for the prediction of membrane spanning regions[J]. Bioinformatics,2001,17(7):646-653.

[22]Horton P,Park K J,Obayashi T,et al. WoLF PSORT:protein localization predictor[J]. Nucleic Acids Research,2007,35(Web Server issue):W585-W587.

[23]Blom N,Gammeltoft S,Brunak S.Sequence and structure-based prediction of eukaryotic protein phosphorylation sites[J]. Journal of Molecular Biology,1999,294(5):1351-1362.

[24]Gascuel O,Steel M.Neighbor-Joining revealed[J]. MolecularBiology & Evolution,2006,23(11):1997-2000.

[25]Franceschini A,Szklarczyk D,Frankild S,et al. STRING v9.1:protein-protein interaction networks,with increased coverage andintegration[J]. Nucleic Acids Research,2013,41:D808-D815.

[26]Miller L H,Su X.Artemisinin:discovery from the Chinese herbal garden[J]. Cell,2011,146(6):855-858.

生物信息學論文范文第3篇

淺談生物信息學在生物學研究中的應用

生物信息學(Bioinformatics)是一門新興的、正在迅速發展的交叉學科,目前國內外對生物信息學的定義眾說紛紜,沒有形成統一認識。 概括來說,現代生物信息學是以核酸和蛋白質等生物大分子數據庫及其相關的圖書、文獻、資料為主要對象,以數學、信息學、計算機科學為主要手段,對浩如煙海的原始數據和原始資料進行存儲、管理、注釋、加工,使之成為具有明確生物意義的生物信息。并通過對生物信息的查詢、搜索、比較、分析,從中獲得基因的編碼、凋控、遺傳、突變等知識;研究核酸和蛋白質等生物大分子的結構、功能及其相互關系;研究它們在生物體內的物質代謝、能量轉移、信息傳導等生命活動中的作用機制。

生物信息在生物學研究上的應用主要包括在基因組學研究上的應用和在蛋白質組學研究中的應用。

1.在基因組學研究中的應用

基因組(genome)表示一個生物體所有的遺傳信息的總和。一個生物體基因所包含的信息決定了該生物體的生長、發育、繁殖和消亡等所有生命現象。有關基因組的研究稱為基因組學(Genomics),基因組學根據研究重點的不同分為序列基因組學(Sequence genomics)、結構基因組學(Structural genomics)、功能基因組學(Functional genomics)與比較基因組學(Comparative genomics)。結構基因組學的研究:結構基因組學(Structural genomics)是基于基因組學的一個重要組成部分和研究領域,它是一門通過基因作圖、核苷酸序列分析確定基因組成、基因定位的科學口 。生物信息學在結構基因組學中的應用主要在于:基因組作圖、核苷酸序列信息分析、基因定位、新基因的發現和鑒定等方面。比較基因組學的研究:借助生物信息學的手段對不同生物基因組的比較、分析,可以進行生物進化等方面的研究。

功能基因組學的研究:功能基因組學(Functional genomics)是指在全基因組序列測定的基礎上,從整體水平研究基因及其產物在不同時空、條件下的結構與功能關系及活動規律的學科。功能基因組的研究是后基因組時代的關鍵點,它將借助生物信息學的技術平臺,利用先進的基因表達技術及龐大的生物功能檢測體系,從浩瀚無垠的基因庫篩選并確知某一特定基因的功能,并通過比較分析基因及其表達的狀態,確定出基因的功能內涵,揭示生命奧秘,甚至開發出基因產品。

2.在蛋白質組學的研究中的應用

在20世紀中后期,隨著DNA雙螺旋結構的提出和蛋白質空間結構的解析,生生命科學的研究進入了分子生物學時代,而遺傳信息載體DNA和生命功能的體現者蛋白質的研究,成為了其主要內容。90年代初期啟動的龐大的人類基因組計劃,已經取得巨大的成在20世紀中后期,隨著DNA雙螺旋結構的提出和蛋白質

空間結構的解析,生生命科學的研就,人類基因組序列草圖繪制完成后,生命科學研究跨入了后基因組時代。然而,人們清醒地識到基因僅是遺傳信息的載體,而生命活動的執行者是基因的表達產物—蛋白質,它是生命現象復雜性和多變性的直接體現者。

蛋白質組一詞是澳大利亞學者馬克威爾金斯在1994年最先提出來的,它是指基因組表達的所有相應的蛋白質,也可以說是指細胞或組織或機體全部蛋白質的存在及其活動方式。蛋白質組學是從整體的蛋白質水平上,在一個更加深入、更加貼近生命本質的層次上去探討和發現生命活動的規律和重要生理、病理現象的本質等。蛋白質組學的研究對揭示生命活動規律,探討重大疾病機制,疾病診斷和防治、新藥的開發提供重要的理論基礎。

生物信息學在蛋白質組學中的蛋白質數據庫的應用

2.1蛋白質組數據庫

蛋白質組數據庫是蛋白質組學研究的主要內容之一。通過構建不同環境條件下組織或細胞全部蛋白質的數據庫來研究蛋白質表達的差異情況。與其他數據庫相比, 目前大部分蛋白質組數據庫都有以下幾個方面的特點: (1)由于蛋白質相關數據的種類繁多,蛋白質組數據庫的種類也多種多樣,如雙向電泳數據庫、基于蛋白序列的數據庫、蛋白質一級或高級結構數據庫、蛋白質相互作用數據庫等等;(2)新速度快,網絡上的蛋白質組數據庫的數據幾乎每天都在更新;(3)網共享程度高, 越來越多的數據庫資源與互聯網相互配合,使得蛋白質相關數據的利用率空前的提高。蛋白質組數據庫的主要內容即集中在基于雙向電泳結果的數據庫和基于蛋白質序列信息的數據庫。

2.1.1基于雙向電泳圖譜的數據庫

雙向電泳技術是蛋白質組學研究中最重要的實驗技術之一,所以基于雙向電泳圖片的數據庫也成了蛋白質組學研究中主要內容。

2.1.2 基于蛋白質序列信息的數據庫

基于蛋白質序列信息的數據庫是生物信息學數據庫中最基本的數據庫,這些數據庫以氨基酸殘基順序為基本內容,并附有注釋信息(計算機的序列分析結果和生物學家查閱文獻的結果)?;诘鞍踪|序列的數據庫很多,主要有蛋白質信息資源數據庫(PIR)、SWISS3D和 TrEMBL等等。

2.1.3 其他蛋白質組數據庫

蛋白質生物信息學包含很多方面的內容:如蛋白質大分子的結構、相互作用等等,所以,除了上述的一些數據庫之外,還有很多關于構象、相互作用等方面的數據庫,是基于質譜應用的數據庫,屬于混合數據庫。將生物信息學的實驗思路引入蛋白質組學的實驗方案后,實驗人員可以通過互聯網上的信息設計實驗方

案,避免了很多重復性的勞動,少走很多彎路,為蛋白質組學的發展提供了可靠的信息資源。值得一提的是,上文提到的大多數數據庫都能實現數據接收、在線查詢和空間結構的可是化瀏覽等多種功能。而且,幾乎所有這些數據庫都是免費的,都可以免費下載或提供免費服務,使得蛋白質組學可以在生物信息學的輔助之下快速發展。

2.2生物信息學與蛋白質分析

在蛋白質組分析過程中,生物信息學的作用不僅僅體現在數據庫的查閱和資料的整合中,生物信息學軟件在蛋白質組研究領域的作用根式至關重要的。蛋白質分析軟件應用主要集中在結合蛋白質組研究中的分離技術和堅定技術識別蛋白質(如2-DE)圖像分析、Edman降解的序列組合、質譜數據的綜合分析等),對有價值的未知蛋白質進行分析和預測(包括序列分析、結構預測、結構域、電點等性質的檢測等)、針對蛋白質的分析預測方法應用的工具有4個方面。

2.2.1 蛋白質一級結構分析

根據20中氨基酸的理化性質可以分析電泳等實驗中的未知蛋白質,同樣也可以分析已知蛋白質的物化性質。設計PROPSEARCH的目的是為了通過排比方法查詢一個新的蛋白質序列失敗時,查找公認的蛋白質家族而設計的。PROPSEARCH可以通過氨基酸組分來查詢,同時也可以通過其他的特性來進行查詢,如從序列中計算所得的分子量、 挑選的二肽組分的含量等。

2.2.2 蛋白質的物理性質預測

從蛋白質序列出發,預測蛋白質的許多物理性質,包括等電點、分子量、酶切特性、疏水性、電荷分布等。

2.2.3蛋白質二級結構預測

二級結構是指α螺旋和β折疊等規則的蛋白質局部結構元件。蛋白質的二級結構預測的基本依據是每一段相鄰的氨基酸殘基具有形成一定二級結構的傾向。因此,進行二級結構預測需要通過統計和分析發現這些傾向或者規律。蛋白質二級結構預測的方法有3種。一是由已知結構統計各種氨基酸殘基形成二級結構 的構象趨勢,其中最常用的是Chou和Fasman 法;二是基于氨基酸的物理化學性質,包括堆積性、疏水性、電荷性、氫鍵形成能力等;三是通過序列比對,由已知三維結構的同源蛋白推斷未知蛋白的二級結構。各種方法預測的準確率隨蛋白質類型的不同而變化。一般對于α螺旋預測精度較好,對β折疊差些,而對除α螺旋和β折疊等之外的無規則二級結構則效果很差。

2.2.4蛋白質的三維結構

蛋白質三維結構是預測時最復雜和最困難的預測技術。序列差異較大的蛋白質序列也可能折疊成類似的三維構象。由于蛋白質的折疊過程并不十分清晰,從理論上解決蛋白質折疊的問題還有待進一步的科學發展,但也有了一些有一定作

用的三維結構預測方法。即與已知結構的序列比較,同源模建,threading算法和 折疊識別方法。常見的預測算法有:SWISS-MODEL (自動蛋白質同源模建服務器)、CPHmodels等。

2.3 生物信息學與蛋白質功能

生物信息學發展到今天不僅可以對蛋白質組數據進行分析和預測,而且可以對已知或者未知的基因產物進行功能上全面的分析和預測。

生物信息學最常用的分析方法是模式識別。主要是利用存在于蛋白質序列結構中的某些特殊的特征模體來識別相關蛋白質性質。換而言之,就是從新的蛋白序列中發現標志性的序列或者結構,以此建立模式,然后在已經建立好的已知蛋白質數據庫中,搜集于此相似的模式,來確定未知蛋白質的歸屬,從而預測它的功能。 許多基因是在特定時期和條件下被激活,才能表達出來,在正常人工模擬的環境下根本無法表達。類似于這樣的恩未知蛋白質也需要通過生物信息學的方法計算分析預測,以獲得它的功能信息。

生物信息學論文范文第4篇

1 以應用為核心的教學目的與內容設置

對于絕大多數非專業的研究生來說, 生物信息學更多的是一種輔助的工具。這些研究生并不需要深入地學習程序設計等信息學的技術, 不需要清晰地了解算法或軟件的數學細節, 更多的應該是培養應用生物信息學原理和方法的能力。這些能力包括熟悉常用的數據庫, 能夠應用檢索工具查找序列等相關的數據信息, 并利用BLAST等網絡工具對所獲得的序列數據進行分析, 預測蛋白序列所包含的結構域、修飾位點以及三維結構等, 以及同源序列的進化關系分析等。除此之外, 基因表達數據庫、蛋白組學數據庫的檢索以及生物學文獻查詢、引物設計等常用生物學軟件的應用等也應該包括在非專業研究生的生物信息學課程設置中。

為了適應這一教學目標, 對于非專業的研究生來說, 生物信息學的教學應該以應用為核心, 注重對實際應用能力的培養。北京大學生命科學學院開設了一門廣受研究生好評的生物信息學課程“Applied Bioinformatics Basics”, 提出了“不要期望成為一個生物信息學專家”, 強調通過應該生物信息學工具輔助實驗室的研究工作“Half day on the web, saves you half m on th i n t he l ab” (ht tp://ab c.c bi.p ku ed u.c n/) , 在這方面做出了卓有成效的探索。

需要注意的是, 一些基礎生物信息學的原理與背景知識對于理解和正確應用生物信息學工具必需的, 如BLAST參數的正確選擇的基礎需要基于對PAM和BLOSUM打分矩陣的理解[3]。在課程教學中也應該注重這些基礎知識和基本理論的講授, 增強研究生對生物信息學基本原理的理解, 促進生物信息學思維方法的形成, 培養靈活運用生物信息學相關工具的能力。

2 應用現代教學技術, 培養實際應用能力

由于生物信息學對于計算機和網絡工具的高度依賴, 研究生生物信息學的教學方法也應該與教學內容相一致, 應充分利用現代教育技術, 除了采用多媒體教學以外, 還可通過網絡教學等多種教學方式。同時針對研究生的特點, 增強在教師與研究生之間的互動, 注意引導學生將課程的學習與所涉及的研究工作相結合, 激發研究生的學習興趣。

同時應該注重實踐教學, 實踐教學不僅能夠增強研究生對理論知識的理解, 更重要的是培養學生析問題、解決實際問題的能力。在實踐教學環節, 每次課堂教學后布置相應的應用練習, 促進研究生實際動手能力的提高。通過組織學生分組進行綜合的應用型實驗, 引導學生通過集體智慧綜合多種生物信息學工具, 分析和解決相應的科學問題, 培養學生的創造性思維。在課程考試的階段, 可以采用綜合性的考試設計, 如要求研究生預測一個未知功能基因的功能、進化、結構等各種信息, 考察學生對各種生物信息學工具和軟件的綜合應用能力, 以及分析問題、解決問題的生物信息學的思維方式[4]。

3 關注學科前沿, 注意知識更新

作為一門新興的學科, 生物信息學的發展非常迅速, 新的理論、算法和應用程序不斷涌現。在研究生生物信息學教學中, 應該不拘泥于現有的生物信息學教材, 及時納入最新的研究成果, 將相關研究領域的一些新的研究方法、網絡資源以及工具軟件介紹給研究生。例如, 在講授多序列比對時, 不僅要介紹經典的ClustalW, 同時也介紹MUSCLE等一些新的算法和研究工具[5]。及時更新研究生的知識體系, 培養研究生關注相關學科前沿的意識, 拓展研究生的學術視野。

摘要:生物信息學作為新興的交叉學科, 已經成為生物學研究的強有力的輔助工具之一。本文針對目前非專業研究生生物學信息學教學實踐中的一些問題, 提出在教學目的、教學內容、教學方法方面的思考, 希望能夠有助于推動非專業研究生生物信息學課程教學的開展。

關鍵詞:生物信息學,教學內容,教學方法

參考文獻

[1] 喬納森佩夫斯納[著], 孫之榮, 等[譯].生物信息學學與功能基因組學[M].化學工業出版社, 2006.

[2] 戴凌燕, 姜述君, 高亞梅.《生物信息學》課程教學方法探索與實踐[J].生物信息學, 2009, 7 (4) :311~313.

[3] David W M.Bioinformatics:sequence and genome analysis影印本[M].科學出版社, 2002.

[4] 石生林, 韓艷君, 劉彥群, 等.非專業研究生生物信息學課程教學中存在的問題及對策[J].生物信息學, 2009, 7 (2) :125~127.

生物信息學論文范文第5篇

1 精選生物信息學計算程序教學內容培養學生實踐能力

隨著生物信息學研究的飛速發展, 我們迫切需要開源、可重復利用和面向對象的程序包和軟件來完成數據分析的任務[1]。雖然現有一些軟件可供科研人員使用, 但是在無法找到現成的工具完成你所需的任務而你又無法找到別人幫你寫程序時, 需要我們自己編寫程序。即使你主要依賴現有的程序和工具, 自己花時間編寫一些小程序也會起到非常重要的作用, 如可通過編寫能運行其他的程序的小程序達到節省時間的目的。在眾多的程序設計語言中, PERL程序不僅其本身的數據結構非常適合處理生物信息學數據, 而且它包含的面向對象的程序設計方法和面向生命科學的BIOPERL模塊都是從事生物信息學研究的強有力的工具, 是目前針對生物信息學中的各種問題進行軟件開發的主流程序設計語言, 因此被我們選擇為教學語言。

在教學過程中, 我們通過一些精心設計的教學案例以信息科學的視角介紹生命科學知識, 使醫學專業的學生能以一種全新的方式來理解以前曾經學過的生物學知識, 從整體觀, 系統觀和信息論的角度來理解生命科學。如通過案例“DNA突變”一方面加深了學生基因突變原理的理解;另一方面使學生掌握了程序設計中函數的調用, 數組的使用和隨機數的產生方法, 學會了用計算機來模擬生物進化的過程;通過案例“DNA轉錄為蛋白質”, 一方面使學生復習了基本的遺傳密碼和實際轉錄過程另一方面使學生掌握了PERL語言中哈希表的具體使用方法, 加深對語法知識的理解, 起到了事半功倍的效果。從另一個角度來看, 這種以程序設計為主線, 以語言知識為輔線的教學模式更加注重實踐, 可以逐步提高學生的程序設計能力, 避免了傳統程序設計教學所造成的學生對計算機語言的基本語法知識非常熟悉但就是不會編寫程序的弊端。為了使學生在提高程序設計能力的同時更好的掌握計算機語言的語法知識, 我們還針對同一生命科學問題設計了幾種不同的實現算法, 如針對讀取文件中的DNA和蛋白質序列這個任務設計了4個不同的程序, 使學生不僅能掌握PERL中對文件操作的語句, 而且提高了對數組, 循環等不同數據結構的操控能力;又如針對統計DNA序列中核苷酸出現頻率設計了3種不同的程序, 加深了學生對數組, 字符串, 正則表達式等PERL語言基本語法的理解。

2 設計綜合性實驗教學培養學生的實踐能力

實驗是生物信息學程序設計教學中的重要環節, 為了培養學生的自主學習和創新能力, 我們在實驗課程中改變以往傳統的以授課為基礎的學習 (Lecture based learning, LBL) 教學模式, 引入以問題為基礎的學習 (Problem-based learning, PBL) 的教學模式[2]。程序設計不同與其他學科, 并不是所學內容的簡單套用, 常常需要針對當前的具體問題進行具體分析, 在所掌握語言知識的基礎上構建出解決當前問題的合理方案。在實驗課中, 我們對PERL語言的主要語法進行簡單介紹后提出具體的應用問題讓學生圍繞該問題進行學習, 最后自己解決該問題。我們的綜合性實驗的設計就一方面盡可能地聯系生命科學理論一方面著重突出生物信息學臨床應用的最新知識及進展, 從而建構優秀PBL問題。學生可能開始對這種以問題為中心的教學模式不太適應, 但由于確定了實驗目標, 學習過程就變為了主動地向教師提問的過程教師由講授者變為了輔導答疑者, 學生也通過獨自思考掌握了編寫程序的能力和所學語言的語法知識。我校實驗室所具有的高檔微機及通過校園網連接的Internet網絡環境為教學改革提供了良好的保障。

3 開展雙語教學提高學生英語應用能力

為了保持學科內容的領先, 促進學科雙語教學的發展, 我們參考國外相關教材自編了英文教材“Learning Bioinformatics with Perl”, 把全部教學和實驗的內容濃縮在書中, 其目的就在于傳授生物信息學專業知識的同時, 幫助學生提高英文聽、說、讀、寫等能力。在教學實踐過程中, 我們采用循序漸進的方法。采用自編的配套英文課件進行教學, 并對重點新名詞和基本語法點給予中文講解[3]。如講解重要概念“motif (基序) ”、“open reading frames (開放閱讀框) ”等。在學生逐步適應了雙語的課堂教學模式后, 再根據學生英語水平的提高而適度提高英語講授的比重。如在講解如何從數據庫中下載獲取目標序列并進行處理時, 可以通過Internet網頁一邊操作演示一邊即時講解, 從而幫助學生直觀、形象的理解雙語教學內容。

總之, 通過幾年以來在以上幾個方面的教學改革的嘗試, 我們發現學生學習生物信息學的積極性有很大提高, 大家對我們的改革持贊同態度并給予了很大的支持, 選修人數逐年上升?!渡镄畔W》選修課就于2007年被選為天津醫科大學首批優秀選修課程。筆者希望通過本文的論述, 能給醫學院校的生物信息學教學改革提供一些參考。

摘要:生物信息學作為一門新興的交叉學科, 涉及到生命科學、數學、物理學、計算機科學等諸多學科, 處于醫學研究發展的前沿。本文基于與生物信息學相關的計算機程序設計教學過程的各個環節, 從教學內容、綜合性實驗的設計、雙語教學三個方面進行了教學改革, 使生物信息學計算機程序教學與醫學應用實踐相結合。

關鍵詞:生物信息學,計算程序設計,綜合性實驗,雙語教學,醫學應用

參考文獻

[1] 張帆, 李霞, 宮濱生.面向醫科院校生物信息學專業的Java教學實踐[J].Com-puter Education, 2009, 15:150~151.

[2] 牛永東.醫學生物信息學教學模式的初步探討[J].醫學理論與實踐, 2006, 1:112~113.

上一篇:生物化學論文下一篇:生物制藥論文

91尤物免费视频-97这里有精品视频-99久久婷婷国产综合亚洲-国产91精品老熟女泄火