2015年1月16日 星期五

分子生物學資料庫專論 期末作業

1.請選出一個跟你論文主題相關的基因 (gene X)。

我選擇的是TNNI3 troponin I type 3 (cardiac) [ Homo sapiens (human) ]
TNNI3和許多的心肌疾病相關,像是Cardiomyopathy、Myocardial Infarction、Acute Coronary Syndrome。



2.將 gene X 於 Pubmed 或相關文獻探勘軟體,進行篇數,年代,作者趨勢分析。

從NCBI PubMed搜尋,可以找到關於TNNI3共有99篇的相關文獻。


3.將 gene X 利用 NCBI Gene 入口,獲得相關序列資訊(包括 genomic, reference        

   sequence, peptide sequence)。






4. 利用 gene X 的序列進行 Blastn 或 Blastp,找出至少10條以上,20條以下,不同種 

    (species) 的序列,進行Phylip分析。使用方法為 NJ 與 ML。bootstrap 設定在 n = 250。

使用Blastp分析,選擇10個不同的物種相似的序列,進行親緣分析。

5.將 gene X 於 NCBI GEO profile 中尋找相關的表達資訊, 至少10個以上,20個以下。製

   成 tab txt file。再用 TMeV 畫出聚類分析圖形(至少三種)。

進入GEO profile,輸入搜尋目標基因後可查詢相關文獻、分布圖及其他相關的 Profile data  Profile pathways、Find related data。
再由GEO DataSets 查詢,點選感興趣的GDS集合,進入數據頁面。

6.將上述 5. 所得與 gene X 表達相關基因,利用 STRING 預測交互作用網路,並列出最有興

   趣的GO關係圖形 (CC, MF, BF) 三種。

從結果可以看出,和TNNI3較有相關性有不少,其中只有RCAN3的相關性較低。

7.預測 gene X 的蛋白結構圖。

利用RCSB網頁,搜尋目標蛋白,直接查詢結構是否已解出來。結果證實目標蛋白TNNI3已經被解出來。

8.預測 gene X 的 micorRNA binding site。

進入RNA22主頁後,輸入目標基因TNNI3,查看其cDNA map。

可以點選"Export Predictions as Table"直接查看在那些位置有哪些miRNA結合位。


利用pymol和RSCB製作蛋白結構及影片

1.首先到RSCB的網頁,搜尋自己研究相關的protein- cardiac troponin I (2L1R)。


2.至pymol網站下載pymol軟體並用Pymol畫出蛋白結構。



利用MeD分析microarray data

1.開啟MeD軟體,然後load老師所給的5個gpr檔案。

2. Load microarray data後,會出現矩陣資料標示紅色與綠色。接著進行Normalization:
    Confidence interval=95%使data的基準點相同。

3.比較基因與基因之間的相關性:HCL(Hierarchical Clustering)
    Analysis > Clustering > HCL: Hierarchical Clustering > OK

4.點選HCL Tree,可以看到基因與基因間的相關性。
5.點選某一子範圍的tree來進行獨立分析:
   按子cluster的tree > 右鍵 > Launch new session
6.獨立某個子cluster的session,進行Visualization分析各個基因之間的相關性。
    Visualization > Gene Distance Matrix > genes > OK

7. 在Matrix View中,可以點選各點看基因與基因之間的關聯性。
8.設定要分群的組數。
   Analysis > Clustering > K-means/K-Medians > Cluster Genes > Number of clusters 和      Maximum iterations  > OK

9. 利用密度法(CAST),依數據相關性自動分群,使用預設參數。
    Analysis > Clustering > CAST 
10.點選cluster的分析結果可以看到數據間的趨勢。
11.進行Normalization讓基因之間的差異性更凸顯,分析的結果在all cluster中可以一起看
     到。

2015年1月15日 星期四

利用VMD軟體分析蛋白質分子及分子動力

1.首先到RSCB網站上搜尋要分析的protein分子,在這邊是搜尋與我研究相關的蛋白
    cardiac Troponin I- 2L1R,並且下載結構的檔案,格式為PDB。


2.將VMD軟體打開,點選File > New Molecular>Browse(選擇上一步下載好的結構檔案)
    > Load。此時軟體會display蛋白的3D結構。


3.更改display的形式,Graphics > Representations > 將drawing method改為
    NewCartoon > Apply。


4.點選Extensions > Modeling > Automatic PSF Builder > Load input files > Guess and
    split chains using current selections > I 'm feeling lucky ,會跑出 2L1R_autopsf.psf的
    file。




5.  點選Extensions > modeling > Add Solvation Box > 打勾Rotate to minimize volume的
     選項 > Box Padding 設定Min: X=5, Y=5, Z=5 ;Max: X=15, Y=15, Z=15 > Solvate 。接
     著會跑出solvate.psf的file。在display的3D圖形中可以看到蛋白分子周圍被水分子包圍形
     成像box的分子模型。


6.點選Extensions > Modeling > Add Ions > Iron placement mode的預先設定是使用
    NaCl做neutralize > Autoionize 。接著會出現ionized.psf的file。


以上步驟就可以完成在蛋白質分子的周圍加上水分子的應用。

利用BioEdit build a tree比較不同物種amino acid sequence的親緣性

先利用Bioedit先編輯與align不同species的sequence,之後再用phylip-3.69去做親緣關係的比對並製出生物樹,可以用來比較不同物種之間的關係。

1.開啟Bioedit的程式,接著匯入範本SEQ1~10的檔案。




2.點選Accessory Application"  >  "ClustalW Multiple Alignment,執行後會將10個不同的
    sequence進行align的比對,並排列出順序。




3.將序列存檔成"phylip"格式的檔案,儲存在exe的資料夾裡面。




 4. 用記事本打開檔案,可以看到序列會依照整理過後的方式排列。下次建tree時可以打開此
     檔案。



5. 在exe的資料夾中選擇seboot的軟體,打開剛剛儲存infile的檔案匯入,操作完會得到一個
     outfile,改成infile-1才可以繼續往下操作。




6. 接著一樣在exe的資料夾中找到protdist的軟體,匯入剛剛改成infile-1的檔案,操作完成後
    一樣會得到一個outfile的檔案,再改成infile-2往下操作。




7.在exe的資料夾中打開neighbor的軟體匯入剛剛infile-2的檔案,操作完後會得到兩個檔
   案:oufile和outtree,把outtree改成intree。



8. 在exe的資料夾中找到consense的軟體匯入intree的檔案,就出現最後的outtree。


9. 打開treeview的軟體匯入剛剛outtree的檔案,tree就完成了!可以比較這十個amino acid      sequence的親緣性。