2013年1月23日 星期三

神奇的 VirtualBox

VirtualBox 是個「虛擬電腦」,一個模擬的個人電腦的硬體環境,
在虛擬的電腦硬體中執行作業系統、測試軟體。

就好像電腦裡面又有一台電腦一樣,當然占的空間也是不小,
廉價筆電實在是有點不堪負荷哪,速度慢又愛當機。

但是,透過 VirtualBox 裡頭的作業系統,
可以在虛擬電腦跟實際的電腦系統同時運作,
可以獨立的執行一些程式。


好像可以在裡面測試病毒不會傷到自己的電腦,但是我不知道在裡面玩病毒要幹麻...

anyway,安裝完之後,
一開始開啟會看到這個畫面,
先匯入應用裝置 ( ← 這簡直是一大考驗),


在執行前,要先設定CPU、記憶體,設定分享資料夾,然後啟動。

這就是電腦中的電腦桌面摟






































利用這個 VirtualBox 可以執行 NWCHEM :計算量子化學和分子動力

首先,要先將有 ".nw" 副檔名的檔案裡面的"gcpair"改成"abc",

abc就是我們要計算的protein拉。

接下來運算,

首先是 prepare-0,完成運算後,將 ABC.top、ABC_ref.rst,copy and paste 到 equilibrate-1。

再來,到 equilibrate-1 完成運算後,將 ABC.top、ABC_ref.rst 和 dyna-0.nw 丟到 analysis-2。

在 analysis-2 完成運算後(ana.nw/ana1.nw),輸入 vmd ,就可以看到水分子和蛋白質分子。


其實過程上,比較困難的是運算的過程,

要搞清楚指令怎麼輸入,

照著指令,就可以帶你到每個資料夾裡面,輸入 nwchem 及要計算的東西,進行運算。


最後在VMD呈現結果,


























就可以看到整個結構的立體互動關係,

還有水分子在扭動,

還可以讓他旋轉喔。


而這整個檔案 最終也會產生一個 "abc_refend.pdb"檔案,

這個檔案把他丟到 pymol 裡面一樣可以開啟,







































雖然從這邊看水分子不會動,

但是其他的呈現方式設定就可以隨心所欲摟!



算出來的那一刻真是令人感動 


最後, 感謝洪鳳嬬兒,兒是可愛的意思,的大力幫助。







生資挑戰最終回

內容如下,

1. 利用自己實驗的基因,或虛擬一個。
2. 找出相關疾病,相關基因,文獻。
3. 利用 NCBI gene 找出所有相關資訊
4. 利用 blast 進行至少 10 個物種的序列,進行親緣分析。
5. 在 GEO 中尋找與該基因相關的表達結果。
6. 利用 GEO 與 2. 的結果,以 string 進行 PPI 分析。
7. 再以 string 結果以 GEO 結果比對,預測你的實驗結果。
8. 將該基因進行蛋白質結構預測。



----------------------------------------------------------------------------------------------------

1. 利用自己實驗的基因,或虛擬一個。

今天的主角是 ZAP70 :zeta-chain (TCR) associated protein kinase 70kDaHomo sapiens ]

2. 找出相關疾病,相關基因,文獻。

利用 DisGeNET搜尋ZAP70

可以看到
  • Diseases associated to this gene
  • Genes associated to this gene
首先,先看與ZAP70相關的疾病,
在這邊僅列出幾個,包括:

  • Immunologic Deficiency Syndromes
  • Severe Combined Immunodeficiency
  • Primary T-Cell Immunodeficiency Disorders
  • Arthritis, Rheumatoid
  • Carcinoma

接著,與ZAP70相關的基因,例如:CD40、ENO1、GRK6、CD28、ADRBK1 等等,因為太多就不一一列舉摟。

另外,從 NCBI -GEO profile 搜尋ZAP70,也可以找到相關的疾病,以及他人做過的實驗結果。

如這個跟 Rheumatoid Arthritis 類風濕性關節炎(RA)有關的研




並更進一步找到實驗來源的文獻






3. 利用 NCBI gene 找出所有相關資訊

  • 基本介紹


zeta-chain (TCR) associated protein kinase 70kDa

Official Symbol:
ZAP70
Other Aliases:
SRK, STCD, STD, TZK, ZAP-70
Other Designations:
70 kDa zeta-associated protein;
                               70 kDa zeta-chain associated protein;
                               syk-related tyrosine kinase;
                               tyrosine-protein kinase ZAP-70;
                               zeta-chain associated protein kinase, 70kD
Location:
2q12
Annotation:
Chromosome 2, NC_000002.11 (98330031..98356323)


Gene type:protein coding
Summary:This gene encodes an enzyme belonging to the protein tyrosine kinase family, and it plays a role in T-cell development and lymphocyte activation. This enzyme, which is phosphorylated on tyrosine residues upon T-cell antigen receptor (TCR) stimulation, functions in the initial step of TCR-mediated signal transduction in combination with the Src family kinases, Lck and Fyn. This enzyme is also essential for thymocyte development. Mutations in this gene cause selective T-cell defect, a severe combined immunodeficiency disease characterized by a selective absence of CD8-positive T-cells. Two transcript variants that encode different isoforms have been found for this gene. [provided by RefSeq, Jul 2008]

  • genomic context









  • genomic region, transcripts, and products 

          清楚顯示ZAP70在chromosome上的相關位置,並可進一步連接至 ZAP70 mRNA及protein sequence。

  • ZAP70 在 NCBI- PubMed 上相關的文獻,目前共有242篇。












  • 與 ZAP70 相關的 gene




















更多好康內容都在



4. 利用 blast 進行至少 10 個物種的序列,進行親緣分析。

run blast 























選取10個物種  download genebank 

之後,利用CLC, 開啟檔案

一定要先alignment → create alignment

才能把tree畫出來 → create tree 












就可以從樹狀圖看出誰跟誰最相近


5. 在 GEO 中尋找與該基因相關的表達結果。

ZAP70 in gastric cancer

























6. 利用 GEO 與 2. 的結果,以 string 進行 PPI 分析,7. 
再以 string 結果以 GEO 結果比對,預測你的實驗結果。


先看zap70 本身和哪些protein有interatction





我把從 GEO 找到 zap70 在RA相關研究上的有關基因,IRF1、CXCL10、CCL5

以及在 DisGeNET 找到的與在RA研究中與zap70相關的基因,CD28、CD40、、ENO1、ADRBK1、GRK6

選取幾個在string中進行protein-protein interaction。



一開始兩個部份確實是有interaction的,

但是與zap70並沒有直接關連,

所以我又按了"+",增加他的partners,



然後就會發現多了幾個protein之後,

確實就可以幫他們的關係串在一起,

但是另外三個沒有明顯的關係,

我想是因為在RA中,與zap70相關的基因實在是太多了,

想必其中是有很複雜的關係,

如果多按幾個"+",

可能最終可以看到他們的interaction。


8. 將該基因進行蛋白質結構預測。


接續剛剛的string,可以直接點protein name,

有一些protein的基本介紹,以及他的結構分析。

如下:

































點進去更可以直接連接到PDB website,





















但是要看結構的話

可以從 pymol 去看比較好,直接從pymol輸入PDB ID,

便可以直接download protein structure,

還可以把結構用成自己喜歡的樣子唷~  

但是因為這個protein不知道在幹麻在 pymol 裡都不能換顏色

不美麗  只好捨棄他 看看 PDB 的圖就好摟 






這學期的課終於終於終於要結束了嘛!! 呀呼!!

2013年1月12日 星期六

pymol 讓我的蛋白變得好美麗

先從 PDB 找到喜歡的protein

再利用 pymol


輸入在PDB上的代號

就可以直接load in protein的結構

可以將各個chain改成美麗的顏色

也可以選擇呈現的方式

或讓他旋轉360度

並focus在此蛋白特殊的structure放大

可算出原子與原子或原子與peptide間的距離

pymol 用途很多

可以從 pymol tutorial 找到一些基本的用法


protein: crystal structure of human extracellular copper-zinC superoxide dismutase
                   ( 
extracellular superoxide dismutase(CU-ZN))

length:222









2012年11月1日 星期四

Phylogenetic Analysis (練習)


Phylogenetic Analysis

須經過 blast、alighment、tree view 的流程,如下圖所示




簡單來說,就是 building tree 的過程
而可以藉此瞭解我們所要看的 sequence or protein evolve 的過程與特性

這次我們略過 blast 的部份
直接用 demo sequence 從 alignment 開始

首先 
打開 Bioedit 這個軟體
























點 file
選擇 New Alignment


















出現這個畫面























之後 同樣從 File
按 import → Sequence alignment file





匯入10條 sequence
























從上方列
選 Accessory Application → 還有那一長串的英文字



















跳出這個視窗
不要怕
儘管給他按下去 run!








之後 就會跑出結果




















從 save as
先隨便取個名字  用 Phylip format 存檔


之後到存檔的地方
把檔案名稱改成   infile  連副檔名都不要歐

之後 按靴子












出現





























分別輸入 
"R"
"enter"
"200"
"enter"
代表進行200次 replicates
再按
"Y"
"enter"
代表可以開始
但他還會要你輸入 random number seed
為避免當機 我們輸入"1"
"enter"
程式就會開始跑

出現像這樣的結果



























同時 資料夾裡面就會出現像這樣 oufile 的檔案
可以用記事本打開看看裡面有什麼樣的資料







但下一步 
我們要將這個 "outfile"的檔案 改成 "infile"

並開啟 prodist














一樣 輸入
"M"
"enter"
選 data sets
"D"
"enter"
"200"
"enter"


最後 按 "Y" "enter"
run 完 200筆 data





一樣的 此時在資料夾中會出現  outfile 的檔案
為進行下一步 也要將之改成 infile

選擇 neighbor 進入頁面


一樣將 replicates 改成 200
random number seed 輸入1
輸入 Y 開始 run






跟之前不同的是
此時 輸出的檔案
有 " outfile "
也有 "outtree"

我們將 outfile 刪除
將 outtree 改成  intree

打開 consense













進入後
直接輸入 "Y"
"enter"



一樣他會有 outfile 跟 outtree 

outfile 可以用記事本打開
已經可以看到樹狀圖
上面就可以看到距離標在上面

另一方面 outtree 我們用 treeview 及 hypertree分別看他呈現的東西


treeview





匯入我們剛剛的 outtree 檔案
就可以看到像下圖一樣的呈現方式
但他無法顯示距離
這時候就可以開著剛剛的 outfile 檔案 與裡頭的 distance 進行對照























hypertree



開啟 outtree 檔案後
還可以以不同方式呈現結果
linear
radial 
hyperbolic






































在上方 view 那邊可以選