2012年11月1日 星期四

Phylogenetic Analysis (練習)


Phylogenetic Analysis

須經過 blast、alighment、tree view 的流程,如下圖所示




簡單來說,就是 building tree 的過程
而可以藉此瞭解我們所要看的 sequence or protein evolve 的過程與特性

這次我們略過 blast 的部份
直接用 demo sequence 從 alignment 開始

首先 
打開 Bioedit 這個軟體
























點 file
選擇 New Alignment


















出現這個畫面























之後 同樣從 File
按 import → Sequence alignment file





匯入10條 sequence
























從上方列
選 Accessory Application → 還有那一長串的英文字



















跳出這個視窗
不要怕
儘管給他按下去 run!








之後 就會跑出結果




















從 save as
先隨便取個名字  用 Phylip format 存檔


之後到存檔的地方
把檔案名稱改成   infile  連副檔名都不要歐

之後 按靴子












出現





























分別輸入 
"R"
"enter"
"200"
"enter"
代表進行200次 replicates
再按
"Y"
"enter"
代表可以開始
但他還會要你輸入 random number seed
為避免當機 我們輸入"1"
"enter"
程式就會開始跑

出現像這樣的結果



























同時 資料夾裡面就會出現像這樣 oufile 的檔案
可以用記事本打開看看裡面有什麼樣的資料







但下一步 
我們要將這個 "outfile"的檔案 改成 "infile"

並開啟 prodist














一樣 輸入
"M"
"enter"
選 data sets
"D"
"enter"
"200"
"enter"


最後 按 "Y" "enter"
run 完 200筆 data





一樣的 此時在資料夾中會出現  outfile 的檔案
為進行下一步 也要將之改成 infile

選擇 neighbor 進入頁面


一樣將 replicates 改成 200
random number seed 輸入1
輸入 Y 開始 run






跟之前不同的是
此時 輸出的檔案
有 " outfile "
也有 "outtree"

我們將 outfile 刪除
將 outtree 改成  intree

打開 consense













進入後
直接輸入 "Y"
"enter"



一樣他會有 outfile 跟 outtree 

outfile 可以用記事本打開
已經可以看到樹狀圖
上面就可以看到距離標在上面

另一方面 outtree 我們用 treeview 及 hypertree分別看他呈現的東西


treeview





匯入我們剛剛的 outtree 檔案
就可以看到像下圖一樣的呈現方式
但他無法顯示距離
這時候就可以開著剛剛的 outfile 檔案 與裡頭的 distance 進行對照























hypertree



開啟 outtree 檔案後
還可以以不同方式呈現結果
linear
radial 
hyperbolic






































在上方 view 那邊可以選



2012年10月31日 星期三

CLC Sequence Viewer

這個軟體的基礎頁面






















點選 import 匯入之前從NCBI下載好的 GeneBamk format


















點選他 就能顯示出來



























列出序列 





便能依據右方的 list 選擇想看的東西








右上的欄位

也可以轉換 sequence表達的方式





另外,左下角也有像這樣的圖式




可依據需求轉換得到資料
像是把DNA變成circlular form的 即便他原本是linear的
































還可以利用右邊的工具 加上restriction enzyme cut 如果需要


































因為我們一開始就已經從NCBI得到這個gene的data
但要是一開始沒有的話
也沒關係
直接開啟這個軟體
裡面一樣可以找到

如圖 按download 
可以看到他的 title 顯示NCBI research 
選擇好類別
輸入gene name 
一樣可以下載到 gene information 至這個軟體進行其他操作



































而左邊有一個 Toolbox





從DNA轉RNA
RNA轉DNA
reverse
translation 得到 protein sequence
都可以輕鬆在這裡操作















因為他裡面功能實在太多了
所以就 假設我想知道 zap70 這個 gene 的每個open reading frame
先回到sequnce那邊
在左手邊 ToolBox中找到 Find open reading frame 按下去




























就會跳出這個視窗
選定好 按 next


































接下來
我選擇 list all start codons 
按 finish



































就會出現!!
包括位置、大小、哪個strand、codon sequence








2012年10月22日 星期一

NCBI -- gene

從 NCBI Gene 找出 zap70 文獻、中心法則(mRNA, protein sequence)與 GO 相關的資訊



首先到NCBI 選擇 gene 類別 輸入 zap70



選擇 Homo sapiens


進到 zap70 所有 information 列出的畫面























裡面的每一個三角形 都表示著一個類別的 information 
看小標題就可以快速找到要找的資訊




其中一個類別 RefSeq  
裡面可以找到完整的 genomics , mRNA , proteins  




























genomic 進到 GeneBank
有對於 zap70 更詳細的描述
包括他的DNA sequence


然也可以在 genomic 中 得到FASTA sequence



mRNA and proteins 中看到  zap70 有兩種 isoform


























isoform 1
mRNA 






protein


isoform 2
mRNA


protein















接下來要找找與 GO 相關的資訊
GO -- gene ontology 
一樣是小標題的其中之一













裡面包含
function



process



























component
















點進去還可以連到相關的paper
標題旁邊的 provided by GOA 點進去 
連到GO information 的首頁 
輸入gene name
又可以得到更多相關資訊