Saturday, August 31

[TECH] Cygwin 與 PyMol

開宗明義,這篇應該是超基礎(倒地)。這不是我的 project,是新實驗室一個學妹的 aquaporin project。就當作複習 mock linux 和大四學的東西吧。下面內容不龐但雜,只是隨手一些筆記。然後我果然還是摳門只愛用 open source 軟體的人(跪謝 GNU)。

Cygwin 官網:http://www.cygwin.com/
PyMol 官網:http://www.pymol.org/
PyMol wiki:http://pymolwiki.org/index.php/Main_Page

PyMol 是(在 linux 系統上)免費的分子結構模擬軟體,用中文略彆扭,但基本上就是你可以用 PyMol 來編輯和看 .pdb 檔案。作 biophysics、molecular modelling 與 biochemistry 的人應該很常用。

筆記下收。


01. 切換路徑(change directory)
Cygwin 大致上說來是在 windows 系統上模擬 linux 的介面,所以安裝好後 root 預設為 Cygwin 的資料夾。如果要用其他磁區,需要在前頭加上「cygdrive/」的 dir 前綴。比方說要開啟在 D 磁碟的檔案,就必須如下寫:

cygdrive/d/

02. PyMOL on Python
PyMOL 截至今天(2012.8.31)為止,只與 Python 2.7 相容。安裝方式很簡單,先下載 Python 2.7,按照平常安裝其他軟體的方式安裝好以後,下載 PyMOL 安裝即可。用 Linux/Cygwin 的方式安裝,反而會因為 Windows registry 沒有紀錄,安裝 PyMOL 時會自動終止。

滑鼠指令下,按住右鍵在分子視窗中下拉是放大,上拉是縮小。

03. PyMOL 以 cmd panel 開啟 .pdb file
用的指令是 load,後接路徑即可。

04. PyMOL 將 biological unit 中的 monomer 存成單一 .pdb file
首先須將 Mouse 選單下 selection mode 的預設改成 chains。直接用滑鼠選擇想另存的 monomer,開啟 File > Save Molecule > 按照預設的格式,選擇想存的資料夾存檔即可。

05. 將兩個 structure 重疊
  • Align(右側選單 action 下):依照蛋白質序列如 sequence alignment 那樣對照以後將兩個結構疊加在一起。僅適合非常相似的序列,要是序列長度有差,會產生某結構中間中斷的狀況。不過 PyMOL 在 sequence alignment 後還會再算一次 RMSD 確認結構 overlay 不會差太遠。在 external GUI(非圖像的小視窗)裡可以看到最後的 RMS value。用 cmd panel 寫法如下:
align struct1, struct2

其他更複雜的 alignment constrain 可參考 Queen's University 的這個頁面


06. 找 motif
一個方便的 plugin 指令是 Findseq(需自 python wiki 額外下載 python code)。下載後執行以下指令:

import findseq
// 將此 plugin 程式導入

findseq [要找的 motif], [molecule 名稱], [找到的所有 hit 的 name], [是否只顯示第一個結果]
// 預設找出的 motif name 會是 findseq 後面加上亂數,預設會把所有找到的結果都顯示出來

// 例如我要從 SoPIP1;2 中找出 NPA motif,而且不希望有其他不專一的結果,可以如下寫:
findseq NPA, 1Z98, NPA_1Z98, 1

結果如圖:


個人經驗,這個 function 如果最後一項參數設為 0 或是不寫(預設為0),會出現很多不專一的結果。像上面的例子,第一次找的時候還出現 valine,大概最初是先蒐 sequence,後來才考慮相近的 amino acid 屬性吧。

07. 標示生化特性
PyMOL wiki 上有一整章在討論這部分。



No comments :

Post a Comment