Friday, April 01, 2005

心得: Algorithms for de novo peptide sequencing using tandem mass spectrometry(2004)

使用de nov sequencing的六個理由:

(1) 對於有興趣的protein之sequence可能不存在資料庫裡
(2) Gene-finding的程式可能有錯, 因此即使資料庫裡面有這樣的資料, 也會找不出來
(3) 有些科學家可能在學習基因體學之前想先學習蛋白質體學, 此時就沒有sequence database可以用
(4)Gene經過alternative splicing或者SNP後可能會有新的protein
(5)de novo sequencing對於找mutation和modification的AA會有幫助
(6)當database search的結果有ambiguous的時候,可以利用de novo sequencing來做驗證

目前提過的方法有下列幾種:

(1) 產生所有可能的sequence並且產生理論的spectrum, 並與實際的spectrum進行比較-->計算量過大

(2) 一次延伸一個, 這裡的問題在於中途如果有比較不好的data就不容易皆起來

(3) 利用使用者繪圖的介面來表示資料, 這種方法對於實際的問題沒有太大的幫助,但是可以幫助使用者很快地瞭解資料

(4)使用graph theroy

SeqMS的作法:
(1) 將ion type對上每個可能的機率
(2) 每個peak根據(1)轉換成spectrum graph
(3)藉由兩個node之間的差距進行連結
(4) 從N-terminal到C-terminus找最短路徑

Sherenga的演算法:
(1) 從一大堆的已知的spectrum學習ion type的特性
(2) 利用這些ion的特性將S轉化成spectrum(一個S可能可以轉換成k種ion), 因此, 1個ion在spectrum graph裡面就有k個點, 我們計算兩個點之間的差距來得出可能AA, 要找出最長的距離, 這樣的方法可能會找到許多不符合現實狀況的sequence

0 Comments:

Post a Comment

<< Home