De Novo Sequencing: 心得: PEAKS Powerful Software for Peptide De Novo Sequencing by MS MS(2003)

Peaks有四個步驟:
(1) 對原始資料前處理
(2) 對於給定的ion計算前10000最有可能的ion
(3) 重新評定選出來的10000條sequence
(4) 計算被評定最高的sequence之confidence

其中每個步驟分述如下:

(1)對原始資料前處理:
包括noise filtering, Peak centering和deconvolution(尚未在paper描述方法); 這個部分很重要, 因為這篇paper發現如果在這個部分處理的好,準確率往往會提高;可是如果我們使用儀器廠商所附的軟體,出來的結果往往會差很多

(2) 對於給定的ion計算前10000最有可能的ion

想法: 如果一個sequence的ion跟高強度的Peak相符數量越多的話,則出來的結果越有可能是正確的sequence

作法:(針對a,b,c,x,y和b/y-17/18)
產生所有可能的peptide,並依照理論值推論出可能的ion質量位置 , 例如,我們從某個peptide推出的B-ion,如果恰巧有個mass m很靠近的話,則我們進行算分動作

算分方法:

如2338頁的公式(1)-->針對y-ion, 其中h是欲定y-ion的強度, m'-m是跟預定的mass相比較的誤差, 至於h, h1, h2, h3分別指y-ion, X, y-H2O, Y-NH3的強度, 意即我們用這些ion的強度跟y-ion相比,並以此作為輔助說明Y-ion的存在程度, 我們可以從公式看到, 如果這些ion跟Y-ion強度越相近,則代表Y-ion越有可能存在的 (但是對於b-ion而言, 就要a ,c, b-H2O, B-NH3), 然後從裡面選出分數最高的10000條

(3)重新評定選出來的10000條sequence
重新評定的方法: 將mass error tolerance訂的更嚴苛, 並且將immonium ion和internal cleavage ion也考慮進去(為了效率並沒有在第二步驟的時就考慮進去)(至於怎麼算的,並沒有在裡面說清楚-->因為Peaks是商業軟體)

(4)計算被評定最高的sequence之confidence
由於第三步驟算出來的是尚未normalize的分數,無法在不同組別之間將這樣的分數拿出來進行比較,因此我們會根據score的分佈圖進行選擇最佳的sequence, 為X=exp(cx), c是由Peaks從spectrum測定過來的(沒有說怎麼做的)
最後,這篇paper也會針對每個AA的信心程度進行運算,告訴使用者每個AA的存在可能性

用average signal intensity來判定一個圖譜的好壞:

average signal intensity=s/m; s: 所有abundance超過2之peak的abundance總和
m : precursor ion的mass

因此, 如果mass越大者, 則就不容易辨別, 理論上需要的abundance的總和也要越大, 跟此公式相符

De Novo Sequencing

Wednesday, March 23, 2005

心得: PEAKS Powerful Software for Peptide De Novo Sequencing by MS MS(2003)

0 Comments:

About Me

Previous Posts