Sunday, March 27, 2005

心得:On de novo interpretation of tandem mass spectra for peptide identification(2003)

說明:
通常最常見的fragment是a,b,y, 而高能的儀器通常會產生除了其他種的ion,例如, internal ion等

一般來說,目前用來分析tandem mass資料的軟體都有以下三個模組:

(1)Interpretation(預備資訊):
輸入:
MS/MS spectrum
輸出:
詮釋過後的MS/MS data, 可能包括了parent peptide mass, partial 或者complete sequence tag或者combination of sequence tag和molecular massed

(2) Filtering (找出可能的peptide):
輸入:
詮釋過後的MS/MS data 和peptide sequence database
輸出:
可能產生MS/MS spectrum的peptide

(3)Scoring(開始算分):
輸入:
可能的peptide和MS/MS spectrum
輸出:
將peptide計分並且排序,並給予一個p-value(該計分分數可以被隨機達到的機率)

說明:
如果我們能夠知道一個Peak是屬於何種ion type,則我們就可以猜出這個sequence的前段部分之質量, 例如: 在圖2中, 一個peptide的mass是925, 如果我們切成b和y-ion兩部分,則如果我們找到633這個peak是y-ion的話, 則我們可以推對b-ion(前段部分)的mass就是SGF

SHERENGA的作法 :

Dancik 提出spectral graph的概念:

每個peak都對應到幾個node, 每個node都代表了一種ion type, 如果某個node u可以連到V且差距為某個AA,將其連起來, 其中找到最長的path就是該sequence

缺點: 這種方法會造成最長的path裡會連到許多是來自於同一個peak的node

這篇Paper方法的主要概念:

(1)會針對大部分常見的ion type,不僅是a, b, y, 也包含neutral loss

(2) 針對強度高的noise進行扣分,針對interpreted peak和被指定的ion type進行加分

(3) 利用dynamic programming找出sub-optimal的interpretation, 包含core-interpretation(指與optimal interpretation同樣對某些peak指定相同的ion)

概念:
(1.)盡量找出對應到同一個amino-acid的mass數目,並使其最大化
(2.)由於有可能peptide斷的時候不完全,因此有的時候不會對到, 我們將一些已經對到的peak最大化,並利用沒有對到的peak來作為扣分的基礎

方法概述:
(1) 找出一些Peak,這些Peak之間進行排序,R1,...Rm, 假設ri=Ri-Ri-1, 如果r1+r2....rm可以等於一個Parent mass,則我們取出這些Peak的組合

像這樣Peak組合可以有很多個, 我們用以下的步驟來選出比較好的Peak組合

(2) 這些Peak如果可以轉換成某種ion Type, 在Paper中的THEOREM 2中, 如果這樣的Peak不能轉換成某種ion type, 則我們會對這樣的Peak組合進行扣分, 但是Peak如果轉換後, 分成 小於 M/2和大於 M/2兩部分(我們都會看看轉換成ion type後, 何者的分數會比較高, 如果是轉換成<> M/2比較強, 就使用 > M/2, 就跟Ting Chen的paper是一樣的, 對於一個ion, 我們一次只選M/2的右邊或者左邊)


至於在5.1提到Suboptimal interpretation, 則是利用將演算法方法裡加一個參數可以記錄前幾個比較好的Peak組合, 如此就可以List所找出的答案

除此之外, 如果把S當成forward score (由上往下),則這裡又定義一個backward score, 如果把forward中和backward中的分數加總如果是最大的,則稱找到的Peak組合是core interpretation

0 Comments:

Post a Comment

<< Home