Thursday, March 31, 2005

心得 : PepNovo De Novo Peptide Sequencing via Probabilistic Network Modeling(2005)

本篇Paper方法概述:
使用機率網路的方式來進行最佳Peptide的計分, 這些機率值表示出peptide fragmentation裡面化學和物理的規則 ; 不僅如此 , 這篇Paper也利用假設檢定的方式來查看出現的Peak是根據fragmentation model還是亂數引起的

M代表
(1) 如果針對的是Prefix Sequence
M=p1,...pi所有AA的mass總和

(2) 如果針對的是Suffix Sequence
M=Pi+1...Pn


說明:

沒有括弧的數字代表該種fragmen在我們所定義的"可見"spectrum裡面出現的機率; 有括弧的數字代表該種fragment在我們所定義的"全部"spectrum裡面出現的機率;

***這篇Paper沒有說怎麼算出這樣的機率,我在想是不是用出現的位置總數除以spectrum的數字總數
Sherenga的演算法利用以下兩者model一起說明出現的Peak :
1. 利用統計的model(peptide fragmentation)來解釋觀察到的Peak
2. 利用亂數模型來解釋出現的Peak

注意: 這個地方提到的m(Pi),其中Pi指的是每個AA之最基本的結構,如果要把這些AA的最基本結構結合起來變成peptide要再加上H2O

在CID的過程裡面, 通常會沿著peptide backbone切一刀, 我們可以分為prefix fragment(p1...pi)和suffix fragment(pi+1...pn) ,

尚未切之前的整個peptide叫做, precursor peptide, 如果precursor peptide又帶電者,稱為precursor ion

切完以後的結果有些會遺失一些東西,比如H2O和NH3

Sherenga Algorithm的作法:
(1)先假定共有K個ion type,並且定義出他們的offset(d1...dk)
(2)我們可以假定某種ion type的mass 是Si, 如此如果我們在Peak中出現Si+d1...等Peak, 我們就產生一個vertex, 如果兩個vertex的值很相近者,我們就將他們合併,因為他們來自於相同的cleavage site

這個Paper方法的前置步驟 :

(1) 對於m的各種ion計算intensity

這個Paper定義某個mass m的intensity之方法如下:

利用m左右兩邊差距為delta內的強度當作是mass m的最大強度者 ;
我們令Bm是m所有可能的範圍(如果切出來的AA之總和為m), 因此考慮到其可能的ion就會有以下的列式:
Bm={[b-d,b+d] , [y-d,y+d]...},
因此m根據Bm算出來的Intensity就是I=

有些Peak可能Intensity很高, 但是沒有被標註者, 很可能代表沒有被這裡的model考慮到或者根本就是污染物, 這裡會把這些沒有標註的Peak當做noise, 這些noise與Peak的ion之position相match的機率是 0.1, 當然有些intensity比較小者, 雖然會被noise蓋過去,但是我們可以藉由其他的ion來卻確認其機率
再來, 這個方法主要是利用relevance score的方法來Cite出Prefix masses,使這個方法其可以用Prefix mass(Spectrum中的node)來推測最後的結果 ; 因此, 推測的方法如下:

假設檢定的方式:利用

(1) Pcid(I|m,S) : 假設切出來的AA總和是m , 且為spectrum S, 則Pcid(I|m,S)代表可以出現I的機率

(2) Prand(I|m,S): 亂數造成I的機率

在這裡使用到的fragmentation rule,(決定何種ion fragment跟peak intensity比較容易被觀察到) ; 有三種因素影響到fragmentation rule:

(1)介於ion type之間的相依性和相關性 : 各種ion type彼此的關係 (圖1的一般箭頭)
(2) 切的位置也會有影響(圖1的虛線箭頭位置)
(3) 如果切的位置為N-terminal或者C-terminal端也會有影響 (圖1的粗線位置)

0 Comments:

Post a Comment

<< Home