想法整理
想法整理:
1. 利用b-ion(要先判定)跟y-ion的強度決定de novo 出來的Quality(利用Si’=X-Si-d),見JCB的SHERENGA: De novo peptide sequencing via tandem mass spectrometry(1999)。
2. 利用這種b-ion轉成y-ion後出現類似peak的數量增強scoring function。
3. 將Random Peak的概念加入GA-based de novo sequencing。
4. 會不會最好的分數不一定會代表原來的sequencing。
(Ans: 1. 有可能,所以Ting Chen提出suboptimal,2. 可能代表你的scoring function不好)。
5. 利用Google的Rank方式來找出最有可能的Peptide(de novo)。
6. 將Intensity的資訊考慮進去GA model。
7. 想出一個方法來解決GA中一個sequence如果差異一個AA,整個圖譜就會差異很大的狀況。是不是可以每個圖譜之間的Peak之difference進行match
例如: 1. A B C D (假設之間的差距用d1, d2, d3表示) 2.A’B’C’D’ (假設之間的差距用d
8. 最好出來能夠reporducible
9. 另外,沒有match到的要扣分?(一般都要,但適合在GA嗎?跟IR一樣,如果有not者要去掉嗎?)
10. 如果用GA paper第四項的方法,就不容易判斷是否相似,例如:
Experiment: GAP (58, 129, 226)
Predication: GSP (58, 145, 242)
P1 P2 P3
------------------
E1|0 -87 -184
E2|71 -16 -113
E3|168 81 -16
如果照GA的方法,不容易看出加什麼樣的值,如果多個的話又更不容易了
但是如果使用GAP,GSP之sequence差,就可以看出:
例如:
58 129 226 à 58, 71, 97
58 145 242 à 58, 87, 97
利用這種相同差異的方式可以更容易判斷相似性,且要有相似性à可以考慮用Blast或其他alignment的方式進行(要考慮GAP的狀況)
11. 或者可以考慮GAPAPG,其中GAPAPG跟APG可以取中間段與段之間的方式就可以跳過不符合者。
12. 利用LuteFisk跟GA(或其他方法)進行混合,可以看出兩個相似的sequence在哪,並解決ambiguity的地方。
13. 先計算一次自己的作法實驗是否合理,自己可以先用筆算(用alignment)的方式(可以利用GA Paper裡面的資料)。
14. 如果要算GA的scoring function,可以先將experimental之b-ion(利用各種ion加強b-ion分數找出後),再進行match(alignment或者GA)。
15. 查我們所用的MS是High-Energy 或者Low Energy,並查這兩者的不同。
16. 是不是可以將PepNovo和GA的方法結合,因為PepNovo是找出P(S|P),這個部分似乎可以採用GA,目前的方法是因為search space過大,不容易找出答案,因此我們可以用GA+PepNovo
17. 將各種ion相依性考慮在系統內
18. 利用密度判定品質的好壞(GA可以進行score),太密集者,雜訊過多,可能代表noise多,要扣分。
19. 利用一次延伸一個的作法,中間無法接的,用GA
0 Comments:
Post a Comment
<< Home