De Novo Sequencing: 想法整理

想法整理：

1. 利用b-ion（要先判定）跟y-ion的強度決定de novo 出來的Quality（利用Si’=X-Si-d），見JCB的SHERENGA: De novo peptide sequencing via tandem mass spectrometry(1999)。

2. 利用這種b-ion轉成y-ion後出現類似peak的數量增強scoring function。

3. 將Random Peak的概念加入GA-based de novo sequencing。

4. 會不會最好的分數不一定會代表原來的sequencing。

(Ans: 1. 有可能，所以Ting Chen提出suboptimal，2. 可能代表你的scoring function不好)。

5. 利用Google的Rank方式來找出最有可能的Peptide(de novo)。

6. 將Intensity的資訊考慮進去GA model。

7. 想出一個方法來解決GA中一個sequence如果差異一個AA，整個圖譜就會差異很大的狀況。是不是可以每個圖譜之間的Peak之difference進行match

例如: 1. A B C D (假設之間的差距用d1, d2, d3表示) 2.A’B’C’D’ (假設之間的差距用d1’, d2’, d3’表示)，我們可以利用d1, d2, d3來align(與GA paper方法不太相同，GA是A’-A利用相減來得到)

8. 最好出來能夠reporducible

9. 另外，沒有match到的要扣分？（一般都要，但適合在GA嗎？跟IR一樣，如果有not者要去掉嗎？）

10. 如果用GA paper第四項的方法，就不容易判斷是否相似，例如：

Experiment: GAP (58, 129, 226)

Predication: GSP (58, 145, 242)

P1 P2 P3

------------------

E1|0 -87 -184

E2|71 -16 -113

E3|168 81 -16

如果照GA的方法，不容易看出加什麼樣的值，如果多個的話又更不容易了

但是如果使用GAP，GSP之sequence差，就可以看出：

例如：

58 129 226 à 58, 71, 97

58 145 242 à 58, 87, 97

利用這種相同差異的方式可以更容易判斷相似性，且要有相似性à可以考慮用Blast或其他alignment的方式進行（要考慮GAP的狀況）

11. 或者可以考慮GAPAPG，其中GAPAPG跟APG可以取中間段與段之間的方式就可以跳過不符合者。

12. 利用LuteFisk跟GA（或其他方法）進行混合，可以看出兩個相似的sequence在哪，並解決ambiguity的地方。

13. 先計算一次自己的作法實驗是否合理，自己可以先用筆算(用alignment)的方式（可以利用GA Paper裡面的資料）。

14. 如果要算GA的scoring function，可以先將experimental之b-ion(利用各種ion加強b-ion分數找出後)，再進行match(alignment或者GA)。

15. 查我們所用的MS是High-Energy 或者Low Energy，並查這兩者的不同。

16. 是不是可以將PepNovo和GA的方法結合，因為PepNovo是找出P(S|P)，這個部分似乎可以採用GA，目前的方法是因為search space過大，不容易找出答案，因此我們可以用GA+PepNovo

17. 將各種ion相依性考慮在系統內

18. 利用密度判定品質的好壞（GA可以進行score），太密集者，雜訊過多，可能代表noise多，要扣分。

19. 利用一次延伸一個的作法，中間無法接的，用GA

產生b-ion是否跟著要產生y-ion

De Novo Sequencing