氨基酸测序中的技术难点

2022-01-08

埃德曼降解法(Edman Degradation)

埃德曼降解法创立于上世纪50 年代,该技术首先通过一系列化学反应将蛋白质或多肽的氨基(N)末端氨基酸去除,然后使用电泳或色谱法对其进行鉴定,接着重复此过程,直到得到整个肽段的氨基酸序列1。

 

埃德曼降解法的局限性有以下几点:

1) 降解过程缓慢,每个循环需要约1个小时;

2) 此方法仅适用于少于30个氨基酸长度的蛋白或多肽,较大的蛋白质无法通过埃德曼测序进行测序,对于样品含量要求也较高;

3) 如果蛋白N端有翻译后修饰(例如,乙酰化),此方法无法使用;

4) 此方法无法测得非α-氨基酸;

5) 埃德曼降解法仅能对单一的蛋白质样品进行测序,因此与其他技术(如质谱法)相比,它缺乏高通量能力,流程效率较低,不适用于样品数量较多的情况;

 

虽然目前可以通过对蛋白质进行酶切或化学裂解以产生较短的多肽,然后进行分离和测序,使以上问题得到缓解1,但埃德曼降解法固有的技术局限依然未得到解决,因此该方法不是理想的蛋白测序方法。

 

质谱法(Mass Spectrometry)

质谱技术与蛋白质组学的发展给氨基酸测序带来了新突破,并广泛取代了埃德曼降解法。 基于质谱的氨基酸测序流程包括蛋白质酶切,多肽离子化,使用质谱对其进行分离和检测。

 

质谱氨基酸测序技术的难点之一在于质谱仪的性能和灵敏度,不过目前的质谱仪已经相当成熟,例如,Thermo Fisher生产的Orbitrap Fusion Lumos 和 Orbitrap Eclipse质谱仪,从根本上提高了蛋白质组分析的灵敏度,速度和准确性,可用于高通量蛋白测定和大规模的标记定量蛋白质学分析等,是现在市场上最先进的质谱设备。

 

质谱法测序的另一大技术难点在于如何摆脱对序列数据库的依赖。目前大多数测序需要参考将测得的多肽序列在蛋白或基因组数据库中进行搜索,再与同源序列进行比对和匹配,然而由于一些蛋白序列尚未被测序或纳入数据库,这就很容易造成对某些蛋白的无法比对或错误识别。虽然可以通过优化数据库比对的算法和软件来提高测序准确率,但对于数据库中不存在的全新蛋白来说意义不大。

 

针对上述问题的最佳解决办法是蛋白质进行从头测序(de novo sequencing),这是一种一种不依赖于任何已知的序列或者蛋白质数据库信息,直接对蛋白质氨基酸序列进行测定的全新测序技术,通过高精度液相色谱串联质谱法与生物信息学算法的结合,该方法可以攻克上述技术难点,直接解码氨基酸序列。

 

快序生物是抗体蛋白从头测序的全球领跑者,团队开发了先进的从头蛋白测序软件和蛋白质组学技术,只需 0.1 mg的蛋白样品,即可保证从 N 端到 C 端,重链轻链准确配对的100%序列覆盖,一举攻克当前氨基酸和蛋白测序的种种难关。

 

 

参考文献

1. Alfaro, J. A. et al. The emerging landscape of single-molecule protein sequencing technologies. Nat Methods 18, 604-617, doi:10.1038/s41592-021-01143-1 (2021).

2. Hughes, C., Ma, B. & Lajoie, G. A. De novo sequencing methods in proteomics. Methods Mol Biol 604, 105-121, doi:10.1007/978-1-60761-444-9_8 (2010).