AIDD -人工智能药物设计 -蛋白质柔性的预测
PROTOCOL|NMR:蛋白质柔性的预测
今天为大家介绍的是来自Mark Berjanskii和David S Wishart团队的一篇论文。研究团队提出了一种基于NMR化学位移预测蛋白质灵活性的新方案。该方案包括计算随机线圈指数(RCI),并据此预测蛋白质的预期均方根波动(RMSF)和序参量(S2)。与现有方法相比,该方案的优势在于无需预先了解蛋白质的三级结构,对蛋白质整体翻滚不敏感,且无需额外进行NMR测量。当化学位移赋值可用时,可在短时间内通过电子表格程序计算出蛋白质柔韧性参数。
介绍
蛋白质运动在多种生物过程中起着核心作用,但获取其详细实验描述仍具挑战性。现有方法,如X射线晶体学和分子动力学模拟,存在局限性和复杂性。NMR光谱虽成为研究蛋白质动力学的优选方法,却也面临数据分析复杂和对蛋白质三级结构依赖等问题。为此,研究团队提出了一种新方案,仅利用NMR化学位移数据预测蛋白质骨架灵活性。该方案通过随机线圈指数(RCI)确定主链顺序参数或均方根波动(RMSF)值,准确度高且避免了上述限制。与现有技术相比,RCI方法无需预先了解三级结构,对蛋白质整体翻滚不敏感,且无需额外NMR测量。研究团队还提供了将RCI值转换为无模型阶参数的经验表达式,并期望该方法能常规用于评估蛋白质灵活性,解决蛋白质动力学和生物分子NMR中的各种问题。
实验设计
表1
研究团队提出的方案包含四个主要部分:化学位移赋值的参考校正、序列特异性随机线圈化学位移的计算、RCI(加权次级化学位移的倒数平均值)的计算,以及预测NMR(核磁共振)和MD(分子动力学)系统的无模型阶参量和均方根涨落(rmsf)。方案的有效性高度依赖于准确引用的化学位移数据,这要求用户遵循国际纯粹与应用化学联合会(IUPAC)和分子生物学(IUBMB)的标准,确保使用正确的化学位移参考,如2.2-二甲基-2-硅戊烷-5-磺酸(DSS)。鉴于已发表工作中存在的参考问题,该节中提供了一个基于全局最小化特定蛋白质中螺旋和β链化学位移间平均差异的简单参考校正程序。
为生成精确的RCI值,首先需确定一组序列特定的随机线圈化学位移,这些位移是从Dyson等人发表的、在减少远程肽内相互作用的溶剂条件下获得的随机线圈化学位移及其最近邻残差修正中计算得出。RCI值通过特定公式计算,并通过优化权重系数以最大化与MD集合的rmsf之间的相关性。所得RCI表达式在包括新蛋白质在内的训练集和测试集上均表现出良好的相关性。
此外,RCI方法与无模型阶参数和NMR集合的rmsf也具有良好的相关性,表明RCI可作为蛋白质灵活性的有效指标。然而,对于蛋白质末端的RCI值应谨慎解释,因为多肽链终止对随机线圈化学位移值和邻近残基校正的影响尚未充分明确,在RCI计算中未充分考虑。因此,建议用户忽略或谨慎解释三个末端残基的RCI值,或应用末端效应校正后,将其视为末端通常观察到的蛋白质柔韧性特征。
程序
表2
表3
公式
程序旨在通过一系列步骤计算蛋白质的RCI值,并据此预测其灵活性参数。程序首先要求建立一个包含蛋白质氨基酸序列的电子表格,并计算序列校正的随机线圈参考值。随后,通过从实验化学位移中减去这些参考值,计算每个残基的二级化学位移。若化学位移赋值未正确引用,则需进行参考校正,这包括确定蛋白质的二级结构,计算参考偏移量,并校正光谱参考。之后,根据化学位移赋值的可用性确定最终二级结构赋值。
程序接着去除Cys残基的二次化学位移,并用底值代替,同时填补二次化学位移分布中的空白。然后,应用三残基平均方法来平滑化学位移分布,并对二次化学位移进行适当调整。接下来,确定加权系数,利用公式计算RCI值,并可能进行端效应校正。最后,应用第二个三残差平均程序来平滑RCI值的分布,并使用公式预测MD集合的RMSF值、NMR集合的RMSF值以及无模型序参数S2。
结论
在该项研究中,研究团队系统地阐明了SARS-CoV-2基因突变ACE2受体结合和疫苗接种免疫的共同进化。并建立基于人群免疫的预测模型,评估算法预测的新型SARS-CoV-2变异体或广泛传播前新出现的变异体的流行风险。团队的研究结果对理解不同疫苗接种方法和自然感染导致的人群免疫变化有重要贡献。反过来,这可以为疫苗开发提供有价值的见解并指导公共卫生战略,特别是在未来的努力中与机器学习工具相结合时。
时机
当骨架分配可用时,可以在1-2小时内使用电子表格程序从RCI协议中重新引用化学位移,并预测蛋白质的灵活性。用户也可以将协议编码到电子表格程序中,以便在几秒钟内执行对新蛋白质的后续分析。
预期结果
图1
预期结果为,通过计算得出的RCI值与常规的蛋白质柔韧性测量值之间将呈现出良好的相关性,其平均相关系数约为0.8。这一相关性已通过图表和统计数据得到了证实,其中图1展示了RCI方法预测的MD RMSF、NMR RMSF和S’值与标准方法获得的值之间的比较。尽管将RCI值转换为MD RMSF、NMR RMSF或S’值并非必要,因为这种转换不会改变RCI所包含的信息内容和灵活性预测的质量,但RCI衍生的传统运动幅度测量可能更易于与蛋白质运动模型相关联,并方便与标准方法获得的参数进行对比。在需要这种转换的情况下,可以使用提供的公式(2)-公式(4)进行计算。
参考文献
1.Carugo, O. & Argos, P. Reliability of atomic displacement parameters in protein crystal structures. Acta Crystallogr. D Biol. Crystallogr. 55, 473–478 (1999).
2.Petsko, G.A. & Ringe, D. Fluctuations in protein structure from X-ray diffraction. Annu. Rev. Biophys. Bioeng. 13, 331–371 (1984).
原文链接:
https://www.nature.com/articles/nprot.2006.108
留言
暂无留言