REVIEWS

Precise Synthesis of Proteins/Peptides: Advances in Single-Site Selective Chemical Modification and Automated Synthesis Technologies

  • Cheng Ren a, b ,
  • Chengxi Li , a, b, *
Expand
  • a Key Laboratory of Biomass Chemical Engineering of Ministry of Education, College of Chemical and Biological Engineering, Zhejiang University, Hangzhou 310027
  • b Zhejiang Key Laboratory of Intelligent Manufacturing for Functional Chemicals, ZJU-Hangzhou Global Scientific and Technological Innovation Center, Zhejiang University, Hangzhou 311215
* E-mail:

Academic Papers of the 27th Annual Meeting of the China Association for Science and Technology.

Received date: 2025-05-21

  Revised date: 2025-06-18

  Online published: 2025-08-27

Supported by

National Natural Science Foundation of China(22208290)

Abstract

The precise synthesis of proteins and peptides is fundamental for developing innovative therapeutics, high-per- formance molecular probes, and advanced functional materials. Recent advances in single-site selective chemical modification and automated synthesis technologies have significantly improved precision in sequence control, enabled site-specific introduction of functional groups and diversified modification. These developments have effectively addressed the issue of product heterogeneity from traditional non-selective modifications while substantially improving the efficiency and precision of complex sequence synthesis. This review summarizes the research progress in single-site modification strategies for proteins/peptides over the past five years (2020~2025), focusing on site-specific direct modification, ligand-directed modification, and linchpin-directed modification. It also provides a systematic evaluation of recent developments in automated precision synthesis technologies. These technological innovations have not only enhanced the capability for controllable synthesis and precise functionalization of protein/peptide, but also created new opportunities in drug development, molecular probe engineering, and bioconjugation applications. Looking ahead, the development and application of novel bioorthogonal reagents, the integration of innovative dynamic modification technologies, and AI-assisted synthesis route optimization will emerge as key research directions, promising to drive breakthroughs in protein precision synthesis.

Cite this article

Cheng Ren , Chengxi Li . Precise Synthesis of Proteins/Peptides: Advances in Single-Site Selective Chemical Modification and Automated Synthesis Technologies[J]. Chinese Journal of Organic Chemistry, 2025 , 45(9) : 3128 -3147 . DOI: 10.6023/cjoc202505023

蛋白质和多肽作为生命活动的核心功能分子, 在生命系统中发挥着不可替代的调控作用. 它们通过调控细胞信号传导、免疫应答和酶促反应等关键生物过程, 实现对生命活动的多维度调控[1]. 随着蛋白质结构与功能关系研究的不断深入, 特别是结构生物学与单分子技术的革命性进展, 其精确的结构调控机制已成为解析生命本质的关键科学问题, 同时也为开发高靶向性、高安全性的新型生物大分子药物提供了理论基础[2]. 在此背景下, 蛋白质/多肽精准合成技术作为核心驱动力, 正推动相关研究领域的快速发展. 该技术能够构建自然界不存在的或难以获取的、具有特定功能优化(如增强稳定性、提高活性、引入新型功能基团)的工程化蛋白质或多肽药物, 从而为重大疾病治疗提供创新性分子工具.
近年来, 单一位点化学修饰技术与自动化合成平台的协同发展, 显著推动了蛋白质和多肽的精准合成进程. 这些技术突破使得在分子水平上实现对蛋白质/多肽结构的精确调控成为可能, 从而深化了对构效关系的理解. 在蛋白质/多肽精准修饰领域, 通过发展基于位点特性的直接修饰、配体导向修饰及关键点定向修饰等策略, 已实现了对复杂生物大分子的单一位点精确修饰[3]. 这些技术的发展为开发高均一性的抗体药物偶联物(ADCs)等新一代生物制剂奠定了重要基础, 显著提高了治疗药物的靶向特异性和安全性. 在单一位点化学修饰技术持续提升分子结构精确调控能力的同时, 针对多位点协同修饰、大规模蛋白质库构建等更复杂、更高通量的应用需求, 整合了固相合成、微流控技术、高通量自动化平台及人工智能辅助序列设计等先进技术的新型自动化合成系统, 展现出显著的协同效应[4]. 该技术不仅能够实现含特定非天然氨基酸或其衍生物的目标蛋白质或多肽的按需精准合成, 更能显著提高复杂生物分子的合成精确度和规模化制备效率, 从而将蛋白质/多肽精准合成技术推向新的发展阶段.
本文系统评述了近五年来单一位点化学修饰与自动化合成平台的协同创新对蛋白质及多肽精准合成领域的推动作用. 这些技术突破不仅克服了传统方法在修饰位点控制和合成效率方面的局限性, 更通过“精准化学”研究范式实现了蛋白质结构的可控合成, 为开发具有增强稳定性、提高靶向性及创新功能活性的生物治疗分子提供了关键技术支撑.

1 蛋白质/多肽单一位点选择性化学修饰

蛋白质/多肽的精准化单一位点选择性修饰与标记是化学生物学领域实现分子功能定向改造的关键, 其核心目标是在复杂生物分子环境中实现对特定一个氨基酸残基或位点的高效、精准修饰. 早期的化学修饰方法往往缺乏位点特异性, 难以满足基础研究和生物医药应用的需求. 近年来, 通过理性设计反应试剂或利用蛋白质局部微环境特性, 研究者已开发出多种位点特异性修饰策略[3]. 本节将系统总结近五年来蛋白质/多肽单一位点选择性修饰的研究进展, 包括基于位点特性的直接修饰技术、配体导向策略及关键点定向方法.

1.1 基于位点特性的直接修饰技术

对蛋白质/多肽序列中的高活性氨基酸进行直接修饰是一种简便高效的策略, 但该方法常因序列中存在多个同种氨基酸残基而导致非特异性修饰(图1). 基于特殊位点独特结构或化学环境的选择性修饰技术解决了这一问题. 该技术通过理性设计反应试剂或优化反应条件, 使修饰反应优先发生在特定位点, 从而实现对蛋白质/多肽的单一位点精准标记. 例如, Bernardes和Jiménez-Osés等[5]通过计算机辅助设计磺酰丙烯酸酯试剂, 实现了对天然蛋白质中单个赖氨酸残基的高效、区域选择性修饰. 该方法基于赖氨酸局部微环境赋予的独特反应性差异, 通过试剂中磺酰基与目标赖氨酸ε-氨基形成的氢键网络稳定椅式过渡态, 显著降低了反应能垒, 并选择性地靶向pKa最低的赖氨酸残基[如重组人血清白蛋白(HSA)中的K573和溶菌酶中的K33], 实现动力学控制的单个赖氨酸残基修饰. 尽管该策略在特定蛋白中效果显著, 但其普适性仍受蛋白质特定结构的限制. 相较而言, 针对多肽和蛋白质末端的位点选择性修饰展现出更显著的优势. 其原因在于, 单链蛋白质仅含有一个N端或C端, 位点特异性明确; 该位点通常暴露于溶剂环境中; 特别是N端α-氨基与赖氨酸侧链ε-氨基的pKa差异显著. 这些特性使末端选择性修饰技术成为蛋白质修饰改造中非常具有发展前景的修饰策略, 尤其在需要保持蛋白质整体结构的应用中具有独特价值[6].
图1 蛋白质/多肽单一位点直接修饰策略

Figure 1 Single-site direct chemical modification of proteins/peptides

1.1.1 N端氨基单一位点修饰

对于N端氨基的单一位点修饰, 关键在于区分对赖氨酸氨基的反应活性, 传统缩合反应往往导致多位点修饰产物的生成. 开发新型试剂或方法可以使修饰在动力学或热力学上优先作用于N端氨基. 利用醛基与氨基的高效缩合反应特性, Wong团队[7]在2020年研究了2-乙炔基苯甲醛(2-EBA)在多肽和蛋白质N端选择性修饰中的应用及其机制, 通过系统筛选反应条件和2-EBA的结构与活性关系, 发现电子效应和pH调控对N端修饰的选择性具有重要影响(图2a). 在弱酸性条件(pH=6.5)下, 带有供电子基团的2-EBA表现出优异的N端选择性(>99:1), 而碱性条件(pH=9.0)和吸电子基团使反应更倾向于赖氨酸ε-氨基的修饰. 进一步的机理研究表明, 2-EBA与N端α-氨基通过亚胺中间体形成稳定的异喹啉盐结构, 该修饰产物在氧化还原环境中表现出良好的稳定性. 该方法能够兼容除N端脯氨酸外的其他N端天然氨基酸残基, 并且对溶菌酶、核糖核酸酶A以及治疗性重组蛋白等多种生物大分子的修饰均展现出良好的适用性.
图2 蛋白质/多肽N端氨基单一位点选择性修饰

Figure 2 Single-site selective modification of the N-terminal amino group in proteins/peptides

同样利用醛基的反应特性, Chou等[8]开发了一种通过pH调控的还原烷基化策略, 实现了对肽和蛋白质N端氨基的选择性修饰. 2022年, 该团队[9]利用此策略, 在非芳香族N端肽上引入苄基等基团, 模拟了天然苯丙氨酸的结构特征, 使多肽与葫芦脲(CB[7])超分子受体的相互作用显著增强(图2b). 该研究通过引入羧酸苄酯或硼酸苄酯等功能化取代基, 实现了pH依赖性和糖类依赖性的动态结合调控. 同时, 研究表明经N端修饰的人降钙素在CB[7]存在下可以显著改善的聚集稳定性.
除了醛基介导的修饰策略外, Raj和Tang[10]提出了一种单步氮唑化策略, 实现了在生理条件下对蛋白质N端的高选择性标记(图2c). 该策略利用2-甲基硫代唑啉与N端氨基的亲核反应形成稳定的碳-氮键; 其唑啉基团中的sp²杂化氮原子显著提高了修饰肽片段的离子化效率, 从而增强了质谱检测灵敏度. 该方法不仅对N端具有高度选择性, 还展现出广泛的序列兼容性, 成功应用于多种蛋白质及复杂混合物中蛋白酶解片段的标记.
2022年, Jensen等[11]报道了一种新型的酚酯试剂, 用于肽和蛋白质的N端选择性酰化(图2d). 该方法通过设计具有可调反应活性的酚酯(如邻位磺酸或磺酰胺基团作为空间屏蔽), 在pH=7.3条件下实现了对N端氨基的高效、高选择性修饰, 并验证了该方法对大多数天然氨基酸的适用性. 此外, 该方法成功应用于多种生物活性分子[如胰高血糖素样肽-1 (GLP-1)、DesB30胰岛素和人生长激素]的N端修饰, 并展示了在双功能药物构建中的应用潜力(如GLP-1-胰岛素偶联物). 与传统的N-羟基琥珀酰亚胺(NHS)酯相比, 该酚酯具有更高的稳定性和选择性.
2021年, Wang等[12]开发了一种基于仿生邻苯醌介导的氧化反应策略, 实现了蛋白质N端α-胺的高效选择性修饰(图2e). 该方法利用邻苯醌试剂将N端α-氨基氧化为醛或酮, 进而通过肟连接反应实现正交偶联, 并将该策略应用于肌红蛋白、泛素和小泛素样修饰蛋白2 (SUMO2)等多种蛋白质, 以及COVID-19刺突蛋白的功能性肽段. 同时, 经N端修饰的巨噬细胞炎症蛋白1β (MIP-1β)蛋白表现出增强的抗人类免疫缺陷病毒(HIV- 1)活性.
2020年, Ball团队[13]开发了一种金属铜催化策略, 实现了多肽N端氨基的位点选择性芳基化. 该方法采用含邻位吸电子基团(如磺酰胺、磺酰基或卤素)的硼酸试剂与Cu(OAc)₂协同作用, 对所有N端天然氨基酸均表现出良好的兼容性(图2f). 机理研究证实, 反应通过N端氨基与铜形成五元环螯合中间体实现区域选择性, β-丙氨酸(形成六元环螯合物)反应活性降低以及γ-氨基丁酸(形成七元环螯合物)无反应活性的实验验证这一机理.
2024年, Huang等[14]开发了一种钯催化的肉桂酰化反应的N端可逆修饰策略, 实现了在生理条件下对除半胱氨酸以外的天然氨基酸N端的高选择性修饰(图2g). 该策略通过肉桂酰乙酸酯与蛋白质N端在钯催化剂作用下偶联实现选择性修饰, 随后利用钯催化剂与1,3-二甲基巴比妥酸实现可逆解离, 形成“开-关”调控系统, 为化学生物学和药物研究提供新的研究策略. 该方法可实现多种复杂蛋白质(如核糖核酸酶A、纳米抗体和曲妥珠单抗)的修饰, 并通过详细的位点分析发现, 修饰主要发生在蛋白质N端, 仅在少数复杂蛋白质中观察到少量的多位点修饰现象.

1.1.2 N端主链酰胺键单一位点修饰

基于蛋白质/多肽N端氨基与主链酰胺键独特的空间构象特征, 多种有效的N端特异性环化修饰策略被开发. Yao和Li等[15]在2020年报道了一种含2-吡啶甲醛(2-PCA)的探针(NTC-5), 实现了蛋白质N端α-氨基的高选择性单一位点修饰(图3a). 该探针通过2-吡啶甲醛与N端α-氨基的特异性缩合反应, 在温和条件下即可实现核糖核酸酶A等蛋白质的N端标记, 同时完全保持了蛋白质其他活性位点(如赖氨酸ε-氨基、半胱氨酸巯基等)的结构完整性.
图3 蛋白质/多肽N端主链酰胺键单一位点修饰

Figure 3 Single-site selective modification of N-terminal backbone amide bonds in proteins/peptides

同年, Hayashi和Onoda等[16]发展的基于1H-1,2,3-三唑-4-甲醛(TA4C)衍生物策略进一步拓展了该领域的应用范围(图3b). 该策略是利用TA4C与蛋白质N端α-氨基及相邻主链酰胺形成4-咪唑烷酮环, 从而避免了赖氨酸侧链ε-氨基的干扰, 并在核糖核酸酶A、醛缩酶、牛血清白蛋白、细胞色素b562等蛋白质修饰中展现出优异的位点选择性, 而乙酰化N端氨基的细胞色素c未被修饰进一步证实了该方法对蛋白质N端修饰的高度特异性.
2023年, Spicer等[17]通过比较2-吡啶甲醛、三唑甲醛、2-乙炔基苯甲醛等7种代表性试剂在核糖核酸酶A、肌红蛋白和梭菌蛋白酶轻链等模型蛋白上的修饰效率、选择性和稳定性, 揭示了这7种试剂在当前N端修饰策略的优势与局限性. 研究表明, 蛋白质局部微环境(如空间位阻、pKa)会显著影响修饰效果, 目前尚无普适性N端修饰策略, 需根据目标蛋白特性进行试剂筛选.2025年, 该团队[18]系统研究了12种吡啶甲醛衍生物在蛋白质N端选择性修饰中的反应性, 重点分析了半胺缩醛、亚胺和咪唑烷酮生成三个关键步骤的动力学与热力学影响因素, 强调需针对特定蛋白筛选最优试剂, 其中3-甲氧基-2-吡啶甲醛因其普适性成为最具潜力的候选分子, 为设计新一代N端标记试剂提供了重要指导.
2022年, Hanaya等[19]开发了一种基于铜(II)介导的Aldol反应的N端修饰方法. 2-吡啶甲醛衍生物与蛋白质N端氨基缩合形成亚胺, 并在铜(II)离子配位作用下形成稳定的席夫碱-铜(II)三元复合物. 该复合物有效活化N端氨基酸的α-质子生成亲核中间体, 进而与醛类化合物发生Aldol反应形成稳定的碳-碳键. 随后, Thorpe-Ingold效应促进分子内酰胺氮对亚胺碳的亲核进攻, 经环化反应形成稳定的咪唑烷酮结构, 最终通过乙二胺四乙酸(EDTA)螯合实现铜离子的脱除(图3c). 基于这一机制, 他们[20]在2025年开发了基于铜(II)介导[3+2]环加成反应的N端双功能化策略(图3d). 研究发现, 2-吡啶甲醛衍生物、N端氨基酸与铜(II)离子可协同形成具有1,3-偶极子特性的活性中间体, 该物种能与马来酰亚胺类化合物发生区域选择性的环加成反应, 实现对N端不同氨基酸的高效修饰. 该方法成功应用于构建三元蛋白质复合物和双功能化抗体药物偶联物, 修饰后的抗体不仅保持了人表皮生长因子受体2 (HER-2)结合活性, 还表现出显著的抗肿瘤效果和体内成像能力.

1.1.3 N端脯氨酸单一位点修饰

N端脯氨酸因其独特的环状仲胺结构, 在蛋白质选择性修饰领域展现出特殊的反应活性. 2020年, Raj团队[21]报道了一种基于Petasis反应的N端脯氨酸高效修饰策略(图4a). 该方法利用脯氨酸仲胺与醛在生理条件下缩合形成亚胺离子中间体, 随后经有机硼酸亲核加成, 从而在生理条件下实现N端脯氨酸的高效、专一性标记, 并在以脯氨酸为N末端的蛋白质(肌酸激酶、醛缩酶)中表现出优异的位点选择性.
图4 蛋白质/多肽N端脯氨酸单一位点选择性修饰

Figure 4 Single-site selective modification of N-terminal proline in proteins/peptides

同年, Francis课题组[22]发展了一种经过氧化、缩合两步反应的N端脯氨酸修饰方法(图4b). 该策略首先利用酪氨酸酶或化学氧化剂在脯氨酸N端选择性引入邻醌中间体, 随后与烷氧胺或肼类化合物发生缩合反应, 分别形成肟或腙, 实现了对荧光蛋白质(sfGFP) N端的多种功能分子(如荧光探针和生物素)选择性修饰.

1.1.4 N端甘氨酸单一位点修饰

甘氨酸作为最简单的氨基酸, 其N端氨基的空间位阻小, 为化学修饰提供了高度可及的反应位点. Raj等[23]在2022年开发了一种高效的N端甘氨酸特异性氧化策略(图5a), 通过两步反应将N端甘氨酸转化为醛基. 该研究首先利用2-(2-甲酰基苯氧基)乙酸与胰岛素的N端甘氨酸反应生成氨基醇中间体, 随后通过高碘酸钠氧化为具有更高反应活性的醛基, 进而实现功能模块的精准引入, 并能够保持蛋白质的二级结构和功能. 此外, 在复杂的多蛋白混合体系中, 该方法能够特异性识别并选择性修饰含N端甘氨酸的胰岛素分子, 证明了其优异的位点选择性.
图5 蛋白质/多肽N端甘氨酸单一位点选择性修饰

Figure 5 Single-site selective modification of N-terminal glycine in proteins/peptides

2024年, Kanemoto和Machida等[24]利用铜催化的[3+2]环加成反应实现N端甘氨酸双重修饰(图5b), 该反应通过甘氨酸N端与醛缩合形成的亚胺, 并在铜催化剂作用下生成1,3-偶极子中间体, 随后与马来酰亚胺发生环加成反应, 在温和条件下高效构建了具有稳定结构的吡咯烷结构. 与Hanaya等[20]报道的方法不同, 由于空间位阻效应及中间体稳定性的影响, 当底物为N端非甘氨酸残基时, 需采用加热条件或过量催化剂才能实现该反应. 这一差异也展示出甘氨酸无侧链结构的反应特性.

1.1.5 N端半胱氨酸单一位点修饰

N端半胱氨酸中1,2-氨基硫醇部分具有独特反应性特征, 适合位点特异性蛋白质标记. 对N端半胱氨酸的标记技术前期已发展了包括硫酯介导的化学连接、2-氰基苯并噻唑或2-甲酰基苯硼酸的缩合反应等, 但这些技术在生物学应用中仍受到不同的限制[3e,6b]. 例如, 利用2-甲酰基苯硼酸与N端半胱氨酸发生特异性缩合反应, 通过形成噻唑烷硼酸酯(TzB)五元环, 可以确保修饰位点的专一性, 但该中间体存在易解离的问题[25].
2020年, Gao课题组[26]针对N端半胱氨酸修饰中噻唑烷硼酸酯动态不稳定的问题, 优化了2-甲酰基苯硼酸衍生物的结构(图6a), 在保留噻唑烷酯快速形成动力学的同时, 引入分子内酰基转移机制, 将可逆的噻唑烷硼酸酯转化为稳定的N-酰基噻唑烷产物. 该方法对N端半胱氨酸具有高度特异性, 几乎不与其他半胱氨酸残基反应, 并以低微摩尔浓度的试剂实现高效的位点特异性蛋白质修饰, 为生物偶联药物开发提供了兼具高效性与稳定性的新工具.
图6 蛋白质/多肽N端半胱氨酸单一位点选择性修饰

Figure 6 Single-site selective modification of N-terminal cysteine in proteins/peptides

在N端半胱氨酸修饰的稳定性改进方面, Gois等[27]在2022年利用O-水杨醛酯(OSAE)实现了N端半胱氨酸的高效、快速且可控的可逆修饰(图6b). 在低微摩尔浓度下N端氨基进攻醛基形成半胺缩醛, 随后发生酯交换和乙酸消除, 得到亚胺结构, 巯基进攻亚胺最终形成噻唑烷产物; 在酸性条件下, 噻唑烷可完全水解并释放完整N端半胱氨酸, 实现N端半胱氨酸可逆修饰.
在此研究领域, Wu课题组[28]在2020年开发了一种基于2-[(烷硫基)(芳基)亚甲基]丙二腈(TAMM)与N端半胱氨酸缩合反应的策略(图6c). 该反应通过硫醇-乙烯基硫醚交换、氨基迈克尔加成形成噻唑烷和二氰甲基消除的反应过程, 在磷酸缓冲液中高效、选择性地形成稳定的2-芳基-4,5-二氢噻唑(ADT)产物. 次年, 该团队[29]又报道了2-苄基丙烯醛(BAA)与1,2-氨基硫醇经醛亚胺缩合、迈克尔加成和亚胺还原的多步反应(图6d), 最终形成稳定的七元环非对映异构体.
2022年, Bernardes和Jiménez-Osés等[30]开发了一类环丙烯酮(CPO)试剂, 可在温和的生物相容性条件下与N端半胱氨酸的1,2-氨基硫醇基团选择性反应(图6e). 该反应通过半胱氨酸的巯基对环丙烯酮进行迈克尔加成形成硫代中间体, 随后N端氨基发生分子内亲核环化生成双环2-硫-5-氮杂二环[4.1.0]庚烷结构, 最终经去质子化扩环得到稳定的七元环1,4-噻氮卓-5-酮结构. 该反应对N端半胱氨酸展现出优异的选择性, 即使在蛋白质中存在其他溶剂暴露的半胱氨酸残基的情况下, 仍能实现精准的位点特异性修饰.
2024年, Kalia等[31]报道了一种基于Baylis-Hillman加合物的新型蛋白质生物偶联技术BHoPAL(图6f). 该技术利用靛红衍生的Baylis-Hillman加合物, 在生理条件下与蛋白质N端半胱氨酸的1,2-氨基硫醇基团进行反应, 形成稳定的双杂环骨架(硫代吗啉-吲哚酮结构). 反应过程涉及迈克尔加成、乙氧基消除、分子内迈克尔加成及氰基消除等步骤. BHoPAL不仅实现了低浓度(纳摩尔级)下的定量偶联, 还通过结合硫辛酸蛋白连接酶技术, 将1,2-氨基硫醇基团引入蛋白质特定位点, 从而摆脱了对N端半胱氨酸的依赖, 扩展了其应用范围.

1.1.6 C端单一位点修饰

对蛋白质/多肽的C端进行选择性化学标记相对更加困难, 其原因在于羧酸基团的化学反应活性显著低于氨基, 且该选择性标记过程还受到天冬氨酸和谷氨酸侧链羧酸的干扰, 从而大大降低了标记反应的选择性. 因此, 天然蛋白质的C端羧基的选择性修饰较为少见[6b]. 在该研究领域, MacMillan及其合作者[32]利用光催化脱羧官能团化反应体系, 系统论证了该策略在天然蛋白质定点修饰中的可行性.
2021年, Anslyn团队[33]利用光氧化还原催化的脱羧烷基化策略, 实现了C端羧酸的高效位点选择性修饰(图7a). 该方法通过光催化脱羧反应获得关键的α-氨基自由基中间体, 进而与迈克尔受体(3-亚甲基-2-降冰片酮)发生共轭加成反应, 从而将官能团精准引入肽链C端. 该方法对大多数氨基酸残基均表现出良好的兼容性, 但对于C端色氨酸和组氨酸的标记效率显著较低, 而C端半胱氨酸因竞争性硫醇加成反应无法直接标记. 为验证该技术的实用性, 研究团队成功将其应用于复杂蛋白质消化物(如牛血清白蛋白、酵母和人细胞裂解物)的标记研究, 并进一步拓展至单分子荧光测序领域.
图7 蛋白质/多肽C端单一位点选择性修饰

Figure 7 Protein/peptide C-terminal single-site selective modification

2021年, Waser等[34]开发了一种多肽C端氧化脱羧偶联反应(图7b). 在可见光照射和室温条件下, 利用Ru(bpy)3Cl2光催化剂和高价碘试剂氧化肽的C端羧基, 生成关键的N,O-缩醛中间体. 该中间体可进一步转化为高反应活性的N-酰亚胺离子中间体, 进而与苯酚、吲哚等芳香族化合物发生Friedel-Crafts反应, 为多肽C端修饰提供了多样化的途径. 但该方法目前仅适用于多肽体系, 尚未被拓展至蛋白质的修饰应用.

1.2 配体导向的单一位点选择性修饰技术

在天然蛋白质单一位点标记领域, 当直接修饰无法满足选择性需求时, 基于蛋白质与配体识别邻近效应的配体导向修饰策略是一种重要技术手段[35](图8). 该策略采用含与蛋白质结合的配体、反应性官能团以及修饰/标记的分子模块三个关键组分的多功能试剂, 通过配体模块特异性识别并结合目标蛋白、亲电反应性基团与邻近亲核氨基酸残基发生选择性反应、配体与蛋白复合物解离三个连续步骤, 从而实现对目标蛋白的特异性单一位点修饰. 对于蛋白质中的不同亲核氨基酸残基的选择性修饰位点, 发展了包括甲苯磺酰基、酰基咪唑、苯甲酸二溴苯酯、N-磺酰基吡啶酮、苯并三唑、O-硝基苯并恶二唑、N-酰基-N-烷基磺酰胺等反应性官能团或方法[3h,36](图8). 这些反应基团通过特异性识别不同活性位点, 实现了蛋白质多样化精准修饰.
图8 配体导向单一位点修饰技术

Figure 8 Ligand-directed single-site modification

1.2.1 配体导向赖氨酸单一位点修饰

在众多可修饰氨基酸残基中, 赖氨酸是配体导向修饰/标记的主要位点之一. 2020年, Zhou等[37]设计了一种基于磷酸甘油酸变位酶1抑制剂的衍生物的KHAc小分子化合物(图9a). 该试剂通过其结构中苯酚连接的乙酰基, 特异性地靶向磷酸甘油酸变位酶1活性位点的赖氨酸残基(K100), 实现了高效的位点选择性乙酰化. 并通过时间分辨晶体学技术捕捉了乙酰转移的动态过程, 揭示了该反应由邻近效应驱动的分子机制.
图9 配体导向的赖氨酸单一位点选择性修饰

Figure 9 Ligand-directed lysine single-site selective modification

2022年, Wu等[38]开发了一种苯并三唑的亲和标记探针, 实现了对内源性蛋白质的标记(图9b). 相较于其他标记方法, 该探针显著提高了标记速率, 并展示出对GRAMD1A蛋白中赖氨酸(K158)的单一标记. 但在FKBP12蛋白的标记实验中, 该探针会识别并标记两个特定的赖氨酸残基(K52和K35), 显示出一定的位点选择性限制.
Hamachi团队[39]前期通过使用N-酰基-N-烷基磺酰胺作为亲电反应基团的配体定向修饰策略, 实现对细胞内天然蛋白质赖氨酸残基进行快速标记. 2023年, 他们进一步发展了N-酰基-N-芳基磺酰胺试剂[40], 通过引入特定芳基取代基和强吸电子基团, 显著增强了该试剂在生理环境中的化学稳定性显著增强, 同时有效抑制了与非靶标蛋白的非特异性相互作用. 然而, 目前的研究尚未将该类试剂拓展至天然蛋白质体系中赖氨酸残基的标记应用探索.
2023年, Carreira等[41]利用N-磺酰吡啶酮和N-酰基-N-烷基磺酰胺作为模块化合成平台试剂, 实现对大麻素受体2中赖氨酸残基高效选择性标记(图9c). 该研究通过分子对接和动力学模拟研究表明, 位于大麻素受体2结合位点附近的亲核性赖氨酸残基(K23)表现出更高的空间稳定性和反应倾向性.

1.2.2 基于共价配体定向释放策略的半胱氨酸单一位点修饰

近期, 配体导向化学修饰技术在半胱氨酸残基选择性标记应用取得了一定进展. 2021年, London和Reddi等[42]提出一种基于共价配体定向释放(CoLDR)化学的蛋白质位点特异性标记新方法(图10a), 用于在活细胞中对内源性蛋白质进行选择性标记, 同时保持目标蛋白的活性. 该方法通过逆转α-取代甲基丙烯酰胺的反应方向, 将配体作为离去基团, 在目标蛋白(如布鲁顿酪氨酸激酶BTK)的半胱氨酸残基(C481)上引入多种功能标签. 此外, 通过调控配体结构, 研究证实了CoLDR化学在其他靶点(如K-RasG12C和SARS-CoV-2 PLpro)中的适用性.
图10 基于共价配体定向释放策略的半胱氨酸单一位点选择性修饰

Figure 10 CoLDR strategy for cysteine single-site selective modification

2023年, 该团队[43]报道了一种新型氨基磺酸酯类试剂, 拓展了共价配体定向释放(CoLDR)化学的应用(图10b). 这类化合物可以实现反应活性的精准调控, 在与半胱氨酸反应后通过自消除机制释放磺酰胺酸, 并解离为三氧化硫和游离胺, 从而兼具共价抑制与定向释放功能, 为半胱氨酸的单一位点修饰提供了更灵活的工具.
此外, 配体导向化学修饰技术也已成功应用于组氨酸、丝氨酸、酪氨酸和谷氨酸等残基的修饰, 但该技术仍面临诸多挑战, 特别是存在赖氨酸等高活性残基的化学选择性竞争问题[3h]. 例如, 含有重氮苯丙氨酸的肽配体能够通过偶氮偶联反应, 会同时靶向组氨酸和酪氨酸残基[35c]. 因此, 开发更具靶向性和特异性的修饰策略仍是当前研究的重点方向.

1.2.3 基于亲和力引导催化剂策略的单一位点修饰

与此同时, 配体导向化学修饰技术的发展推动了亲和力引导催化剂(AGC)策略的兴起, 其区别在于携带催化功能基团的配体与靶蛋白结合, 这种结合能够激活外部探针, 使其通过邻近效应选择性与蛋白质表面的特定氨基酸残或位点发生反应(图11). 其中二甲氨基吡啶、三(2,2'-联吡啶)钌配合物、吡啶肟等均被作为催化功能基团用于蛋白质位点修饰[3d].
图11 基于亲和力引导催化剂策略的单一位点选择性修饰

Figure 11 Single-site selective modification based on affinity-guided catalytic strategy

近期, Spicer等[44]在靶标结合肽的N端或C端引入吡啶肟催化剂, 并利用其催化N-酰基-N-烷基磺酰胺试剂与蛋白的N端或C端的反应, 从而实现蛋白质的特异性标记(图11). 该方法的位点选择性主要依赖于吡啶肟在肽链上的位置, 通过空间邻近效应引导催化剂与目标蛋白特定区域的相互作用. 然而在对核糖核酸酶A进行标记时, 其N端α-氨基和赖氨酸的ε-氨基仍会同时被修饰, 表明当前催化体系的位点选择性仍需进一步优化.

1.3 关键点定向修饰技术

针对天然蛋白质的单一位点选择性修饰, Rai研究团队[3b,45]创新性地开发了一种不依赖于配体的关键点定向修饰技术(图12), 为蛋白质位点选择性标记领域提供了新的技术手段. 该技术的核心机制在于巧妙利用蛋白质分子中特定空间位置的两个亲核性氨基酸残基进行选择性修饰: 首先通过可逆的分子间亲核反应实现双功能分子(F1-spacer-F2)与特定氨基酸残基的可逆结合; 随后双功能分子的另一活性位点与邻近的特定靶标氨基酸残基发生不可逆的选择性共价结合; 最终通过关键修饰位点的解离, 实现对目标蛋白质的特定位点选择性修饰.
图12 关键点定向修饰技术

Figure 12 Linchpin-directed modification

1.3.1 赖氨酸导向赖氨酸单一位点修饰

利用该技术完成对天然蛋白质中组氨酸残基[46]的高效位点选择性修饰后, Rai团队[47]在2020年将该技术通过双功能试剂(FK1-spacer-FK2)拓展至天然蛋白质中高频率赖氨酸残基的单一位点标记(图13a). 在该方法中, 2-羟基苯甲醛基团(FK1)通过可逆的亚胺结构与溶剂可及的赖氨酸残基结合, 随后相邻的赖氨酸残基与酰化亲电试剂(FK2)通过分子内反应实现不可逆的位点选择性修饰, 克服了传统赖氨酸修饰中的异质性问题. 该技术不仅适用于核糖核酸酶A、胰岛素、抑肽酶、泛素、α-乳清蛋白、细胞色素c和肌红蛋白等蛋白质, 还能在抗体-药物偶联物(ADCs)中实现高效应用, 例如将抗癌药物DM1与曲妥珠单抗偶联, 所得偶联药物在HER-2阳性乳腺癌细胞中表现出高度特异性的抗增殖活性. 2024年, 该团队[48]进一步优化该技术, 并将其应用于胰蛋白酶和α-糜蛋白酶的定点修饰, 不仅有效避免了蛋白酶的自降解问题, 还通过醛基标签实现了酶分子的有序固定化. 与传统的随机固定化方法相比, 这种定点固定化策略显著提升了蛋白酶的消化效率, 并在多次循环使用后仍能保持较高的催化活性.
图13 FK1-spacer-FK2在赖氨酸残基上单一位点选择性修饰应用

Figure 13 Single-site selective modification of lysine residue by FK1-spacer-FK2

基于这一策略, 他们[49]在2022年重新设计了双醛基团结构的双功能试剂, 利用化学正交的亚胺反应性差异, 实现了对特定赖氨酸残基的位点选择性标记(图13b). 其中, 2-羟基苯甲醛基团(FK1)与特定赖氨酸形成的亚胺保持化学惰性, 而苯甲醛基团(FK2)与邻近赖氨酸生成活性亚胺, 与外部亲核试剂(三乙氧基磷)选择性发生不可逆反应, 从而完成单一位点修饰. 研究通过理论计算和实验验证, 证实了2-羟基苯甲醛基团形成的亚胺因π共轭稳定化而惰性, 而苯甲醛基团形成的亚胺表现出与外部亲核试剂更高的反应性, 从而实现了化学正交性调控. 此外, 该技术展现出优异的模块化能力, 通过调整双功能试剂的空间构象, 可靶向不同位置的赖氨酸(如细胞色素c中的K60和K27), 且不干扰蛋白质的天然结构和酶活性, 展示出其通过微环境调控和空间邻近效应实现精准修饰的能力.

1.3.2 半胱氨酸导向赖氨酸单一位点修饰

2022年, Rai团队[50]开发了一种半胱氨酸锚定导向的赖氨酸单一位点精准修饰策略(图14a). 该方法利用硝基烯烃(FC1)与蛋白质中的半胱氨酸残基发生特异性迈克尔加成反应形成共价加合物, 随后通过分子内反应使邻近的赖氨酸残基与酰化亲电试剂(FK2)实现高效且不可逆的位点选择性修饰. 随后, 硝基烯烃在温和条件下转化为可进一步正交修饰的醛基, 为后续正交功能化修饰提供了便利的化学手柄. 该研究通过分子动力学模拟研究揭示了试剂构象的适应性刚性对位点选择性的调控机制, 并被应用于多种蛋白质(如β-乳球蛋白、血清白蛋白)和抗体(如曲妥珠单抗)的修饰以及抗体-药物偶联物的制备. 同时, 该策略可以实现对复杂蛋白质混合物中单一蛋白质的单一赖氨酸残基的高效标记, 在含有57个赖氨酸残基的人血清白蛋白与其他蛋白质的混合物中, 可选择性标记人血清白蛋白中的单一赖氨酸残基.
图14 FC1-spacer-FK2在赖氨酸残基上单一位点选择性修饰应用

Figure 14 Single-site selective modification of lysine residue by FC1-spacer-FK2

同年, Xiong等[51]在半胱氨酸锚定导向的赖氨酸单一位点修饰的研究中, 通过设计含有芳基硫醚基团和邻硝基苄醇衍生物的双功能试剂(FC1-spacer-FK2)开发了利用光诱导的多肽/蛋白质单一位点修饰方法(图14b). 该类双功能试剂中芳基硫醚基团(FC1)选择性标记半胱氨酸, 而邻硝基苄醇在365 nm光照下激活下与邻近赖氨酸反应, 形成稳定的交联结构, 通过引入硫醇试剂可恢复半胱氨酸的天然状态, 实现多肽分子中赖氨酸的单一位点修饰. 在复杂蛋白质体系中的应用表明, 该方法在组蛋白和牛血清白蛋白的装订中均展现出优异的位点选择性.
2020年, Gothelf和Cló等[52]将蛋白质表面暴露的二硫键作为瞬时靶向位点, 通过使用含有临时二硫键重构基团、间隔臂、掩蔽的巯基反应基团以及胺反应基团关键结构单元的双功能试剂, 实现了对赖氨酸残基的高效修饰(图14c). 该策略通过二硫键的选择性还原与重构、还原胺化以及后续的氧化步骤, 不仅在邻近的赖氨酸侧链上引入单一外源性活性巯基, 还能保持修饰后的蛋白质天然二硫键的完整性. 研究团队将该策略应用于6种不同抗原结合片段和人生长激素的功能化修饰, 并发现间隔臂长度的变化对修饰位点选择性的影响较小, 修饰主要发生在二硫键附近的赖氨酸残基上.

1.3.3 其他氨基酸关键点定向修饰

利用LDM技术, 除了对赖氨酸以及组氨酸的单一位点修饰外, Rai研究团队[53]在2021年还实现了对天冬氨酸或组氨酸的高效位点选择性修饰(图15). 该研究设计了一种独特的双功能试剂(FK1-spacer-FD2), 其结构整合了2-羟基苯甲醛基团和非选择性亲电基团(芳基磺酸酯), 有效克服了传统修饰方法反应选择性不好的问题. 研究通过系统筛选双功能试剂结构和反应条件, 优化了双功能分子的效率, 实现了泛素中天冬氨酸以及胰岛素、α-乳清蛋白和肌红蛋白中组氨酸的单一位点修饰. 并通过后期功能化成功引入19F NMR探针、生物素或荧光基团等重要功能分子, 为低丰度氨基酸的精准标记提供了实用性工具.
图15 基于关键点定向修饰技术的天冬氨酸/组氨酸位点选择性修饰

Figure 15 Linchpin-directed single-site selective modification of aspartate or histidine residue

蛋白质/多肽的单一位点选择性化学修饰技术在蛋白质或多肽的特定位置引入结构多样、功能各异的分子, 为精准调控生物大分子功能提供了强大工具. 然而, 这些精准修饰的实现高度依赖于对反应位点的精确控制与高效的特异性反应体系, 使其难以应对多位点协同修饰或大规模蛋白质库构建等复杂需求. 而随着固相合成、液相分段合成等技术的迭代升级, 特别是自动化合成仪器的进步, 使得在合成过程中直接引入非天然氨基酸或特定修饰基团成为可能. 这种合成与修饰的融合策略, 不仅突破了传统“先合成后修饰”流程中存在的位点冲突问题, 更通过计算机控制的精确加料系统和实时监测模块, 实现了从氨基酸序列构建到位点特异性修饰的一体化精准操作. 这种技术层面的深度整合, 标志着蛋白质/多肽精准合成正从传统的分步化学操作向集成化、智能化的平台转变.

2 蛋白质/多肽自动化精准合成

蛋白质/多肽自动化精准合成的核心目标是通过高效、可控的技术手段实现复杂生物大分子的按需构建. 随着固相合成技术、微流控技术、人工智能辅助设计等方法的快速发展, 多肽及蛋白质的合成正逐步突破传统工艺在长度、效率与修饰精度上的限制, 为药物开发、生物材料及功能蛋白研究提供了强大工具[4a,4c]. 然而, 如何实现超长序列的精准组装、动态折叠控制及翻译后修饰的位点特异性引入, 仍是当前技术面临的重大挑战. 本节将系统综述近年来蛋白质/多肽自动化合成技术的关键进展, 探讨其为实现蛋白质/多肽的精准高效合成所提供的新策略与能力.

2.1 自动化精准合成技术

近年来, 流动化学与多肽固相合成(SPPS)的融合创新显著推动了多肽与蛋白质合成技术的发展, 在合成效率、精准度和自动化水平等方面取得系列突破. 2014年, Pentelute团队[4b]基于流动合成多肽路线, 开发了自动化控制的流动化学合成平台(图16a), 通过高效热交换器与新反应器实现试剂的连续预热与高浓度输送, 同时通过紫外检测实时监控9-芴基甲氧基羰基(Fmoc)脱保护与偶联进程, 将脱保护时间优化至10 s, 偶联时间缩短至7 s, 最终将单个氨基酸残基接入周期缩短至107 s. 该系统合成了包括(ALF)7 (37.5 min完成)和ACP(65-74) (17.8 min完成)等目标产物, 且粗产物纯度与传统合成法相当.
图16 多肽自动化流动合成技术

Figure 16 Automated flow synthesis technology for peptides

该团队[4c]在前期研究基础上进一步突破, 通过模块化设计将连续流动化学与固相合成整合, 开发出全自动化流动多肽合成(AFPS)技术, 将单个氨基酸残基的完整接入周期压缩至40 s(图16b). 该方法实现了试剂的高效混合、高温(90 ℃)活化及实时紫外监测, 不仅提高了合成速度, 还通过优化流速和温度抑制了容易外消旋化的氨基酸(如半胱氨酸和组氨酸)产生的副反应. 此外, 该技术利用紫外吸收数据动态监测Fmoc脱保护效率, 可快速识别多肽链聚集问题, 并通过调整树脂载量优化难合成序列(如JR-10肽)的产率. 与常规方法合成或商业话产品相比, AFPS在合成胰岛素B链和生长激素释放激素等长链肽时展现出相当的纯度与收率, 但耗时显著减少(如胰岛素B链合成仅需20 min, 而传统方法需30 h). 该技术通过自动化控制和连续流动反应器设计, 为精准化学合成提供了高效、可重复的平台, 适用于高通量药物候选分子库的构建和功能蛋白的快速制备.
2022年, Li等[4d]利用高效的全自动流动合成平台, 快速制备细胞穿透肽(CPP)与肽核酸(PNA)的共轭物(PPNA)(图16c). 该技术通过优化反应参数(如采用O-苯并三氮唑-四甲基脲六氟磷酸酯(HBTU)作为活化剂、70 ℃耦合温度及40 ℃去保护温度), 实现了每个酰胺键仅需10 s的高效合成, 四个肽核酸单体的PPNA粗产物纯度可达90%, 显著优于传统手动合成. 精准的温度与流速控制有效抑制了副反应(如异构体生成<1%, 碱基加合物<1%), 解决了长链PNA合成中的聚集与序列错误问题. 采用该合成技术制备的靶向IVS2-654位点的PPNA, 在剪接校正实验中活性比转染PNA提高3倍; 并且一天内可合成8条靶向SARS-CoV-2病毒5′UTR的长链PPNA. 这一技术凸显了自动化技术在复杂大分子精准合成中的有效应用.
2024年, Wu等[54]开发了一种平行自动合成平台, 用于高效合成具有抗病毒活性的α-酮酰胺和腈类肽模拟物(图17). 该平台采用并行合成策略, 通过优化设计, 实现了单次运行同步制备5种目标分子的能力, 并在三个月内完成了525次反应, 建立了包含42种结构多样性的多肽衍生物库, 为系统的构效关系研究奠定了重要基础. 平台采用智能调控系统, 实现了“一键式”按需合成, 显著减少了传统合成方法中繁琐的纯化步骤和溶剂消耗, 同时提高了合成效率和产物一致性.
图17 多肽自动化平行自动合成技术

Figure 17 Automated parallel synthesis technology for peptides

2020年, Pentelute团队[4a]将全自动化流动多肽合成技术提升至新高度, 实现蛋白质化学合成的技术突破(图18a). 研究团队通过对反应温度、溶剂体系、活化剂类型等关键参数的精准调控, 实现了164个氨基酸长度的单域蛋白质链的连续高效合成, 其单步偶联时间仅需2.5 min, 整体合成效率较传统固相合成方法提升5倍. 尤为突出的是, 该团队通过建立多维优化体系, 可以显著抑制了天冬酰胺亚胺形成和半胱氨酸/组氨酸的外消旋化(<2%). 基于这一技术突破, 研究团队合成了9种长度在70至170个氨基酸之间的功能性蛋白链, 包括胰岛素原(86个氨基酸)和人类免疫缺陷病毒-1蛋白酶(99个氨基酸)等重要生物分子, 其合成时间均在3.5~6.5 h. 纯化后的蛋白质经折叠后表现出与重组蛋白相当的生物活性和结构稳定性, 且产物纯度更高, 所用时间更短. 另外, 该技术可灵活引入对溴苯丙氨酸等非天然氨基酸, 为功能化蛋白质设计提供了新策略. 2023年, 他 们[55]通过自动化快速流动多肽合成技术进一步实现了214个氨基酸的铜绿假单胞菌抗菌蛋白Pyocin S2 N端结构域(PyS2NTD)的“单步”精准合成, 仅耗时9.2 h, 产物纯度与生物活性均与天然蛋白相当(图18b). 近期, 该团队又完成了免疫检查点关键受体PD-1及其配体PD-L1的自动化合成[56](图18e).
图18 蛋白质自动化流动合成技术

Figure 18 Automated flow synthesis technology for proteins

2024年, Hausch等[57]利用AFPS技术合成了FK506结合蛋白51 (FKBP51)的工程化变体, 通过引入内酰胺桥稳定了其瞬时结合口袋(图18c). 该研究利用AFPS的高通量和精准化优势, 实现了128个氨基酸长度的蛋白质一步合成, 并选择性引入正交保护的氨基酸(如烯丙氧羰基保护的赖氨酸和烯丙基保护的谷氨酸), 通过固相载体上的原位脱保护和内酰胺化反应, 精确构建了不同环大小的内酰胺桥. 合成蛋白质的正确折叠与构象稳定性被证实, 进一步体现了AFPS技术在精准控制蛋白质修饰和构象工程中的优势.
2024年, Hartrampf等[58]通过自动化流动多肽合成技术, 实现了骨髓细胞瘤癌基因(MYC)磷酸化及其他翻译后修饰(如甲基化、乙酰化、硫酸化和糖基化)的高效精准引入(图18d). 该技术通过优化反应参数(如温度、流速和偶联试剂), 减少了传统固相合成中常见的β-消除副反应(如磷酸化丝氨酸的副产物降至2%), 并实现了84个氨基酸的蛋白质片段在4 h内完成合成, 且产物纯度达92%以上.
此外, Perczil和Ferentzi等[59]开发的智能多肽流动化学(SPF)系统通过精确调控流速、反应温度和压力, 实现了试剂用量(仅3 equiv.)和溶剂消耗(每循环6 mL)的降低. 针对长链多肽合成中易出现的聚集问题, 通过引入脯氨酸残基或添加溶剂(如25%二甲基亚砜/乙腈), 提高了40~80个氨基酸链段的合成纯度.
当前发展的自动化流动合成技术通过模块化设计、实时监测及高温活化等策略, 显著提高了多肽与蛋白质合成的效率、精确度及自动化程度. 这些技术已能高效制备各类复杂多肽、长链蛋白质及修饰蛋白等, 为药物研发、抗病毒治疗和功能化蛋白质设计提供了技术支撑. 然而, 面对日益复杂的蛋白质工程需求, 仍需进一步优化反应路径设计并实现合成参数的动态调控, 以解决当前生产成本较高等问题. 在这方面, 机器学习技术与自动化合成系统的融合为蛋白质精准合成领域提供了新的发展契机.

2.2 机器学习指导的自动化精准合成

机器学习技术在化学合成领域展现出广泛的应用潜力[60]. 通过深度挖掘和分析海量反应数据, 该技术能够高效预测最优反应路径、智能优化合成路线, 并精准设计具有特定功能的新型分子, 为实现高效、精准的化学合成提供了技术支撑. 特别是在多肽合成这一领域, 机器学习技术正逐步展现出其独特的作用(图19).
图19 机器学习指导的自动化多肽精准合成

Figure 19 Automated precise synthesis of peptides guided by machine learning

2020年, Pentelute等[61]研究了深度学习在快速流动多肽合成中的应用. 该研究通过分析35427个Fmoc脱保护反应的紫外光谱数据, 构建了一个深度学习模型, 能够以低于6%的误差预测脱保护反应的效率, 并优化多肽合成中的聚集问题. 为肽合成的实时优化和计算设计提供了新工具, 并展示了深度学习在化学合成自动化中的潜力. 随后, 该团队[62]通过自动化肽核酸合成器收集了239个Fmoc脱保护反应的实时紫外-可见数据, 并利用这些数据训练了10种不同的机器学习模型. 其中, 最佳预测准确率达到93%, 且预测的合成效率与实验测得的高效液相色谱粗产物纯度相当. 此外, 该模型成功应用于设计靶向人类抗肌萎缩蛋白基因第44号外显子、SARS-CoV-2、人类免疫缺陷以及心血管疾病、II型糖尿病和癌症相关基因的反义PNA序列, 显著提高了候选序列的筛选效率. 为高效精准的肽核酸等分子自动化合成提供了全新的智能化解决方案.
这些研究结果表明, 机器学习能够通过实时分析反应数据来优化多肽合成过程, 提升了合成效率与产物纯度. 然而, 目前数据集规模仍然有限, 需要构建更高标准的数据集, 并开发更多高效的预测模型, 同时进一步优化数据库与算法架构, 以实现更精准、更高质量的多肽/蛋白质自动化合成.

3 结论

蛋白质/多肽单一位点修饰技术与自动化合成平台的不断发展, 共同推动精准合成能力的提升, 为化学生物学、药物开发和精准医疗提供了多样化的分子工具. 本文系统总结了实现单一位点修饰的关键策略, 包括位点特异性直接修饰、配体导向修饰以及关键点定向修饰等, 并梳理了融合高温耦合、实时监测与智能控制的自动化流动合成技术的最新进展. 通过修饰靶向性与合成可控性的结合, 可实现特定单一位点修饰蛋白质/多肽的可控制备, 并大幅提升了合成的效率与精准度, 也为复杂修饰蛋白和长链蛋白质的可控合成开辟了新途径, 促进了均一化抗体-药物偶联物等新型治疗分子的开发. 然而, 现有修饰技术的普适性受到底物结构和反应条件的严格限制, 修饰位点的精准控制与反应效率仍有待提高, 一些方法在操作复杂性和成本效益等方面也有待优化. 同时, 自动化合成精度与天然蛋白质体系复杂性之间的显著差距, 以及生产成本较高等问题, 仍是制约其工业化应用的主要瓶颈. 未来, 蛋白质/多肽的精准合成仍面临若干关键挑战, 包括开发兼具高选择性高效能广适用性及操作简便性的新型修饰技术; 实现复杂修饰蛋白的高纯度规模化生产以降低成本并满足工业应用需求. 通过新型生物正交反应机制的不断突破, 以及自动化合成平台与人工智能技术的协同创新, 将会显著提升蛋白质/多肽药物的精准设计能力与临床转化潜力, 有望为重大疾病的精准干预开辟新的治疗途径.
(Lu, Y.)
[1]
(a) Fu, H.; Mo, X.; Ivanov, A. A. Nat. Rev. Cancer 2025, 25, 189.

(b) Roake, C. M.; Artandi, S. E. Nat. Rev. Mol. Cell Biol. 2020, 21, 384.

(c) Wang, R.; Chen, B.; Elghobashi-Meinhardt, N.; Tie, J.-K.; Ayala, A.; Zhou, N.; Qi, X. Nature 2025, 639, 808.

[2]
(a) Dumontet, C.; Reichert, J. M.; Senter, P. D.; Lambert, J. M.; Beck, A. Nat. Rev. Drug Discov. 2023, 22, 641.

DOI PMID

(b) Cooper, B. M.; Iegre, J.; O' Donovan, D. H.; ÖlwegṴṴård Halvarsson, M.; Spring, D. R. Chem. Soc. Rev. 2021, 50, 1480.

[3]
(a) Hoyt, E. A.; Cal, P. M. S. D.; Oliveira, B. L.; Bernardes, G. J. L. Nat. Rev. Chem. 2019, 3, 147.

(b) Chauhan, P.; V, R.; Kumar, M.; Molla, R.; Mishra, S. D.; Basa, S.; Rai, V. Chem. Soc. Rev. 2024, 53, 380.

DOI PMID

(c) Tamura, T.; Kawano, M.; Hamachi, I. Chem. Rev. 2025, 125, 1191.

(d) Ishizawa, S.; Fujimura, K.; Oisaki, K.; Sato, S.; Ohata, J. ChemCatChem 2025, 17, e202402125.

(e) Ma, Y.; Wang, Y.; Wang, F.; Lu, S.; Chen, X. Chin. Chem. Lett. 2025, 36, 110546.

(f) Tantipanjaporn, A.; Wong, M.-K. Molecules 2023, 28, 1083.

(g) Zielke, F. M.; Rutjes, F. P. J. T. Top. Curr. Chem. 2023, 381, 35.

(h) Kim, Y.; Yi, H. B.; Seo, K.; Lee, H. S.; Shin, I. Trends Chem. 2025, 7, 240.

[4]
(a) Hartrampf, N.; Saebi, A.; Poskus, M.; Gates, Z. P.; Callahan, A. J.; Cowfer, A. E.; Hanna, S.; Antilla, S.; Schissel, C. K.; Quartararo, A. J.; Ye, X.; Mijalis, A. J.; Simon, M. D.; Loas, A.; Liu, S.; Jessen, C.; Nielsen, T. E.; Pentelute, B. L. Science 2020, 368, 980.

DOI PMID

(b) Simon, M. D.; Heider, P. L.; Adamo, A.; Vinogradov, A. A.; Mong, S. K.; Li, X.; Berger, T.; Policarpo, R. L.; Zhang, C.; Zou, Y.; Liao, X.; Spokoyny, A. M.; Jensen, K. F.; Pentelute, B. L. ChemBioChem 2014, 15, 713.

DOI PMID

(c) Mijalis, A. J.; Thomas, D. A.; Simon, M. D.; Adamo, A.; Beaumont, R.; Jensen, K. F.; Pentelute, B. L. Nat. Chem. Biol. 2017, 13, 464.

DOI

(d) Li, C.; Callahan, A. J.; Phadke, K. S.; Bellaire, B.; Farquhar, C. E.; Zhang, G.; Schissel, C. K.; Mijalis, A. J.; Hartrampf, N.; Loas, A.; Verhoeven, D. E.; Pentelute, B. L. ACS Cent. Sci. 2022, 8, 205.

(e) Wu, J.; Yang, X.; Pan, Y.; Zuo, T.; Ning, Z.; Li, C.; Zhang, Z. J. Flow Chem. 2023, 13, 385.

[5]
Matos, M. J.; Oliveira, B. L.; Martínez-Sáez, N.; Guerreiro, A.; Cal, P. M. S. D.; Bertoldo, J.; Maneiro, M.; Perkins, E.; Howard, J.; Deery, M. J.; Chalker, J. M.; Corzana, F.; Jiménez-Osés, G.; Bernardes, G. J. L. J. Am. Chem. Soc. 2018, 140, 4004.

[6]
(a) Sornay, C.; Vaur, V.; Wagner, A.; Chaubet, G. R. Soc. Open Sci. 2022, 9, 211563.

(b) Spears, R. J.; Chudasama, V. Curr. Opin. Chem. Biol. 2023, 75, 102306.

[7]
Deng, J.-R.; Lai, N. C.-H.; Kung, K. K.-Y.; Yang, B.; Chung, S.-F.; Leung, A. S.-L.; Choi, M.-C.; Leung, Y.-C.; Wong, M.-K. Commun. Chem. 2020, 3, 67.

[8]
Chen, D.; Disotuar, M. M.; Xiong, X.; Wang, Y.; Chou, D. H.-C. Chem. Sci. 2017, 8, 2717.

[9]
Meudom, R.; Zheng, N.; Zhu, S.; Jacobsen, M. T.; Cao, L.; Chou, D. H.-C. Curr. Res. Chem. Biol. 2022, 2, 100013.

[10]
Tang, K. C.; Raj, M. Angew. Chem., Int. Ed. 2021, 60, 1797.

[11]
Mikkelsen, J. H.; Gustafsson, M. B. F.; Skrydstrup, T.; Jensen, K. B. Bioconjugate Chem. 2022, 33, 625.

DOI PMID

[12]
Wang, S.; Zhou, Q.; Chen, X.; Luo, R.-H.; Li, Y.; Liu, X.; Yang, L.-M.; Zheng, Y.-T.; Wang, P. Nat. Commun. 2021, 12, 2257.

[13]
Miller, M. K.; Wang, H.; Hanaya, K.; Zhang, O.; Berlaga, A.; Ball, Z. T. Chem. Sci. 2020, 11, 10501.

DOI PMID

[14]
Lin, Z.; Liu, B.; Lu, M.; Wang, Y.; Ren, X.; Liu, Z.; Luo, C.; Shi, W.; Zou, X.; Song, X.; Tang, F.; Huang, H.; Huang, W. J. Am. Chem. Soc. 2024, 146, 23752.

[15]
Liew, S. S.; Zhang, C.; Zhang, J.; Sun, H.; Li, L.; Yao, S. Q. Chem. Commun. 2020, 56, 11473.

[16]
Onoda, A.; Inoue, N.; Sumiyoshi, E.; Hayashi, T. ChemBioChem 2020, 21, 1274.

[17]
Barber, L. J.; Yates, N. D. J.; Fascione, M. A.; Parkin, A.; Hemsworth, G. R.; Genever, P. G.; Spicer, C. D. RSC Chem. Biol. 2023, 4, 56.

[18]
Barber, L. J.; Stankevich, K. S.; Spicer, C. D. JACS Au 2025, 5, 1983.

[19]
Hanaya, K.; Yamoto, K.; Taguchi, K.; Matsumoto, K.; Higashibayashi, S.; Sugai, T. Chem. Eur. J. 2022, 28, e202201677.

[20]
Hanaya, K.; Taguchi, K.; Wada, Y.; Kawano, M. Angew. Chem., Int. Ed. 2025, 64, e202417134.

[21]
Sim, Y. E.; Nwajiobi, O.; Mahesh, S.; Cohen, R. D.; Reibarkh, M. Y.; Raj, M. Chem. Sci. 2020, 11, 53.

[22]
Maza, J. C.; Ramsey, A. V.; Mehare, M.; Krska, S. W.; Parish, C. A.; Francis, M. B. Org. Biomol. Chem. 2020, 18, 1881.

[23]
Sahu, T.; Kumar, M.; T. K, S.; Joshi, M.; Mishra, R. K.; Rai, V. Chem. Commun. 2022, 58, 12451.

[24]
Machida, H.; Kanemoto, K. Angew. Chem., Int. Ed. 2024, 63, e202320012.

[25]
(a) Bandyopadhyay, A.; Cambray, S.; Gao, J. Chem. Sci. 2016, 7, 4589.

DOI PMID

(b) Huang, L.; Lee, L. C.-C.; Shum, J.; Xu, G.-X.; Lo, K. K.-W. Chem. Commun. 2024, 60, 6186.

[26]
Li, K.; Wang, W.; Gao, J. Angew. Chem., Int. Ed. 2020, 59, 14246.

[27]
Silva, M. J. S. A.; Cavadas, R. A. N.; Faustino, H.; Veiros, L. F.; Gois, P. M. P. Chem.-Eur. J. 2022, 28, e202202377.

[28]
Zheng, X.; Li, Z.; Gao, W.; Meng, X.; Li, X.; Luk, L. Y. P.; Zhao, Y.; Tsai, Y.-H.; Wu, C. J. Am. Chem. Soc. 2020, 142, 5097.

[29]
Wu, Y.; Li, C.; Fan, S.; Zhao, Y.; Wu, C. Bioconjugate Chem. 2021, 32, 2065.

[30]
Istrate, A.; Geeson, M. B.; Navo, C. D.; Sousa, B. B.; Marques, M. C.; Taylor, R. J.; Journeaux, T.; Oehler, S. R.; Mortensen, M. R.; Deery, M. J.; Bond, A. D.; Corzana, F.; Jiménez-Osés, G.; Bernardes, G. J. L. J. Am. Chem. Soc. 2022, 144, 10396.

DOI PMID

[31]
Mir, M. H.; Parmar, S.; Singh, C.; Kalia, D. Nat. Commun. 2024, 15, 859.

[32]
Bloom, S.; Liu, C.; Kölmel, D. K.; Qiao, J. X.; Zhang, Y.; Poss, M. A.; Ewing, W. R.; MacMillan, D. W. C. Nat. Chem. 2018, 10, 205.

[33]
Zhang, L.; Floyd, B. M.; Chilamari, M.; Mapes, J.; Swaminathan, J.; Bloom, S.; Marcotte, E. M.; Anslyn, E. V. ACS Chem. Biol. 2021, 16, 2595.

DOI PMID

[34]
Le Du, E.; Garreau, M.; Waser, J. Chem. Sci. 2021, 12, 2467.

[35]
(a) Amaike, K.; Tamura, T.; Hamachi, I. Chem. Commun. 2017, 53, 11972.

(b) Mortensen, M. R.; Skovsgaard, M. B.; Gothelf, K. V. ChemBioChem 2019, 20, 2711.

DOI PMID

(c) Sheryl Sharma, S.; Naldrett, M. J.; Gill, M. J.; Checco, J. W. J. Am. Chem. Soc. 2024, 146, 13676.

DOI PMID

[36]
Shiraiwa, K.; Cheng, R.; Nonaka, H.; Tamura, T.; Hamachi, I. Cell Chem. Biol. 2020, 27, 970.

DOI PMID

[37]
Zhang, X.; Jiang, L.; Huang, K.; Fang, C.; Li, J.; Yang, J.; Li, H.; Ruan, X.; Wang, P.; Mo, M.; Wu, P.; Xu, Y.; Peng, C.; Uesugi, M.; Ye, D.; Yu, F.-X.; Zhou, L. ACS Chem. Biol. 2020, 15, 632.

[38]
Xin, X.; Zhang, Y.; Gaetani, M.; Lundström, S. L.; Zubarev, R. A.; Zhou, Y.; Corkery, D. P.; Wu, Y.-W. Chem. Sci. 2022, 13, 7240.

[39]
Tamura, T.; Ueda, T.; Goto, T.; Tsukidate, T.; Shapira, Y.; Nishikawa, Y.; Fujisawa, A.; Hamachi, I. Nat. Commun. 2018, 9, 1870.

[40]
Kawano, M.; Murakawa, S.; Higashiguchi, K.; Matsuda, K.; Tamura, T.; Hamachi, I. J. Am. Chem. Soc. 2023, 145, 26202.

[41]
Kosar, M.; Sykes, D. A.; Viray, A. E. G.; Vitale, R. M.; Sarott, R. C.; Ganzoni, R. L.; Onion, D.; Tobias, J. M.; Leippe, P.; Ullmer, C.; Zirwes, E. A.; Guba, W.; Grether, U.; Frank, J. A.; Veprintsev, D. B.; Carreira, E. M. J. Am. Chem. Soc. 2023, 145, 15094.

[42]
Reddi, R. N.; Rogel, A.; Resnick, E.; Gabizon, R.; Prasad, P. K.; Gurwicz, N.; Barr, H.; Shulman, Z.; London, N. J. Am. Chem. Soc. 2021, 143, 20095.

[43]
Reddi, R. N.; Rogel, A.; Gabizon, R.; Rawale, D. G.; Harish, B.; Marom, S.; Tivon, B.; Arbel, Y. S.; Gurwicz, N.; Oren, R.; David, K.; Liu, J.; Duberstein, S.; Itkin, M.; Malitsky, S.; Barr, H.; Katz, B.-Z.; Herishanu, Y.; Shachar, I.; Shulman, Z.; London, N. J. Am. Chem. Soc. 2023, 145, 3346.

[44]
Raynal, L.; Nabarro, J.; Miller, L.; Dowle, A.; Moul, S.; Johnson, S.; Fascione, M.; Spicer, C. ChemRxiv. 2024, doi: 10.26434/chem-rxiv-2024-qskp0.

[45]
(a) Kumar, M.; Reddy, N. C.; Rai, V. Chem. Commun. 2021, 57, 7083.

(b) Chauhan, P.; V, R.; Kumar, M.; Molla, R.; V. B, U.; Rai, V.; ACS Cent. Sci. 2023, 9, 137.

[46]
Adusumalli, S. R.; Rawale, D. G.; Singh, U.; Tripathi, P.; Paul, R.; Kalra, N.; Mishra, R. K.; Shukla, S.; Rai, V. J. Am. Chem. Soc. 2018, 140, 15114.

DOI PMID

[47]
Adusumalli, S. R.; Rawale, D. G.; Thakur, K.; Purushottam, L.; Reddy, N. C.; Kalra, N.; Shukla, S.; Rai, V. Angew. Chem., Int. Ed. 2020, 59, 10332.

[48]
Rawale, D. G.; Gupta, M.; Thakur, K.; V, R.; Rai, V. Chem. Commun. 2024, 60, 7168.

[49]
Sahu, T.; Chilamari, M.; Rai, V. Chem. Commun. 2022, 58, 1768.

[50]
Reddy, N. C.; Molla, R.; Joshi, P. N.; T. K, S.; Basu, I.; Kawadkar, J.; Kalra, N.; Mishra, R. K.; Chakrabarty, S.; Shukla, S.; Rai, V. Nat. Commun. 2022, 13, 6038.

[51]
Li, J.; Hu, Q.-L.; Song, Z.; Chan, A. S. C.; Xiong, X.-F. Sci. China Chem. 2022, 65, 1356.

[52]
Nielsen, T.; Märcher, A.; Drobňáková, Z.; Hučko, M.; Štengl, M.; Balšánek, V.; Wiberg, C.; Nielsen, P. F.; Nielsen, T. E.; Gothelf, K. V.; Cló, E. Org. Biomol. Chem. 2020, 18, 4717.

[53]
Rawale, D. G.; Thakur, K.; Sreekumar, P.; T. K, S.; A, R.; Adusumalli, S. R.; Mishra, R. K.; Rai, V. Chem. Sci. 2021, 12, 6732.

[54]
Tian, D.; Tan, T. W.; Kuan Hai, R. T.; Wang, G.; Mohamed, F. P.; Yu, Z.; Ang, H. T.; Xu, W.; Tan, Q. W.; Ng, P. S.; Low, C. H.; Liu, B.; Quek Zekui, P.; Joy, J. K.; Cherian, J.; Mak, F. S.; Wu, J. J. Am. Chem. Soc. 2024, 146, 31321.

[55]
Saebi, A.; Brown, J. S.; Marando, V. M.; Hartrampf, N.; Chumbler, N. M.; Hanna, S.; Poskus, M.; Loas, A.; Kiessling, L. L.; Hung, D. T.; Pentelute, B. L. ACS Chem. Biol. 2023, 18, 518.

DOI PMID

[56]
Fittolani, G.; Callahan, A. J.; Loas, A.; Pentelute, B. L. Chem. Commun. 2025, 61, 5471.

[57]
Charalampidou, A.; Nehls, T.; Meyners, C.; Gandhesiri, S.; Pomplun, S.; Pentelute, B. L.; Lermyte, F.; Hausch, F. ACS Cent. Sci. 2024, 10, 649.

[58]
Williams, E. T.; Schiefelbein, K.; Schuster, M.; Ahmed, I. M. M.; De Vries, M.; Beveridge, R.; Zerbe, O.; Hartrampf, N. Chem. Sci. 2024, 15, 8756.

DOI PMID

[59]
Ferentzi, K.; Nagy-Fazekas, D.; Farkas, V.; Perczel, A. React. Chem. Eng. 2024, 9, 58.

[60]
(a) Coley, C. W.; Green, W. H.; Jensen, K. F. Acc. Chem. Res. 2018, 51, 1281.

(b) Zhou, Z.; Li, X.; Zare, R. N. ACS Cent. Sci. 2017, 3, 1337.

(c) Gao, H.; Struble, T. J.; Coley, C. W.; Wang, Y.; Green, W. H.; Jensen, K. F. ACS Cent. Sci. 2018, 4, 1465.

[61]
Mohapatra, S.; Hartrampf, N.; Poskus, M.; Loas, A.; Gómez- Bombarelli, R.; Pentelute, B. L. ACS Cent. Sci. 2020, 6, 2277.

[62]
Li, C.; Zhang, G.; Mohapatra, S.; Callahan, A. J.; Loas, A.; Gómez-Bombarelli, R.; Pentelute, B. L. Adv. Sci. 2022, 9, 2201988.

Outlines

/