固原PVC管道管件粘接胶 蛋白质药物生产成本有望大幅降低! MIT用大模型优化酵母密码子

2026-03-08 15:42:27 84

PVC管道管件粘结胶

工业酵母是蛋白质生产域的主力军,广泛用于疫苗、生物制药及其他有用化物的制造。在项新研究中,MIT 化学工程师借助 AI 优化了新型蛋白质生产工艺的开发流程,有望降低这类药物的整体开发和生产成本。

研究团队利用大语言模型(LLM)分析了工业酵母卡氏酵母(Komagataella phaffii)的遗传密码,考察了其所使用的密码子。密码子是由三个碱基组成的 DNA 序列,用于编码特定氨基酸,每种氨基酸可由多种密码子编码,且不同生物体的密码子使用规律各不相同。

MIT 团队开发的新模型学习了卡氏酵母的密码子使用规律,并据此预测哪些密码子适生产特定蛋白质。研究人员借助这法,成功提升了酵母生产六种不同蛋白质的率,包括人类生长激素和种用于疗症的单克隆抗体。

“拥有能够持续表现稳定的预测工具,对于缩短从创意到投产的时间至关重要。消除不确定,归根结底就是节省时间和金钱,”MIT 化学工程系雷蒙德·A.与海伦·E.圣-洛朗讲席教授、科赫综症研究所成员、MIT 新制造业计划(MIT INM)联学术主任 J.克里斯托弗·洛夫(J.Christopher Love)说。

洛夫是这项新研究的通讯作者固原PVC管道管件粘接胶,论文本周发表于《美国国科学院院刊》。MIT 前博士后哈里尼·纳拉亚南(Harini Narayanan)为论文作者。

卡氏酵母和酿酒酵母(Saccharomyces cerevisiae,即面包酵母)是生物制药行业的核心生产平台,每年生产数十亿美元规模的蛋白质药物和疫苗。

研究人员在对酵母进行工业蛋白质生产改造时,需从其他生物体中提取目标基因(如胰岛素基因),并对其进行改造,使酵母能够大量表达该蛋白质。这过程涉及为酵母细胞设计优 DNA 序列、将其整到酵母基因组、制定有利的培养条件,终纯化目标产物等多个环节。

对于新型生物制品药物而言,这类大型复杂药物由活体生物产生,上述开发流程可能占药物商业化总成本的 15% 至 20%。

奥力斯    万能胶生产厂家    联系人:王经理    手机:13903175735(微信同号)    地址:河北省任丘市北辛庄乡南代河工业区

“目前固原PVC管道管件粘接胶,这些步骤全部依赖繁琐的实验操作,”洛夫说,“我们直在思考:能否将机器学习域涌现的新理念引入进来,使这程的各个环节加可靠、易预测。”

在这项研究中,研究人员尝试优化目标蛋白质基因的 DNA 密码子序列。自然界中存在 20 种氨基酸,但密码子序列多达 64 种,因此大多数氨基酸可由不止种密码子编码。每个密码子对应种特定的转运 RNA(tRNA)分子,负责将相应氨基酸携带至核糖体,氨基酸在那里被串联成蛋白质。

不同生物体使用各类密码子的频率不同。工程蛋白质的设计者通常会选择宿主生物体中出现频率的密码子,以优化目标蛋白质的生产率。然而,这种做法未能获得佳结果。例如,如果始终使用同种密码子编码精氨酸,细胞内对应的 tRNA 分子可能会出现供应不足。

为采取精细化的优化策略,MIT 团队引入了种编码器-解码器架构的大语言模型。研究人员用该模型分析 DNA 序列,学习特定基因中密码子的使用规律,而非分析文本。

训练数据来自美国国生物技术信息中心的公开数据集,pvc管道管件胶涵盖卡氏酵母产生的约 5000 种蛋白质的氨基酸序列及对应 DNA 序列。

“模型学习的是这些密码子使用式的语法或语言规则固原PVC管道管件粘接胶,”洛夫说,“它不仅考虑了相邻密码子之间的关系,还捕捉了密码子之间的长程关联。”

完成训练后,研究人员让模型对六种蛋白质的密码子序列进行优化,包括人类生长激素、人清白蛋白,以及用于疗症的单克隆抗体曲妥珠单抗。

研究团队还使用四种市售密码子优化工具生成了上述蛋白质的优化序列,并将所有序列分别入卡氏酵母细胞,测量各序列对目标蛋白质的产量贡献。结果显示,六种蛋白质中有五种的优序列来自 MIT 新模型,另种中 MIT 模型排名二。

“我们确保涵盖了密码子优化的多种不同法论,并与我们的案进行了基准比较,”纳拉亚南说,“通过实验对比,我们证明了我们的法优于其他案。”

卡氏酵母原名毕赤酵母(Pichia pastoris),用于生产数十种商业产品,包括胰岛素、乙型肝疫苗,以及种用于疗慢偏头痛的单克隆抗体,还被用于生产添加至食品中的营养物质,如红蛋白。

洛夫实验室的研究人员已开始使用这新模型优化卡氏酵母的目标蛋白质,并已将代码公开,供其他研究人员用于卡氏酵母或其他生物体的相关研究。

研究团队还在包括人类和牛在内的不同物种数据集上测试了这法。各物种模型生成的预测结果各不相同,表明需要针对不同物种建立属模型,才能有优化目标蛋白质的密码子。

通过入分析模型的内部工作机制,研究人员发现,模型似乎自主习得了基因组运作的部分生物学原理,包括些研究人员并未主动教授的内容。例如,模型学会了避引入负重复元件,即可能抑制附近基因表达的 DNA 序列;同时还学会了根据疏水和亲水等特征对氨基酸进行归类。

“它不仅学习了这种语言,还通过生物物理和生物化学特征对其进行了情境化理解。这让我们加确信,模型学到的是真正有意义的内容,而非仅仅在优化我们交给它的任务,”洛夫说。

相关词条:铁皮保温施工     隔热条设备     锚索    离心玻璃棉    万能胶生产厂家

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。

新闻资讯

热点资讯

推荐资讯