语言模型可以读取基因组吗

生活 编辑:
导读 与编码软件成为头条新闻并通过律师资格答案 的同类人工智能已经学会了阅读不同类型的文本——遗传密码。该代码包含所有生命功能的指令,并遵...

与编码软件成为头条新闻并通过律师资格答案 的同类人工智能已经学会了阅读不同类型的文本——遗传密码。

该代码包含所有生命功能的指令,并遵循与管理人类语言的规则不同的规则。基因组中的每个序列都遵循复杂的语法和句法,这些结构产生了意义。正如改变几个单词可以从根本上改变句子的影响一样,生物序列的微小变化也可以使序列编码的形式产生巨大差异。

现在,由机器学习专家王梦迪领导的普林斯顿大学研究人员正在使用语言模型来追踪部分基因组序列并优化这些序列,以研究生物学和改进医学。他们已经在进行中。

4 月 5 日发表在期刊上的一篇论文在 4 月 5 日发表在《自然机器智能》中,作者详细介绍了一种语言模型,该模型利用其语义表示的能力来设计更有效的 mRNA 疫苗,例如用于预防 COVID-19 的疫苗。

在翻译中找到

科学家有一种简单的方法来总结遗传信息的流动。他们称之为生物学的中心法则。信息从DNA转移到RNA再到蛋白质。蛋白质创造活细胞的结构和功能。

信使 RNA(或 mRNA)在最后一步(称为翻译)将信息转化为蛋白质。但 mRNA 很有趣。它只有一部分包含蛋白质的代码。其余部分不进行翻译,但控制翻译过程的重要方面。

控制蛋白质生产的效率是 mRNA 疫苗发挥作用的关键机制。研究人员将他们的语言模型集中在未翻译的区域,看看如何优化效率并改进疫苗。

标签:
免责声明:本文由用户上传,如有侵权请联系删除!