突破RNA结构研究的“盲盒”困境
传统的RNA结构解析方法面临实验成本高昂、预测精度不足等难题。冷冻电镜虽然能够解析高分辨率结构,但要筛选出能够形成稳定构象的RNA序列,仍然需要耗费大量资源。此外,现有算法还依赖于Rfam数据库等二级结构信息。“RNA有很多家族,此前在解析RNA结构时,科研人员往往不确定应该选择哪些序列进行解析。”复旦大学智能复杂体系实验室研究员、文章共同通讯作者孙思琦解释道,“这就像开‘盲盒’,我们只能猜测哪些家族的序列可能具有稳定的结构。”
面对这一困境,团队决定引入人工智能技术。孙思琦本科毕业于复旦大学数学科学学院,博士期间在美国攻读计算机专业,研究方向为计算生物学,毕业后在美国微软研究院开展大语言模型相关的研究。回国后,他和团队开始尝试用AI大模型解决生物问题,RNA结构研究是他们持续关注的方向之一。复旦大学智能复杂体系实验室博士生吴浩、许晟为本文共同第一作者。
孙思琦团队与合作团队共同突破三大技术:提出高速高灵敏度的蛋白质同源物检测方法,实现远程同源物的快速识别;开发高精度端到端RNA三维结构预测方法,建立全链条结构解析框架;设计基于非自回归神经网络的蛋白质谱快速解析算法,攻克质谱数据高效解码难题。通过融合大语言模型与对比学习技术,该系列成果在蛋白质检测、RNA结构预测、蛋白质测序等方向同步提升AI算法的速度与精度。相关研究成果于近期发表于《自然》(Nature)子刊,为本工作奠定了基础。
在这项最新研究中,复旦大学与华西医院团队紧密合作。复旦大学团队负责AI算法的开发,而四川大学华西医院则负责使用冷冻电镜对RNA结构进行解析。
“通过将AI与实验相结合,我们可以精确预测出哪些RNA序列具有稳定的结构。”孙思琦表示。基于AI的分析结果,实验人员在解析这些结构时,只需关注那些被推荐的序列,科研效率得到了大幅提升。 只需关注那些被推荐的序列,科研效率得到了大幅提升
頁:
[1]