论文汇总丨超100篇AI for Science重要成果,一文速览2025年技术创新

📅 发布时间:2026/7/4 23:01:44 👁️ 浏览次数:
论文汇总丨超100篇AI for Science重要成果,一文速览2025年技术创新
过去一年AI 与科学研究的关系正在发生一场深刻而安静的转变。从实验设计、数据建模到理论推演人工智能正以前所未有的速度渗透进科研流程的核心环节催生出一批难以用传统范式解释的突破性成果。2025 年AI for Science 不再只是零散的技术应用而是逐渐演化为一条清晰、系统、可复用的科研创新路径。与早期「AI 辅助科研」的尝试不同2025 年的一个显著变化在于AI 不再只是工具而是正在成为科研范式的一部分。越来越多的研究工作从一开始就围绕「如何让模型参与科学发现」展开设计这也催生了大量兼具方法创新与科学价值的高质量成果。HyperAI超神经长期关注 AI4S 领域的进展与突破通过系统解读前沿论文的方式记录这一浪潮中的关键节点。一方面我们希望将最新的研究成果与方法论进行结构化、普适化的整理降低不同领域读者的理解门槛另一方面也希望通过持续输出推动更多研究者、工程师与机构真正认识到 AI 对科研生产力的深远影响。值此岁末年初正是回顾与展望的关键时刻。本文对「HyperAI超神经」在2025 年解读过的 AI for Science 相关前沿论文进行了系统梳理与分类汇总覆盖生物医药、医疗健康、材料化学、气象研究、天文学等多个方向方便不同背景的读者快速检索与回顾。查看更多前沿论文https://hyper.ai/cn/papers查看研究相关数据集https://hyper.ai/cn/datasetsAI 生物医药新的生成式模型及新评测基准重塑无序蛋白集合预测能力Advancing Protein Ensemble Predictions Across the Order-Disorder Continuum*来源bioRxiv*作者Peptone 公司、英伟达公司、麻省理工学院等组成的联合团队*解读重塑无序蛋白集合预测能力英伟达/MIT/牛津大学/哥本哈根大学/Peptone等发布生成式模型及新评测基准*论文https://www.biorxiv.org/content/10.1101/2025.10.18.680935v1首个经人类皮层数据验证的神经元建模框架 NOBLE超越传统 4200 倍速NOBLE - Neural Operator with Biologically-informed Latent Embeddings to Capture Experimental Variability in Biological Neuron Models*来源NeurIPS 2025*作者苏黎世联邦理工学院、加州理工学院与阿尔伯塔大学等机构的联合团队*解读超越传统4200倍速苏黎世联邦理工提出NOBLE首个经人类皮层数据验证的神经元建模框架*论文https://go.hyper.ai/Ramfp图神经网络 PLACER解决蛋白质构象异质性Modeling protein-small molecule conformational ensembles with PLACER*来源《美国国家科学院院刊》PNAS*作者华盛顿大学 David Baker 教授的研究团队*解读解决蛋白质构象异质性的原子级建模挑战David Baker团队PLACER框架解析*论文https://www.biorxiv.org/content/10.1101/2024.09.25.614868v2Squidiff 实现多场景转录组模拟助力精准医学与空间医学发展Squidiff: predicting cellular development and responses to perturbations using a diffusion model*来源Nature Methods*作者哥伦比亚大学、斯坦福大学的联合研究团队*解读哥大/斯坦福联手Squidiff实现多场景转录组模拟助力精准医学与空间医学发展*论文https://www.nature.com/articles/s41592-025-02877-y血液细胞图像分类器扩散模型助力白血病发现能力超越临床专家Deep generative classification of blood cell morphology*来源Nature*作者英国剑桥大学的研究团队*解读剑桥大学研发血液细胞图像分类器扩散模型助力白血病发现能力超越临床专家*论文https://www.nature.com/articles/s42256-025-01122-7Ctrl-DNA 框架实现特定细胞基因表达的「靶向控制」Ctrl-DNA: Constrained Reinforcement Learning for Cell-Specific Cis-Regulatory Element Design*来源NeurIPS 2025*作者多伦多大学团队联合昌平实验室*解读入选NeurIPS 2025多伦多大学等提出Ctrl-DNA框架实现特定细胞基因表达的「靶向控制」*论文https://arxiv.org/abs/2505.20578BoltzGen可跨分子类型设计蛋白结合物66%靶标获纳摩尔级亲和力BoltzGen: Toward Universal Binder Design*来源*作者麻省理工学院与 Boltz 等多家机构*解读MIT团队开源BoltzGen可跨分子类型设计蛋白结合物66%靶标获纳摩尔级亲和力*论文https://go.hyper.ai/3sx2K全新蛋白质动态融合表征框架 FusionProt实现迭代式信息交换多项任务性能达到 SOTAFusionProt: Fusing Sequence and Structural Information for Unified Protein Representation Learning*来源bioRxiv*作者以色列理工学院联合 Meta AI 的研究团队*解读Meta AI等提出全新蛋白质动态融合表征框架FusionProt实现迭代式信息交换多项任务性能达到SOTA*论文https://go.hyper.ai/OXLYl转录组引导的扩散模型 MorphDiff为表型药物研发提速Prediction of cellular morphology changes under perturbations with a transcriptome-guided diffusion model*来源Nature Communications*作者中国香港中文大学、穆罕默德·本·扎耶德人工智能大学等机构的研究人员*解读关联基因表达数据与细胞形态图像港中文等开发转录组引导的扩散模型为表型药物研发提速*论文https://www.nature.com/articles/s41467-025-63478-zAlphaPPIMIPPIs 界面调节剂预测性能超越现有方法Alphappimi: a comprehensive deep learning framework for predicting PPI-modulator interactions*来源Journal of Cheminformatics*作者中国石油大学和延世大学的联合研究团队*解读从「盲筛」到 「精准定位」中国石油大学团队推出AlphaPPIMIPPIs 界面调节剂预测性能超越现有方法*论文https://jcheminf.biomedcentral.com/articles/10.1186/s13321-025-01077-2AI 医疗健康Healthcare Agent 问诊主动性及相关性超越GPT-4等闭源模型Healthcare agent: eliciting the power of large language models for medical consultation*来源Nature Artificial Intelligence*作者武汉大学和南洋理工大学研究团队*解读从伦理保障到病史管理武汉大学等提出Healthcare Agent问诊主动性及相关性超越GPT-4等闭源模型*论文https://go.hyper.ai/09lYXICA-Var 的多变量分析方法基于基因测序和机器学习的废水流行病学评估病毒检出时间最高提前 4 周Early detection of emerging SARS-CoV-2 Variants from wastewater through genome sequencing and machine learning*来源Nature Communications*作者内华达大学拉斯维加斯分校的研究团队*解读登Nature子刊基于基因测序和机器学习的废水流行病学评估病毒检出时间最高提前4周*论文https://www.nature.com/articles/s41467-025-61280-5医学 GraphRAG 刷新问答准确性记录在 11 个数据集评测上达 SOTAMedical Graph RAG: Towards Safe Medical Large Language Model via Graph Retrieval-Augmented Generation*来源ACL 2025*作者牛津大学、卡内基梅隆大学与爱丁堡大学的联合团队*解读ACL 2025丨牛津大学等提出医学GraphRAG刷新问答准确性记录在11个数据集评测上达SOTA*论文https://go.hyper.ai/OaMIE首个 VR 运动干预系统 REVERIE「灵境」重塑青少年脑-身-心健康Adaptive AI-based virtual reality sports system for adolescents with excess body weight: a randomized controlled trial*来源Nature Medicine*作者上海交通大学医学院附属第六人民医院/主动健康战略与发展研究院李华婷教授团队、上海交通大学计算机学院/人工智能教育部重点实验室盛斌教授团队通过医工交叉合作研究携手上海体育大学王继红研究员团队、上海科技大学/上海临床研究中心曾嵘教授团队及新加坡国立大学林水德教授团队*解读钱学森「灵境」 预言成真上交/上体/清华等构建全球首个VR运动干预系统REVERIE重塑青少年脑-身-心健康*论文https://www.nature.com/articles/s41591-025-03724-5NeuralCohort 方法基于多维度 EHR 数据实现细粒度患者队列建模住院时间预测准确率提升 16.3%NeuralCohort: Cohort-aware Neural Representation Learning for Healthcare Analytics*来源ICML 2025*作者新加坡国立大学联合浙江大学*解读新加坡国立大学基于多维度EHR数据实现细粒度患者队列建模住院时间预测准确率提升16.3%*论文https://openreview.net/forum?idbqQVa6VRvm全球首个 HIE 领域临床思维图谱模型神经认知结果预测任务上性能提升 15%Visual and Domain Knowledge for Professional-level Graph-of-Thought Medical Reasoning*来源ICML 2025*作者哈佛医学院、波士顿儿童医院、纽约大学及 MIT-IBM 沃森实验室的跨学科团队*解读入选ICML 2025哈佛医学院等推出全球首个HIE领域临床思维图谱模型神经认知结果预测任务上性能提升15%*论文https://openreview.net/forum?idtnyxtaSve5分层蒸馏多示例学习框架 HDMIL快速处理千兆像素病理全切片图像Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning*来源CVPR 2025*作者哈尔滨工业大学江俊君教授、江奎副教授和张永兵教授团队*解读入选CVPR 2025哈工大团队提出分层蒸馏多示例学习框架HDMIL快速处理千兆像素病理全切片图像*论文https://go.hyper.ai/B3RMf专为 3D 血管分割而设计的基础模型 vesselFM能够在零样本、单样本和少样本场景中实现优于现有先进模型的分割能力和泛化能力。vesselFM: A Foundation Model for Universal 3D Blood Vessel Segmentation*来源CVPR 2025*作者苏黎世大学、苏黎世联邦理工学院和慕尼黑工业大学的研究人员*解读性能远超SAM系模型苏黎世大学等开发通用3D血管分割基础模型入选CVPR 2025*论文https://go.hyper.ai/lVad9图编码混合生存模型基于 800 万真实数据识别具有一致特征和生存结局的亚表型Identification of predictive subphenotypes for clinical outcomes using real world data and machine learningn*来源Nature Communication*作者美国康奈尔大学与再生元制药公司*解读基于800万真实数据康奈尔大学团队利用图神经网络精准预测肺癌患者生存期发现3类致命亚型*论文https://doi.org/10.1038/s41467-025-59092-8融合策略AI模型实现多中心、跨专科感染性休克死亡风险的精准预测Artificial intelligence based multispecialty mortality prediction models for septic shock in a multicenter retrospective study*来源npj digital medicine*作者华中科技大学同济医学院附属同济医院、医药卫生管理学院研究团队*解读登Nature子刊华中科技大学提出融合策略AI模型实现多中心、跨专科感染性休克死亡风险的精准预测*论文https://go.hyper.ai/faMLLAI 材料化学不足 10 万结构数据训练PET-MAD 原子模拟精度媲美专业模型PET-MAD as a lightweight universal interatomic potential for advanced materials modeling*来源Nature Communications*作者瑞士洛桑理工学院*解读以不足10万结构数据训练瑞士洛桑联邦理工提出PET-MAD原子模拟精度媲美专业模型*论文https://www.nature.com/articles/s41467-025-65662-7计算成本减半将人类的化学推理形式化为机器可理解的框架ChemOntology: A Reusable Explicit Chemical Ontology-Based Method to Expedite Reaction Path Searches*来源ACS Catalysis*作者日本北海道大学*解读计算成本减半化学反应发现工具ChemOntology将人类直觉「编码」到系统中加速反应路径搜索*论文https://pubs.acs.org/doi/10.1021/acscatal.5c06298MOF-ChemUnity一个结构化、可扩展、可拓展的知识图谱MOF-ChemUnity: Literature-Informed Large Language Models for Metal–Organic Framework Research*来源ACS Publications*作者加拿大多伦多大学、加拿大国家研究委员会清洁能源创新研究中心*解读从9,874篇文献到1.5万晶体结构MOF-ChemUnity重构MOF全景知识推动材料发现进入「可解释AI」时代*论文https://pubs.acs.org/doi/10.1021/jacs.5c11789将 Graphormer 的全局注意力机制与 CGCNN 相融合CGformer: Transformer-enhanced crystal graph network with global attention for material property prediction*来源Matter*作者上海交通大学人工智能与微结构实验室*解读新材料研发提速上交大团队开发新AI材料设计模型CGformer融合全局注意力机制*论文https://www.cell.com/matter/abstract/S2590-2385(25)00423-0FASTSOLV 模型实现任意温度下的小分子溶解度预测Data-driven organic solubility prediction at the limit of aleatoric uncertainty*来源Nature Communication*作者麻省理工学院*解读推理速度快50倍MIT团队提出FASTSOLV模型实现任意温度下的小分子溶解度预测*论文https://www.nature.com/articles/s41467-025-62717-7利用 MOFs 合成后即可获得的信息来预测其潜在性能和用途Connecting metal-organic framework synthesis to applications using multimodal machine learning*来源Nature Communications*作者加拿大多伦多大学*解读多模态模型加速新材料与工业应用匹配无需完整晶体结构即可预测材料性质*论文https://www.nature.com/articles/s41467-025-60796-0首次构建能够同时处理超材料设计三大模态的统一框架UNIMATE: A Unified Model for Mechanical Metamaterial Generation, Property Prediction, and Condition Confirmation*来源ICML 2025*作者美国弗吉尼亚理工学院、 Meta AI*解读超材料设计破局Meta AI等提出UNIMATE首次实现拓扑生成/性能预测等任务的统一建模*论文https://go.hyper.ai/FoAWw覆盖 2 亿分子质谱图构建全球最大规模质谱数据集 GeMSSelf-supervised learning of molecular representations from millions of tandem mass spectra using DreaMS*来源Nature Biotechnology*作者捷克科学院有机化学与生物化学研究所*解读覆盖2亿分子质谱图捷克科学院发布DreaMS模型构建全球最大规模质谱数据集GeMS*论文https://go.hyper.ai/uNbqL在单一机器学习模型中同时学习广义势能及其对外部刺激的响应函数Unified differentiable learning of electric response*来源Nature Communications*作者哈佛大学、Robert Bosch LLC*解读从石英到铁电材料哈佛大学提出等变机器学习框架加速材料大规模电场模拟*论文https://go.hyper.ai/18TWgAI 农林畜牧业覆盖近 1.5 万个物种刷新生物声学分类检测 SOTAPerch 2.0: The Bittern Lesson for Bioacoustics*来源arXiv*作者Google DeepMind、Google Research*解读覆盖近1.5万个物种谷歌DeepMind发布Perch 2.0刷新生物声学分类检测SOTA*论文https://arxiv.org/abs/2508.04665首次将 219 个基于傅里叶变换、香农熵等数学理论的新型序列描述符纳入特征空间PlantLncBoost: key features for plant lncRNA identification and significant improvement in accuracy and generalization*来源New Phytologist*作者山东理工大学、北京林业大学、广东省农业科学院、巴西圣保罗大学、英国罗莎琳德富兰克林医科大学、瑞典于默奥大学*解读整合多源植物转录组数据山东理工大学等构建PlantLncBoost模型跨物种lncRNA预测准确率最高达96%*论文https://go.hyper.ai/F7pkcAI 气象研究攻克了「渐进式噪声调度」与「时间损失加权」的协同设计问题Elucidated Rolling Diffusion Models for Probabilistic Weather Forecasting*来源NeurIPS 2025*作者英伟达、加州大学圣迭戈分校*解读入选NeurIPS 2025英伟达提出ERDM模型解长期预报难题中远期预报持续领先EDM基准*论文https://doi.org/10.48550/arXiv.2506.20024一种新型潜在扩散模型可用于高精度概率性次季节至季节尺度天气预报OmniCast: A Masked Latent Diffusion Model for Weather Forecasting Across Time Scales*来源NeurIPS 2025*作者加州大学洛杉矶分校、美国阿贡国家实验室*解读效率至高提升20倍加州大学开发OmniCast解决自回归天气预报模型误差累计问题*论文https://go.hyper.ai/YANIu超本地预测模型实现了提前数天预测大部分强降雨事件Hyperlocal Extreme Rainfall Forecasts in Mumbai: Convolutional Neural Network Transfer Learning-Based Downscaling Approach*来源SSRN*作者印度理工学院孟买分校、马里兰大学*解读准确度提升400%印度季风预测模型基于36个气象站点实现城区尺度精细预报*论文https://go.hyper.ai/j05Vt仅需 2 分钟ACE2 可完成一次 4 个月季节预报Skilful global seasonal predictions from a machine learning weather model trained on reanalysis data*来源npj Climate and Atmospheric Science*作者英国埃克塞特哈德利中心气象局、埃克塞特大学、美国艾伦人工智能研究所Ai2*解读机器学习vs.动力学模型Ai2最新研究仅需2分钟ACE2可完成一次4个月季节预报*论文https://go.hyper.ai/YyRfT一个将球面信号处理与隐马尔可夫集合框架相结合的概率机器学习天气预报系统FourCastNet 3: A geometric approach to probabilistic machine-learning weather forecasting at scale*来源arXiv*作者英伟达、美国劳伦斯伯克利国家实验室、加州大学伯克利分校、美国加州理工学院*解读1分钟内完成15天预报英伟达/UC伯克利等提出机器学习天气预报系统FCN3支持单卡极速推理*论文https://arxiv.org/pdf/2507.12144无需依赖传统数值天气预报模型即可实现高技巧性的天气预报End-to-end>*来源Nature*作者剑桥大学、图灵研究所、多伦多大学、微软科学智能中心、欧洲中期天气预报中心、英国南极调查局、谷歌 DeepMind*解读登Nature剑桥大学等发布首个端到端的数据驱动天气预报系统预测速度提升数十倍*论文https://www.nature.com/articles/s41586-025-08897-0AI 天文学利用卷积神经网络成功识别出 7 个高质量类星体透镜候选体Quasars acting as Strong Lenses Found in DESI DR1*来源arXiv*作者斯坦福大学、SLAC 国家加速器实验室、北京大学、意大利国家天体物理研究院布雷拉天文台、伦敦大学学院、加州大学伯克利分校*解读斯坦福/北大/UCL/UC伯克利联手利用CNN从81万类星体中精准识别7个罕见透镜样本*论文https://arxiv.org/abs/2511.02009首个面向天文学的大规模多模态基础模型家族 AION-1AION-1: Omnimodal Foundation Model for Astronomical Sciences*来源NeurIPS 2025*作者加州大学伯克利分校、剑桥大学、牛津大学等*解读首个天文多模态基础模型AION-1诞生UC伯克利等基于2亿天文目标预训练成功构建泛化性多模态天文AI框架*论文https://openreview.net/forum?id6gJ2ZykQ5W