梁婕团队 EST 新进展:MD+ML 解锁 PFAS 分配预测机理
湖南大学梁婕团队EST ASAP|从微观到宏观:跨尺度融合-MD+ML框架解锁PFAS固液分配预测新范式,助力新污染物精准防控

第一作者:张乐天(湖南大学环境科学与工程学院)
通讯作者:梁婕教授 通讯单位:湖南大学环境科学与工程学院
DOI 链接:https://doi.org/10.1021/acs.est.5c07998
简介
全氟和多氟烷基物质(PFAS)作为全球持久性污染物,其环境归趋预测是生态风险管控的核心难题。固液分配系数(logKd)直接决定PFAS在土壤/沉积物中的迁移与生物累积潜力,但传统机器学习模型因忽略实际水化学对PFAS微观行为的动态影响,预测精度受限、机制不足。湖南大学梁婕团队创新性提出Phys-ML Sorp跨尺度框架,将分子动力学(MD)模拟与机器学习(ML)深度融合,首次量化离子环境下PFAS的微观动态特征,实现logKd的高精度可解释预测,为PFAS污染防控与风险评估提供了全新范式。
研究背景与科学问题
PFAS凭借极强的化学稳定性,在水体和土壤中长期残留并易生物累积,对生态环境和人体健康构成持续威胁。准确预测PFAS在土壤/沉积物中的固液分配系数(logKd),是解析其迁移规律、评估环境风险的关键。现有机器学习模型多依赖分子量、logKow等静态宏观特征,未能捕捉实际水化学环境变化(如离子浓度、组成)对PFAS分子构象、溶剂化作用的动态影响,导致在复杂环境中预测偏差较大。如何打通微观分子行为与宏观分配归趋的关联,提升模型的预测精度与物理可解释性,成为该领域的核心挑战。
核心研究目标
为破解上述难题,研究团队构建了系统性研究方案:1. 基于以往研究筛选整理了499个PFAS固液分配观测数据(涵盖35种PFAS),聚焦纯水与CaCl₂体系,确保离子环境明确可控;2. 通过MD模拟提取PFAS的微观动态特征,创新引入有效活度系数(logγ),量化离子环境对分子行为的影响;3. 融合微观特征与传统宏观参数,构建堆叠集成机器学习模型,提升logKd预测性能;4. 借助SHAP分析揭示关键影响因子与作用机制,实现机器学习可解释建模的跨越。

图2:Phys-ML Sorp模型的预测性能
团队构建的“5个基础模型+RidgeCV元学习器”堆叠集成模型,展现出优异的预测能力:测试集R2达0.8829、RMSE=0.32、RPD=2.92。与仅依赖宏观特征的模型相比,该框架使RPD提升14.62%、RMSE降低13.52%,证实MD衍生的微观特征对预测精度的关键增益作用。

图3:PFAS微观行为的核心调控机制
MD模拟首次揭示了分子结构与离子环境对PFAS行为的双重调控:碳链长度与微观特征呈线性正相关:随-CF₂基团增加,回转半径(Rg)和溶剂可及表面积(SASA)显著增大,疏水作用增强,推动PFAS向固相分配;离子强度(Ca2⁺浓度)驱动构象收缩:高离子强度下,Ca2⁺通过电荷屏蔽效应减少PFAS分子间静电排斥,使Rg和SASA降低,同时减少PFAS-水氢键数量、降低logγ(热力学稳定性下降),触发“盐析效应”,促进PFAS吸附。

图4:微观特征与宏观分配的定量关联
研究首次建立了MD衍生微观特征与logKd的强线性关联:logKd与SASA的相关系数R2=0.7197,与Rg的R2=0.7010。 这一发现直接证实,SASA作为分子疏水区域暴露程度的直接表征,是驱动PFAS固液分配的核心微观因子,为宏观分配行为提供了明确的原子级解释,弥补了传统静态描述的局限性。

图5:关键影响因子的层级与作用规律
SHAP分析揭示了logKd预测的核心驱动因子层级:1. 分子量(MW,0.32)、溶剂可及表面积(SASA,0.28)、辛醇-水分配系数(logKow,0.23)为Top3主导因子,证实PFAS固有结构与疏水性是分配行为的核心决定因素; 2. MD衍生特征贡献显著:有效活度系数(logγ,0.08)、回转半径(Rg,0.07)分别位列第5、7位,其中logγ通过整合Rg量化非理想溶液效应,提供了宏观特征无法捕捉的分子动态响应信息; 3. 非线性作用机制:Rg对logKd呈倒V型影响(存在最优分子尺寸,过大易受空间位阻限制),pH呈V型影响(中性条件下PFAS与土壤表面静电排斥最强,logKd最低)。
核心启示
1. 跨尺度融合是提升环境污染物机器学习预测从黑箱模型到机制模型融合的关键:MD模拟捕捉的微观动态特征(如Rg、SASA、logγ),为机器学习模型注入物理意义,实现“微观分子行为-宏观分配归趋”的定量衔接;2. 精准防控需聚焦核心影响因子:针对长链PFAS及高离子强度污染区域,应优先采取靶向管控措施,同时针对新污染物去除设计特定的吸附材料;3. 该框架为持久性污染物建模提供通用范式:可推广至PAHs、PCBs等其他疏水污染物,为复杂环境下污染物归趋预测与风险评估提供新工具。
作者介绍
第一作者:张乐天,湖南大学环境科学与工程学院2024级能源动力专业博士研究生,主要研究方向为新污染物的环境行为与模拟。参与国家自然科学基金联合重点项目、湖南省重大水利科技项目等多项科研项目。以第一作者在ES&T、JES、环境科学学报等杂志上发表论文5篇。
通讯作者:梁婕,博士,湖南大学环境科学与工程学院教授、博士生导师,国家高层次人才计划青年项目入选者,湖南省科技创新领军人才、湖南省杰出青年基金获得者,国家注册环境影响评价工程师。主要从事流域水生态环境过程、效应与管理等方面的工作。近年来,第一/通讯作者在国际权威杂志ES&T、WR、JH等上发表SCI论文60余篇,入选全球前2%顶尖科学家职业长期影响力榜单。
通讯邮箱:liangjie@hnu.edu.cn
【关闭】