5月28日下午,中国科学技术大学王占锋副教授应金融统计研究室邀请,在行健楼526学术活动室作题为《Simultaneous Outlier Detection and Prediction for Kriging》的专题报告。王占锋老师2003年和2008年于中国科学技术大学先后获学士和理学博士学位,现为博士生导师,主要从事生物统计、函数型数据分析、非欧数据分析等领域的研究,现任中国现场统计研究会旅游大数据分会理事长、全国工业统计学教学研究会地学数据分会副理事长。

报告围绕“如何在异常值存在下实现稳健的空间预测”这一核心问题展开。王占锋老师指出,Kriging方法作为地统计学与计算机实验领域的核心工具,虽能有效拟合复杂响应曲面,但其插值特性使其对异常值极为敏感。然而,异常值并非总是“噪声”——例如医学影像中的异常区域可能指示恶性肿瘤,这对其识别反而具有临床价值。如何在检测异常值的同时保持预测精度,成为长期困扰学界的难题。
王占锋老师与其合作者提出了一种新颖的同时异常值检测与“稳健Kriging方法”。该方法引入正态-伽马分层先验,通过层次似然与最大后验估计,实现了对异常值位置和幅度的自动识别。理论分析证明,在适当正则条件下,该方法具有oracle性质:超参数估计与异常值检测均具有一致性,且在异常值存在下预测信息保持一致。
研究进一步揭示,所提方法在极端参数情形下具有明确的解释意义:当偏差参数为零时,退化为经典Kriging;当参数趋于无穷时,则等价于剔除所有异常值后的Kriging预测。这一性质使方法在完整数据与保守剔除之间实现了自然平滑过渡。计算方面,团队设计了简洁高效的两步迭代算法,通过阈值规则自动判定异常值,收敛判据严格可控。
在数值模拟中,研究团队以简约双变量Matérn模型为测试平台,在网格设计、随机设计与拉丁超立方设计三种实验布局下,分别引入5%、10%和15%的异常值。与经典Kriging、高斯过程回归、稳健高斯过程等多种主流方法相比,所提SODK方法在所有场景下均取得最低的平均预测均方根误差,且标准差显著更小。在NASA翼型仿真实验中,SODK同样表现优异;进一步分析表明,当使用SODK识别的异常值进行剔除后,经典Kriging的预测精度显著提升,验证了该方法作为“异常值筛选器”的有效性。
在瑞士朱拉土壤铅浓度数据应用中,SODK成功识别出多个极端观测点,并与传统方法检测结果形成互补。预测精度对比显示,SODK在100次重复实验中的平均表现持续领先。
报告最后,王占锋老师展望了若干值得探索的方向:相关异常值的联合建模、基于学生-t过程等其他随机过程的扩展,以及多变量输出场景下的异常值检测问题。报告结束后,与会师生就层次似然的计算细节、阈值选择策略以及方法在高维空间中的变量选择等问题与王老师进行了深入讨论。整场报告逻辑清晰、论证严谨,既展现了理论深度,又提供了实用的计算工具,极大拓展了大家在空间统计与异常值检测交叉领域的学术视野。最后,报告在热烈掌声中圆满结束。