KDD 2025前瞻 | 时间序列(Time Series)研究趋势与核心创新点解析

📅 发布时间:2026/7/6 0:21:45 👁️ 浏览次数:
KDD 2025前瞻 | 时间序列(Time Series)研究趋势与核心创新点解析
1. 从KDD 2025二月轮看时间序列研究的“风向”变了没又到了KDD论文放榜的季节。作为数据挖掘领域的顶级会议KDD每年提交的论文都像是一面镜子清晰地映照出当下工业界和学术界最关心什么、在攻克什么难题。今年二月轮放出的35篇时间序列相关论文我花了一整天时间一篇篇看下来最大的感受是热闹依旧但“卷”的方向已经彻底变了。几年前大家还在为Transformer能不能用在时间序列上、怎么用而争论不休现在Transformer几乎成了基线模型。去年扩散模型在CV、NLP领域大杀四方今年这股风就稳稳地吹到了时间序列领域成了最亮眼的“显学”。但如果你以为只是简单地把图像生成那套搬过来那就错了。今年的论文无论是预测、分类还是异常检测都透着一股更务实、更深入的气息——大家不再满足于刷榜而是开始深挖模型“为什么有效”、“在什么情况下会失效”以及“如何让它在真实、混乱的业务数据里也能站稳脚跟”。简单来说研究的重心正在从“模型结构创新”转向“如何更好地理解、利用和适应数据本身”。这背后反映的其实是时间序列分析落地时遇到的那些老难题数据缺失、标注昂贵、概念漂移、可解释性差……今年的论文列表就像一份针对这些痛点的“技术方案集锦”。对于咱们这些在一线搞算法应用的同学来说这比单纯看一个SOTA模型要有价值得多。接下来我就结合这些论文聊聊我看到的几个核心趋势和那些让人眼前一亮的新思路。2. 趋势一生成式AI的“时空入侵”扩散模型成为新引擎如果说去年大语言模型LLM尝试与时间序列“联姻”还带着一丝试探和笨拙那么今年扩散模型Diffusion Models的全面进场则显得更加成熟和有备而来。在KDD 2025的论文里扩散模型已经不再局限于数据补全或生成而是被系统地应用于预测、分类、域适应等多个核心任务展现出强大的建模潜力。2.1 从确定性预测到概率性生成思维范式的转换传统的时间序列预测无论是用LSTM、CNN还是Transformer目标往往是输出一个确定的未来值或序列。但现实世界充满不确定性一个点估计值往往不够。扩散模型天生就是为刻画复杂概率分布而生的这正好击中了要害。比如论文《Stochastic Diffusion: A Diffusion Based Model for Stochastic Time Series Forecasting》就直接瞄准了随机性时间序列预测。我理解它的思路是这样的很多序列比如金融市场波动、服务器负载其未来走势本身就具有内在的随机性。这篇工作不是简单地把扩散模型当“黑盒”用而是设计了一个专门针对时间序列随机过程的去噪扩散过程。它在正向过程中注入噪声来模拟未来的不确定性在反向过程中则学习如何从噪声中重建出合理的未来序列分布。这相当于给了我们一个“预测带”而不仅仅是一条“预测线”对于风险敏感的应用如量化交易、资源容量规划价值巨大。另一篇《TarDiff: Target-Oriented Diffusion Guidance for Synthetic Electronic Health Record Time Series Generation》则展示了扩散模型在数据生成方面的精细控制能力。生成医疗时间序列数据如心电图、生命体征用于模型训练最大的挑战是既要逼真又要满足特定的医学条件例如生成一个“伴有心房颤动的心电图”。TarDiff通过引入目标导向的引导机制让扩散模型在生成过程中能“听指挥”产出符合特定临床目标的数据。这为解决小样本、隐私敏感场景下的数据瓶颈问题提供了一个非常巧妙的思路。2.2 解决老大难问题当扩散模型遇见数据补全与域适应数据缺失和分布偏移是时间序列分析中的两大“顽疾”。今年扩散模型在这两个方向上都给出了新答案。论文《SSD-TS: Exploring the potential of linear state space models for diffusion models in time series imputation》做了一个有趣的结合。它用线性状态空间模型如S4, Mamba来替代扩散模型中常用的U-Net骨干网络。状态空间模型在处理长序列时具有线性复杂度和强大的长期依赖建模能力。SSD-TS等于是把扩散模型的生成能力和状态空间模型的高效序列建模能力强强联合旨在更精准、更高效地补全长序列中的缺失值。我在一些内部长周期传感器数据补全实验中也尝试过类似思路发现对于具有明显周期性和趋势的序列这种结合确实能稳定地提升补全质量。而在域适应问题上《Diffusion-Guided Diversity for Single Domain Generalization in Time Series Classification》面对的是一个更极端的场景单域泛化。也就是说训练数据只来自一个源域但模型需要在多个未知的、不同的目标域上都能工作。这篇论文的核心是利用扩散模型来生成“多样化”的、域外风格的增强数据。它不是在像素级做增强而是在隐空间里通过控制扩散过程生成既保持类别语义又具有域变异性的新样本。这相当于给模型提供了一个“虚拟的跨域训练场”从而提升了其泛化能力。对于设备型号繁多、采集环境各异的工业故障诊断场景这种方法可能特别有用。3. 趋势二大语言模型与时间序列的“双向奔赴”去年“Time-LLM”等工作拉开了大语言模型处理时间序列的序幕但质疑声也不少文本和序列模态差异巨大直接硬套真的好吗今年KDD的论文开始更冷静、更深入地审视这段“关系”既有批判性的分析也有建设性的融合。3.1 冷静审视对齐的鸿沟与效率的挑战论文《Understanding Why Large Language Models Can Be Ineffective in Time Series Analysis: The Impact of Modality Alignment》标题就很直白它系统地分析了LLM在时间序列分析中可能“失灵”的原因。核心观点在于模态对齐的鸿沟。时间序列数据是数值型、连续且具有特定物理意义的而语言模型是在离散的、符号化的文本语料上训练的。直接对时间序列进行分词patchify输入LLM可能会损失其内在的连续性和局部相关性。这篇工作通过大量实验指出不加调整的LLM在处理复杂时间模式时其表现可能不如专门的时序模型。这给我们提了个醒不是加上“LLM”三个字就万事大吉如何设计有效的模态对齐模块比如专门的时间编码器、适配器才是决定成败的关键。另一篇《Unleashing The Power of Pre-Trained Language Models for Irregularly Sampled Time Series》则聚焦于一个更具体的难题不规则采样时间序列。医疗监测、物联网设备的数据常常是异步、非均匀到达的。这篇论文没有粗暴地重采样而是设计了一种方法将不规则的时间间隔信息巧妙地融入LLM的输入嵌入中让预训练好的LLM能够理解这种“时间弹性”。这体现了另一种思路不是让时间序列去完全适应LLM而是改造LLM的输入接口使其能“读懂”时序的独特语境。3.2 建设性融合当LLM成为“解释器”与“增强器”尽管有挑战但LLM在可解释性和知识注入方面的潜力依然诱人。论文《Large Language Models can Deliver Accurate and Interpretable Time Series Anomaly Detection》就展示了这种潜力。它利用LLM的推理能力不仅检测异常点还能生成人类可读的异常原因描述。例如检测到服务器流量突增模型可以输出“该异常可能与北京时间晚8点的促销活动启动有关且同期数据库CPU使用率关联上升”。这种“检测根因推测”的能力在运维、安全等领域简直是刚需。它把LLM当作一个高级的模式识别与语义生成引擎与底层的时间序列特征提取器协同工作这个架构非常实用。此外LLM也被用于数据增强。在分类任务中面对类别不平衡数据论文《Mitigating Data Imbalance in Time Series Classification Based on Counterfactual Minority Samples Augmentation》虽然主要用因果推理生成反事实样本但其思想与LLM的数据生成能力是相通的。未来结合领域知识提示prompt让LLM生成符合特定物理规律或业务逻辑的少数类样本可能会成为一个低成本的数据增强利器。4. 趋势三追求“鲁棒”与“可解释”模型走向实用化深水区当模型精度达到一定瓶颈后工业界更关心的是这模型稳不稳定出了错能不能找到原因能不能适应数据的变化今年的论文在鲁棒性和可解释性上的投入明显加大这标志着时间序列研究正在从实验室走向工程化的深水区。4.1 应对数据缺陷缺失、噪声与分布偏移的“组合拳”真实数据很少是干净和完整的。多篇论文构成了一个应对数据缺陷的“工具箱”。应对任意缺失《Merlin: Multi-View Representation Learning for Robust Multivariate Time Series Forecasting with Unfixed Missing Rates》直接挑战“不固定缺失率”的多元序列预测。它通过多视图学习从观测值、缺失模式、时间戳等多个视角联合学习表征让模型对缺失模式不敏感。这比简单用均值填充或训练一个插值模型要更加根本。联合去噪与预测《CMA: A Unified Contextual Meta-Adaptation Methodology for Time-Series Denoising and Prediction》提出了一个统一的元学习框架。它的聪明之处在于将去噪和预测视为两个相关任务通过元学习让模型快速适应新信号中的噪声模式从而在去噪的同时提升预测性能。这很像一个“自适应滤波器”边滤波边预测特别适合传感器信号处理。无源域适应《Temporal Restoration and Spatial Rewiring for Source-Free Multivariate Time Series Domain Adaptation》解决了一个苛刻的设定只有源域上训练好的模型没有源域数据如何适应目标域它通过“时间恢复”对齐时序动态和“空间重连”调整变量间关系来调整模型保护了数据隐私不需要原始数据实用性很强。4.2 打开模型“黑箱”可解释性成为设计准则可解释性不再只是事后分析的工具而是被融入到模型设计之初。论文《Learning Reliable and Intuitive Temporal Logic Rules for Interpretable Time Series Classification》致力于从数据中学习可解释的时间逻辑规则。例如对于心电图分类它可能学习到规则“如果在前5个时间点内R波峰值超过阈值且随后出现一段平坦线段则可能为A类心律”。这种规则不仅准确而且能被领域专家理解和验证在医疗、金融等高风险领域至关重要。在异常检测方面《Robust and Explainable Detector of Time Series Anomaly via Augmenting Multiclass Pseudo-Anomalies》通过构造多类伪异常样本来训练检测器不仅提高了模型对未知异常类型的鲁棒性而且这些伪异常的模式本身可以作为解释异常类型的依据。模型不仅能说“这里异常了”还能说“它类似于我们构造的哪种异常模式”。5. 趋势四基础架构与学习范式的演进除了上述应用层面的趋势在模型基础架构和学习范式上我们也看到了一些扎实的进步。5.1 架构探索超越Transformer的尝试Transformer的注意力机制虽然强大但其二次复杂度对超长序列不友好。状态空间模型SSM如Mamba因其线性复杂度和长程建模能力成为新的热点。论文《SDE: A Simplified and Disentangled Dependency Encoding Framework for State Space Models in Time Series Forecasting》就是对SSM框架的改进它致力于简化并解耦依赖编码让SSM能更清晰、高效地捕捉时间序列中的短期和长期依赖。这代表了基础序列建模架构的一个多元化探索方向。另一方面《CrossLinear: Plug-and-Play Cross-Correlation Embedding for Time Series Forecasting with Exogenous Variables》则关注一个实际问题如何有效地融入外生变量比如天气预报对销量预测的影响。它提出了一个轻量级的“即插即用”模块通过交叉相关性嵌入来建模目标序列与外生变量间的动态关系可以灵活地嫁接到各种基础预测模型上这种模块化思路对工程落地很友好。5.2 学习范式通用模型与对比学习的深化构建时间序列的“基础模型”一直是大家的梦想。《BLAST: Balanced Sampling Time Series Corpus for Universal Forecasting Models》朝这个方向迈进了一步。它构建了一个平衡采样的时间序列语料库旨在训练通用的预测模型。其关键思想是让模型在训练时就能接触到多样化的序列模式不同长度、频率、噪声水平从而获得更好的泛化能力。这类似于NLP中的预训练但针对时序数据的特点进行了精心设计。对比学习在时间序列表征学习中已经证明有效但如何设计更好的正负样本对是关键。《FreRA: A Frequency-Refined Augmentation for Contrastive Learning on Time Series Classification》提出了频率精炼增强。它不是在时域做简单的裁剪、抖动而是在频域对幅度和相位进行细微的、符合实际的扰动来生成正样本这能引导模型学习到更本质的、与频率特性相关的表征对于振动信号分类等任务提升明显。从KDD 2025这波论文来看时间序列领域的研究正在变得更加成熟、务实和多元化。技术浪潮如扩散模型、LLM带来了新的工具但研究的焦点始终围绕着真实世界的数据挑战不确定性、不完整性、分布变化以及对可信度的要求。对于我们从业者来说与其追逐最炫酷的模型不如深入理解这些趋势背后的根本问题选择最适合自己业务场景的技术组合。毕竟在时间序列的世界里没有“银弹”只有“最合适的解”。