本文标题:基于混合专家架构的大规模时间序列预测模型Time-MoE的研究摘要:本研究提出了一种基于混合专家架构(Mixture-of-Experts,MoE)的时间序列预测模型Time-MoE,该模型以较低的计算成本实现了高精度预测。我们发布了Time-300B数据集,为时序分析提供了丰富的训练资源。Time-MoE模型的成功标志着时...
2024-10-24 11:49:16
MixCon:创新的混合序列建模架构的优势与展望一、引言在自然语言处理、语音识别和时间序列分析等领域中,序列建模是一项至关重要的任务。现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。针对这些问题,北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构——MixCon,该架构为解决这些难题带来了创新性的方案。二、背景在序列建模...
2024-10-16 02:08:09