编者按:日前,我校正式发布首批关键共性技术清单,覆盖绿色技术、数据技术、智能技术三大战略领域,集中展现了我校在关键共性技术研发领域的突破性进展与最新创新成果。现介绍首批关键共性技术之三——基于信息几何与稀疏表征的智能数据处理技术。
在我国深入实施“国家大数据战略”的背景下,江西财经大学研发的基于信息几何与稀疏表征的智能数据处理技术,近日入选学校首批关键共性技术清单。该技术以信息几何与稀疏表征为基础理论,解决了时间序列以及图像数据处理中的关键难题,在算法效率、模型解释性及多模态融合方面取得了部分突破。该技术兼具学术前沿性与工程落地能力,可扩展到金融、医疗、工业等需处理复杂时序与图像数据的场景。
技术研发背景:响应数字中国战略,攻克复杂数据处理瓶颈
响应国家《数字中国建设整体布局规划》及科技部人工智能示范应用场景建设要求,推动AI与经济社会融合,符合《江西省制造业重点产业链现代化建设“1269”行动计划(2023-2026年)》中人工智能的布局需求,促进数据处理方法在新能源、工业制造等领域的应用。
时间序列和图像是工业和科学领域中的两种典型的数据类型,传统方法通常面临三大挑战:(1)数据表征:全局与局部特征交互特性难以捕捉;(2)非线性建模:高维数据复杂关系建模效率低;(3)多模态融合:图像融合中细节丢失、配准敏感、亮度不足。
技术核心内容:数据表征-图像增强-非线性建模
通过耦合信息几何理论与稀疏表征方法,构建“时序→复杂网络”和“图像→稀疏表征”的双路径处理框架。该技术的总体思路如图1所示,具体的技术方案与关键技术如表1所示。
图1 总体思路
表1 科学问题与技术方案
技术创新点:(1)数据高效表征。基于信息几何与稀疏表征方法,实现复杂数据的高效表征;(2)超参数优化。通过自适应核函数设计,降低传统模型超参数优化的复杂度;(3)多模态融合。突破跨模态数据对齐瓶颈,提升数据融合鲁棒性。
技术应用场景:赋能工业制造与金融智能化
(1)工业制造缺陷检测。该技术在工业智能制造以及缺陷检测领域具有较好的应用前景,在高精度、多模态等场景下有一定的应用潜力。例如PCB电路板线路缺陷(短路、断路、虚焊)检测、锂电池内部裂纹检测以及纺织品生产的瑕疵检测等。如下图所示,基于可见光图像的多模态数据,利用机器学习与计算机视觉算法,构建了面向工业精密陶瓷封装表面微裂纹、气孔、形变等缺陷的实时检测算法,缺陷检出率达99.3%。
图2陶瓷封装缺陷检测示意图
(2)金融风险监测。通过将多维度金融时间序列(如市场资产价格、财务报表、宏观经济指标)映射为复杂网络,动态捕捉风险因子的非线性交互与传染路径,结合可解释机器学习方法,实现上市公司财务风险早期预警,为监管机构提供监测工具。
技术研发团队:多学科融合创新团队
本技术由江西财经大学软件与物联网工程学院孙建成教授团队主导研发。团队已主持省部级以上项目30余项,其中国家级项目12项;共发表相关学术论文70余篇,其中包括IEEE Trans等高水平论文30余篇,授权国家发明专利5项;获吴文俊人工智能奖、江西省自然科学奖等奖励。
结语
智能数据处理技术以高维数据结构化表征与跨模态融合为核心突破,在时间序列和图像数据处理方面获得了优异的性能,在工业制造、金融风控等场景中具有较好的应用前景。我校将持续深化该技术在新能源、高端制造、智慧医疗等其他国家战略领域的渗透应用,推动智能算法从实验室走向生产线,以自主创新的技术,助力数字中国建设,为经济社会的高质量发展注入智能引擎。