← 返回总览

计算机科学-预测与学习

2025-08-08 K-means智能聚类结果

聚类 7 • 机器学习算法识别
85 论文总数
85 高分论文
7.8 平均评分
5 关键词数

🔍 聚类关键词特征

预测学习本文提供优化

监督机器学习方法在系外行星大气传输光谱反演中的不确定性量化研究

ArXiv ID: 2508.04982
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Roy T. Forestano, Konstantin T. Matchev, Katia Matcheva, Eyup B. Unlu
📄 中文摘要:
本文针对系外行星大气参数的传输光谱反演问题,系统研究了多种监督机器学习回归技术的性能,并与传统的贝叶斯反演方法进行了比较。传统的贝叶斯方法虽然被广泛应用,但计算成本较高,而在詹姆斯·韦伯空间望远镜(JWST)等新一代观测设备时代,机器学习方法因其高效性和鲁棒性成为可行的替代方案。本研究测试了包括偏最小二乘法(PLS)、支持向量机(SVM)、K近邻(KNN)、决策树(DT)、随机森林(RF)、投票(VOTE)、堆叠(STACK)和极端梯度提升(XGB)在内的多种回归算法,评估了它们在准确性、精密度和速度方面的表现。同时,研究还探讨了训练数据预处理方法对模型性能的影响,并对整个行星参数动态范围内的模型不确定性进行了量化。最终,通过对JWST观测的WASP-39b案例的验证,确定了最佳的机器学习模型与预处理方案组合。研究结果表明,机器学习方法在系外行星大气反演中具有显著的潜力,不仅能够大幅提高计算效率,还能在精度和不确定性量化方面达到与传统方法相当甚至更优的水平。这一研究为未来大规模系外行星观测数据处理提供了重要的技术支持,并为机器学习在天文学中的应用开辟了新的可能性。
系外行星传输光谱机器学习不确定性量化大气反演
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文创新性地将机器学习应用于系外行星研究,具有较大潜在影响。

使用深度学习进行太阳瞬变识别(STRUDL)以处理日球成像仪数据

ArXiv ID: 2506.16194
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Maike Bauer, Justin Le Lou\"edec, Tanja Amerstorfer, Luke Barnard, David Barnes, Helmut Lammer
📄 中文摘要:
本文研究了日冕物质抛射(CMEs),这是一种可能对空间和地面基础设施造成重大干扰的空间天气现象。及时、准确地检测和预测CMEs是制定策略以减少此类事件影响的关键步骤。CMEs通常通过日冕仪和日球成像仪(HIs)进行观测,部分预测方法依赖于手动追踪CMEs在连续图像中的移动,以估算其到达时间和速度。然而,这一过程耗时较长,且结果可能因人而异,存在较大的个体差异。本文提出了一种基于深度学习的太阳瞬变识别方法(STRUDL),旨在自动化处理日球成像仪数据,提高CMEs检测的效率和准确性。研究团队设计并训练了一个深度学习模型,利用大量的日球成像数据进行特征提取和模式识别,以实现对CMEs的快速识别和跟踪。实验结果表明,STRUDL方法在检测精度和速度上显著优于传统的手动方法,特别是在处理大规模数据集时表现出色。此外,该方法能够减少人为误差,提供更一致的预测结果,为空间天气预报提供了重要的技术支持。研究还讨论了该方法的局限性,如对数据质量的依赖以及在极端天气事件中的表现,并提出了未来改进方向,包括结合多源数据和优化模型架构以进一步提升性能。总之,本研究为空间天气监测和预测领域引入了一种创新的自动化工具,具有重要的应用价值和研究意义。
日冕物质抛射深度学习日球成像仪空间天气太阳瞬变识别
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在空间天气预测领域具有重要创新性,可能显著提升CMEs检测效率。

数据驱动的FCC高熵合金成分-性能关系洞察

ArXiv ID: 2508.04841
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Nicolas Flores, Daniel Salas Mula, Wenle Xu, Sahu Bibhu, Daniel Lewis, Alexandra Eve Salinas, Samant
📄 中文摘要:
高熵合金(HEAs)作为一种结构材料,在航空航天、汽车和国防工业等多个领域的技术进步中发挥着关键作用。然而,由于缺乏整合的化学成分、工艺、结构和性能数据,预测性能建模面临重大挑战。鉴于高熵合金设计空间的广阔性,揭示其潜在模式至关重要但难度较大,需要能够从有限且异构数据集中学习的高级方法。本研究通过多种敏感性分析,揭示了元素组成对机械行为的关键贡献,特别是在纳米压痕测试中观察到的脆性和断裂响应的成分因素,基于BIRDSHOT中心的NiCoFeCrVMnCuAl系统数据集进行了深入探讨。研究提出并评估了基于编码器-解码器的化学成分-性能模型,通过贝叶斯多目标超参数优化进行精细调整,用于映射合金成分与六种机械性能的关系。结果表明,该模型在所有性能指标上的表现与传统回归方法相比具有竞争力或更优,尤其是在屈服强度和极限抗拉强度/屈服强度(UTS/YS)比值方面,证明了其在捕捉复杂成分-性能关系方面的有效性。本研究为高熵合金的性能预测提供了新的数据驱动视角,有助于加速材料设计和优化过程,为未来在有限数据条件下的高熵合金研究奠定了基础。
高熵合金成分-性能关系数据驱动机械性能纳米压痕
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 研究创新性强,对高熵合金性能预测有重要影响。

MOFClassifier:一种用于验证计算就绪金属有机框架的机器学习方法

ArXiv ID: 2506.14845
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Guobin Zhao, Pengyu Zhao, Yongchul G. Chung
📄 中文摘要:
金属有机框架(MOFs)等新型晶体材料的计算发现与设计高度依赖于高质量、计算就绪的结构数据。然而,近期研究揭示现有MOF数据库中存在显著的错误率,这一数据问题严重阻碍了高效的高通量计算筛选。尽管已开发出基于规则的算法如MOSAEC、MOFChecker以及Chen-Manz方法来解决这一问题,但这些方法往往受到固有局限性的制约,导致结构误分类。为应对这一挑战,本研究开发了MOFClassifier,一种基于正样本-无标签晶体图卷积神经网络(PU-CGCNN)模型的新型机器学习方法。MOFClassifier通过从完美晶体结构中学习复杂的模式,预测晶体相似度分数(CLscore),从而有效分类MOFs是否为计算就绪状态。模型的ROC值达到0.979(此前最佳为0.912),并且能够识别当前基于规则的方法无法检测到的细微结构和化学错误。通过准确恢复先前被误分类的假阴性结构,MOFClassifier降低了在大规模计算筛选活动中忽略潜在优质材料候选的风险。这一用户友好的工具免费提供,并已集成到更新后的CoRE MOF DB 2025 v1.0的准备工作流程中,为MOF材料的加速计算发现做出了贡献。本研究不仅提升了MOF数据库的质量,还为材料科学中的高通量计算筛选提供了更可靠的工具支持,具有重要的应用价值。
金属有机框架机器学习计算筛选晶体结构数据质量
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在MOF数据质量提升方面具有重要创新,可能显著影响材料计算领域。

InfoQ:通过全局信息流实现的混合精度量化

ArXiv ID: 2508.04753
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Mehmet Emre Akbulut, Hazem Hesham Yousef Shalby, Fabrizio Pittorino, Manuel Roveri
📄 中文摘要:
混合精度量化(MPQ)对于在资源受限设备上部署深度神经网络至关重要,但为每一层找到最佳位宽是一个复杂的组合优化问题。当前最先进的方法依赖于计算成本高昂的搜索算法或局部敏感性启发式代理(如Hessian矩阵),这些方法未能捕捉量化误差在全局范围内的级联效应。本研究提出,层的量化敏感性不应仅通过其局部属性来衡量,而应通过其对整个网络信息流的影响来评估。为此,我们引入了InfoQ,一种在位宽搜索阶段无需训练的新型MPQ框架。InfoQ通过在不同位宽下量化每一层,并通过单次前向传播测量后续层中互信息的改变来评估层敏感性,从而量化每一层量化对网络信息流的影响。基于此得到的敏感性分数,位宽分配被建模为一个整数线性规划问题,可在给定预算(如模型大小或BitOps)下高效求解以最小化总敏感性。InfoQ的无需再训练搜索阶段在搜索时间与准确性之间提供了优越的权衡(相比最先进方法如LIMPQ,使用的数据量减少了两个数量级),同时在高压缩率下(MobileNetV2和ResNet18在ImageNet上的压缩率分别为14X和10.66X)实现了高达1%的准确性提升。本研究为资源受限环境下的深度学习模型部署提供了高效且有效的解决方案。
混合精度量化深度神经网络信息流位宽分配资源受限设备
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究提出创新性方法,对深度学习模型量化领域有较大潜在影响。

不确定性感知的预测-优化框架用于公平的灾后电力恢复

ArXiv ID: 2508.04780
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Lin Jiang, Dahai Yu, Rongchao Xu, Tian Tang, Guang Wang
📄 中文摘要:
随着极端天气事件(如飓风)频率的增加,高效且公平的电力系统恢复变得尤为迫切。许多电力供应商主要依据各地区提交的电力恢复请求量来制定恢复决策。然而,通过数据驱动分析发现,弱势社区往往提交较少的恢复请求,这种差异导致当前的恢复方案不公平,使得这些社区更容易遭受长期停电的影响。为解决这一问题,本研究提出了一种注重公平的电力恢复策略,旨在平衡恢复效率与社区间的公平性。然而,实现这一目标面临两大挑战:一是由于数据集异质性,预测修复时长存在困难;二是强化学习代理倾向于选择低不确定性的行动,这可能损害公平性。为应对这些挑战,本文设计了一个名为EPOPR的预测-优化框架,包含两个关键组件:(1)基于公平校准的quantile回归方法,用于不确定性感知的修复时长预测;(2)时空注意力强化学习(Spatial-Temporal Attentional RL),能够适应不同地区的不确定性水平,从而实现公平的决策制定。实验结果表明,与最先进的基线方法相比,EPOPR有效缩短了平均停电时长3.60%,并将不同社区间的不公平性降低了14.19%。研究表明,该框架在提升电力恢复效率的同时,显著改善了恢复过程中的公平性,为灾后电力系统的管理提供了重要的技术支持。
电力恢复公平性不确定性预测强化学习预测-优化
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在电力恢复领域提出重要创新,兼顾效率与公平,具有较大应用潜力。

长周期事件预测的统一流匹配方法

ArXiv ID: 2508.04843
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Xiao Shou
📄 中文摘要:
在医疗、金融和用户行为建模等现实世界应用中,建模长周期标记事件序列是一项基本挑战。传统的神经时间点过程模型通常采用自回归方式,逐一预测下一个事件,这种方法在长距离预测中效率较低且容易导致误差累积。本研究提出了一种用于标记时间点过程的统一流匹配框架,通过连续和离散流匹配实现非自回归的联合建模,涵盖事件间隔时间和事件类型。通过学习两种成分的连续时间流,我们的方法能够在不依赖顺序解码的情况下生成一致的长周期事件轨迹。我们在六个真实世界基准数据集上评估了该模型,结果显示在准确性和生成效率方面均显著优于自回归和基于扩散的基线方法。研究表明,该框架能够有效捕捉事件序列的复杂动态特性,为长周期预测提供了新的解决方案。此外,该方法在计算效率上的提升也使其更适用于大规模数据集和实时应用场景。总之,本文提出的统一流匹配框架为时间点过程建模提供了一种创新且高效的工具,可能对相关领域的研究和应用产生深远影响。
长周期预测流匹配时间点过程非自回归建模事件序列
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究提出创新框架,显著提升长周期预测效率和准确性,具有较大影响力。

LuKAN:基于Kolmogorov-Arnold网络的三维人体运动预测框架

ArXiv ID: 2508.04847
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Md Zahidul Hasan, A. Ben Hamza, Nizar Bouguila
📄 中文摘要:
三维人体运动预测的目标是基于历史运动数据预测人体未来的三维姿态。现有方法在预测精度和计算效率之间往往难以取得平衡。本文提出了一种基于Kolmogorov-Arnold网络(KANs)的高效模型LuKAN,采用Lucas多项式激活函数以提升性能。该模型首先通过离散小波变换对输入运动序列进行时序信息编码,随后利用空间投影层捕捉关节间的依赖关系,确保人体结构的连贯性。LuKAN的核心是时序依赖学习器,该模块采用由Lucas多项式参数化的KAN层进行高效函数逼近。Lucas多项式不仅提供了计算效率,还增强了处理振荡行为的能力。最后,通过逆离散小波变换在时域重建运动序列,生成时间上连贯的预测结果。在三个基准数据集上的大量实验表明,LuKAN在定量和定性评估中均表现出与强大基线模型相竞争的性能。此外,其紧凑的架构结合Lucas多项式的线性递推特性,确保了计算效率的高效性。研究结果表明,LuKAN在三维人体运动预测任务中实现了精度与效率的良好平衡,为相关领域提供了新的技术视角和应用潜力。
三维人体运动预测Kolmogorov-Arnold网络Lucas多项式时序依赖学习离散小波变换
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: LuKAN在精度与效率上取得突破,可能对人体运动预测领域产生较大影响。

可证明的后训练量化:OPTQ和Qronos的理论分析

ArXiv ID: 2508.04853
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Haoyu Zhang, Shihao Zhang, Ian Colbert, Rayan Saab
📄 中文摘要:
后训练量化(PTQ)已成为降低现代深度神经网络(包括大型语言模型,LLMs)内存和计算成本的重要工具。在众多PTQ算法中,OPTQ框架(也称为GPTQ)因其计算效率高和强大的经验性能而成为领先方法。然而,尽管OPTQ被广泛采用,其缺乏严格的定量理论保证。本文首次为OPTQ的确定性和随机性变体以及近期相关的最先进的PTQ算法Qronos提供了定量误差界。我们分析了OPTQ的迭代过程如何引入量化误差,并推导了非渐近的2-范数误差界,这些误差界明确依赖于校准数据和OPTQ使用的正则化参数。我们的分析为多个实际设计选择提供了理论依据,包括广泛使用的按范数递减排序特征的启发式方法,以及选择正则化参数的指导原则。对于随机变体,我们建立了更强的无穷范数误差界,这有助于控制所需的量化字母表,并对下游层和非线性特别有用。最后,我们将分析扩展到Qronos,为其确定性和随机性变体提供了新的理论界限,有助于解释其经验优势。本研究不仅填补了OPTQ理论分析的空白,还为PTQ算法的设计和优化提供了重要的理论支持,为未来在深度学习模型压缩领域的研究奠定了基础。
后训练量化OPTQQronos误差界深度神经网络
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文为PTQ算法提供了重要理论支持,具有较大潜在影响。

PriceFM:概率电价预测的基础模型

ArXiv ID: 2508.04875
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Runyao Yu, Chenhui Gu, Jochen Stiasny, Qingsong Wen, Wasim Sarwar Dilov, Lianlian Qi, Jochen L. Crem
📄 中文摘要:
本文针对欧洲电价预测的独特挑战,提出了一种创新的解决方案。欧洲电力市场日益一体化且物理互联,传统的预测方法难以捕捉其复杂的空间相互依赖性和不确定性。作者首先构建了一个全面且最新的数据集,涵盖24个欧洲国家(38个地区),时间跨度为2022年1月1日至2025年1月1日。在此基础上,提出了PriceFM,一个时空基础模型,通过引入基于图的归纳偏差来捕捉互联电力市场中的空间相互依赖性。该模型专为多区域、多时间步长和多分位数的概率电价预测设计,充分考虑了电力市场的空间上下文。广泛的实验和消融研究验证了模型的有效性,PriceFM在性能上持续优于竞争基准模型,突显了空间上下文在电力市场预测中的重要性。研究结果表明,PriceFM在处理复杂的电力市场动态方面具有显著优势,为未来的电价预测研究提供了重要的数据和方法支持。数据集和代码已公开,供学术界和工业界进一步研究和应用。
电价预测基础模型时空建模概率预测欧洲电力市场
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在电价预测领域具有重要创新,可能对能源系统优化产生较大影响。

使用深度学习进行地表臭氧模拟器的不确定性量化

ArXiv ID: 2508.04885
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Kelsey Doerksen, Yuliya Marchetti, Steven Lu, Kevin Bowman, James Montgomery, Kazuyuki Miyazaki, Yar
📄 中文摘要:
空气污染是全球性危害,截至2023年,全球94%的人口暴露于不安全的污染水平之下。地表臭氧(O3)作为一种重要污染物,其趋势及其驱动因素难以建模,传统的基于物理的模型在与人类健康影响相关的尺度上实用性不足。基于深度学习的模拟器在捕捉复杂气候模式方面显示出潜力,但总体上缺乏支持政策变化和公共卫生措施关键决策所需的解释性。本研究实现了一种具有不确定性感知的U-Net架构,通过贝叶斯和分位数回归方法预测多模型多成分化学数据同化(MOMO-Chem)模型的地表臭氧残差(偏差)。研究展示了该技术在2019年6月北美和欧洲区域偏差估计中的能力,强调了两种不确定性量化(UQ)方法之间的UQ分数差异,并辨别出哪些地面站是MOMO-Chem偏差校正的最佳和次佳候选站。此外,研究还评估了土地使用信息在地表臭氧残差建模中的影响。研究结果表明,不确定性量化能够有效提升模型的可靠性和决策支持能力,为空气污染控制和公共健康政策提供了重要参考。通过结合深度学习与不确定性分析,本研究为复杂环境问题的建模提供了新的视角和方法。
地表臭氧深度学习不确定性量化空气污染U-Net架构
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 研究创新性地结合深度学习与不确定性量化,对环境政策有重要影响。

利用深度学习改进全球空气质量估算的物理模型偏差

ArXiv ID: 2508.04886
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Kelsey Doerksen, Yuliya Marchetti, Kevin Bowman, Steven Lu, James Montgomery, Yarin Gal, Freddie Kal
📄 中文摘要:
空气污染是全球范围内对人类疾病和过早死亡的最大环境风险因素,2019年导致超过600万例过早死亡。当前,建模表面臭氧这一重要空气污染物仍面临挑战,尤其是在与人类健康影响相关的尺度上,全球臭氧趋势的驱动因素在这些尺度上尚不明确,限制了基于物理模型的实际应用。本研究采用基于二维卷积神经网络(2D CNN)的架构,估算MOMO-Chem模型的表面臭氧残差,即模型偏差。研究在北美和欧洲展示了该技术的潜力,证明其在捕捉物理模型残差方面优于传统机器学习方法。此外,本研究评估了整合高分辨率卫星影像中的土地使用信息对改进模型估算的影响。研究结果表明,该方法能够更好地捕捉城市尺度上影响臭氧偏差的因素,从而加深对相关科学问题的理解。重要的是,本研究讨论了如何利用这些结果改进环境政策制定,为更有效的空气质量管理提供科学依据。通过深度学习技术,本研究不仅提升了物理模型的精度,还为揭示臭氧变化的驱动机制提供了新视角,具有重要的应用价值和政策指导意义。
深度学习空气质量表面臭氧模型偏差环境政策
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 研究创新性强,对空气质量建模和政策制定有重要影响。

检索增强的大沼泽地水位预测

ArXiv ID: 2508.04888
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Rahuul Rangaraj, Jimeng Shi, Rajendra Paudel, Giri Narasimhan, Yanzhao Wu
📄 中文摘要:
准确的水位预测对于管理大沼泽地等生态系统至关重要,大沼泽地作为一个亚热带湿地,在防洪、干旱管理、水资源规划和生物多样性保护中发挥着重要作用。尽管深度学习尤其是时间序列基础模型在通用领域预测中取得了成功,但其在水文学中的应用仍未被充分探索。此外,由于缺乏有效的适应机制,这些模型往往难以在不同的未见数据集和领域中泛化。为了解决这一问题,本研究首次将检索增强预测(RAF)引入水文学领域,提出了一种通过检索历史上相似的多变量水文事件来丰富模型输入的框架。RAF通过维护一个外部的历史观测档案,识别并整合历史数据中的相关模式,从而在无需针对特定任务重新训练或微调模型的情况下增强上下文感知能力和预测精度。本研究进一步探索并比较了基于相似性和基于互信息的RAF方法。通过对大沼泽地真实数据的全面评估,证明了RAF框架在水位预测精度上的显著改进。本研究突显了RAF方法在环境水文学中的潜力,为领域专家在生态系统管理中更广泛地采用自适应人工智能方法铺平了道路。相关代码和数据已公开于GitHub。
水位预测检索增强预测大沼泽地水文学深度学习
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在水文学中引入创新方法,具有较大应用潜力。

自误差调整:集成学习中个体性能与多样性平衡的理论与实践

ArXiv ID: 2508.04948
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Rui Zou
📄 中文摘要:
集成学习通过聚合多个基础学习器的预测结果来提升整体性能,其核心挑战在于平衡个体学习器的准确性与多样性。传统方法如Bagging和Boosting通过引入随机性来促进多样性,但对准确性与多样性之间的权衡缺乏精确控制。负相关学习(NCL)通过引入惩罚项来管理这一权衡,但其理论界限较松散且调整范围有限。为解决这些问题,本文提出了一种新的框架——自误差调整(SEA)。SEA将集成误差分解为两个独立部分:个体性能项,表示每个基础学习器的自误差;以及多样性项,反映学习器之间的交互作用。通过在损失函数中引入可调参数,SEA能够精确控制每个部分的贡献,从而实现对集成性能的精细调节。与NCL及其变体相比,SEA提供了更广泛的有效调整范围和更一致的多样性变化。此外,本文为可调集成方法建立了更严格的理论界限,并通过实验验证了其有效性。在多个公开回归和分类数据集上的实验结果表明,SEA在所有任务中均优于基线方法。消融研究进一步证实,SEA在微调策略中展现出更灵活的调整能力和卓越的性能。SEA框架不仅在理论上提供了更深入的见解,还在实践中为集成学习的设计和优化提供了新的工具和思路。研究结论表明,通过精确控制个体性能与多样性的平衡,集成学习系统可以实现更高的预测精度和稳定性,为未来的研究和应用奠定了坚实基础。
集成学习自误差调整个体性能多样性机器学习
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究提出创新框架,具有较大潜力影响集成学习领域发展。

Tesserae:深度学习工作负载的可扩展放置策略

ArXiv ID: 2508.04953
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Song Bian, Saurabh Agarwal, Md. Tareq Mahmood, Shivaram Venkataraman
📄 中文摘要:
本文研究了数据中心中深度学习(DL)模型训练作为主要工作负载的资源利用率优化问题,提出了一种新型GPU集群调度器Tesserae,重点解决调度器中放置策略的设计问题。传统的放置策略要么是基于临时启发式方法,要么作为复杂优化问题的约束条件,导致性能次优或扩展性差。作者的关键洞见在于,许多放置约束可以形式化为图匹配问题,并基于此设计了新的放置策略,以最小化作业迁移开销和优化作业打包。Tesserae将这些策略集成到一个可扩展且高效的GPU集群调度框架中,通过实验验证了其性能优势。实验结果表明,与现有调度器相比,Tesserae在平均作业完成时间(JCT)上提升了高达1.62倍,在总完成时间(Makespan)上提升了高达1.15倍。这些改进表明Tesserae在处理大规模深度学习工作负载时具有显著的效率优势。作者还讨论了Tesserae的设计如何在保持高性能的同时实现良好的可扩展性,为数据中心深度学习集群调度提供了新的思路和实践参考。本研究不仅在理论上创新性地将图匹配问题应用于调度策略设计,还在实际应用中展示了其对资源利用率和作业执行效率的显著提升,为未来深度学习集群调度器的开发奠定了重要基础。
深度学习集群调度放置策略图匹配资源利用率
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文提出创新性放置策略,对深度学习集群调度有较大影响。

基于机器学习的软件变更依赖预测方法:来自OpenStack实证研究的见解

ArXiv ID: 2508.05034
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Arabat, Ali, Sayagh, Mohammed, Hassine, Jameleddine
📄 中文摘要:
随着软件系统复杂性的增加,准确识别和管理变更之间的依赖关系变得至关重要。依赖关系的存在使得持续集成/持续部署(CI/CD)管道能够有效构建和协调变更,从而避免构建失败和功能部署不完整。在现代软件系统中,依赖关系往往跨越多个组件和团队,给开发和部署带来挑战。本研究以大规模软件系统OpenStack为对象,进行了依赖管理方面的初步研究。研究发现,在过去10年中,OpenStack中大量软件变更存在相互依赖。令人惊讶的是,51.08%的依赖关系是在代码审查阶段(中位延迟5.06小时)才被识别,而非在变更创建时。开发者通常需要花费中位数为57.12小时的时间来识别依赖关系,并在中位数为463个其他变更中进行搜索。为帮助开发者主动识别依赖关系,本文提出了一种半自动化方法,利用两个机器学习模型。第一个模型预测变更之间存在依赖关系的可能性,第二个模型则识别具体的依赖变更对。所提出的模型表现出色,平均AUC分数分别为79.33%和91.89%,Brier分数分别为0.11和0.014。特别是第二个模型在各类变更对中的top-k召回率表现良好,但top-k精确率仍有改进空间。本研究为软件开发中的依赖管理提供了新的视角和工具,有助于提高开发效率和部署质量。
软件变更依赖预测机器学习OpenStack持续集成
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在软件依赖管理领域具有重要创新,可能显著提升开发效率。

超越适应性调整:为视障学生系统性重新设计计算机科学入门课程

ArXiv ID: 2508.05056
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Vaanee Tripathi, Aalok Thakkar
📄 中文摘要:
计算机科学教育近年来取得了长足发展,但系统性障碍仍然阻碍视障学生充分参与学习。尽管已有研究开发了专门的编程工具和辅助技术,但这些解决方案往往是零散的,且需要复杂的技术基础设施,限制了其在课堂中的实际应用。当前的方法多将无障碍性视为个体化的适应性调整,而非课程设计的内在组成部分,导致整体教育支持存在不足。本文提出了一种全面的框架,旨在重新设计计算机科学入门课程,为视障学生提供公平的学习体验,且无需依赖专门的技术基础设施。该框架包括五个关键组成部分:可访问的学习资源(包括预先分发的材料和触觉图表)、课堂学习工具包(提供动手演示)、结构化的支持系统(配备专门的教学辅助)、在线工具库以及课堂参与的心理社会支持。与现有的以工具为中心的解决方案不同,该框架同时关注包容性教育的技术和教学维度,并强调在标准大学环境中的实际实施。其设计基于通用设计原则,并通过与无障碍专家和残疾服务专业人员的咨询得到验证,为未来的学习成果和学生参与度的实证评估奠定了基础,同时也为更广泛的机构采纳提供了模板。本研究不仅填补了视障学生在计算机科学教育中的支持空白,还为构建更具包容性的教育环境提供了可操作的指导方针。
视障学生计算机科学教育无障碍设计通用设计包容性教育
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究提出创新框架,解决视障学生教育问题,具有较大影响力。

从遗忘中学习:通过遗忘回溯预测知识溢出权重

ArXiv ID: 2508.05059
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Jinhyeok Jang, Jaehong Kim, Jung Uk Kim
📄 中文摘要:
预训练权重已成为现代深度学习的重要基石,能够有效实现知识迁移并提升下游任务性能,尤其是在数据稀缺场景中。然而,一个基本问题仍未解决:如何获取包含更多超出给定数据集知识的更好预训练权重?本文提出了一种新颖的策略——知识溢出权重(KNOW)预测,通过利用结构化遗忘及其逆过程来合成富含知识的权重。研究的核心洞察在于,逐步缩减数据集上的顺序微调会引发结构化遗忘过程,而这一过程可以被建模并逆向恢复,仿佛在更大数据集上训练过一样。我们构建了一个由受控遗忘驱动的权重转换数据集,并采用元学习方法有效建模权重预测。具体而言,我们的知识溢出权重预测器(KNOWN)作为一个超模型,学习权重的通用演化规律,并预测具有更好泛化能力的增强权重。在多种数据集和架构上的广泛实验表明,KNOW预测始终优于朴素微调和简单的权重预测方法,在下游任务中表现出更优的性能。本研究为重新解读遗忘动态提供了一个新视角,推动了深度学习中知识迁移的极限。研究不仅揭示了遗忘过程的潜在价值,还为预训练模型的优化提供了创新思路,可能对未来的模型设计和知识迁移研究产生深远影响。
预训练权重知识溢出结构化遗忘元学习深度学习
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 论文提出创新的遗忘回溯方法,对知识迁移有重要影响。

集成影响:基于基线的数据归因

ArXiv ID: 2508.05089
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Linxiao Yang, Xinyu Gu, Liang Sun
📄 中文摘要:
数据归因作为一种量化训练样本对测试样本影响的有效方法,对于理解数据和模型、提升机器学习模型的透明度至关重要。然而,现有的基于留一法(leave-one-out, LOO)的数据归因方法存在局限性,主要表现为局部解释的不足。这些方法仅对单个训练样本进行扰动,忽略了训练集中样本的集体影响。此外,许多数据归因方法缺乏基线设置,导致解释的灵活性不足,例如无法提供反事实解释。本文提出了一种新的数据归因方法——集成影响(Integrated Influence),该方法引入了基线概念。集成影响方法首先定义一个基线数据集,通过数据退化过程将当前数据集逐步过渡到基线数据集,并在此过程中累积每个样本的影响力。本文为该方法提供了坚实的理论框架,并进一步证明了流行的方法(如影响函数)可以视为该方法的特例。实验结果表明,与现有方法相比,集成影响在数据归因任务和错误标注样本识别任务中均表现出更高的可靠性。研究表明,该方法能够更准确地捕捉训练样本对模型输出的影响,为模型解释和数据质量评估提供了新的视角。此外,集成影响方法通过引入基线,不仅增强了解释的灵活性,还为反事实分析提供了可能。这一方法在提升机器学习模型可解释性和透明度方面具有重要意义。
数据归因集成影响基线方法机器学习透明度模型解释
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究提出创新性数据归因方法,具有较大潜在影响力和应用价值。

SparseEMG:用于手势感知的稀疏EMG布局的计算设计

ArXiv ID: 2508.05098
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Anand Kumar, Antony Albert Raj Irudayaraj, Ishita Chandra, Adwait Sharma, Aditya Shekhar Nittala
📄 中文摘要:
本研究聚焦于通过肌电图(EMG)进行手势识别的复杂问题,探讨了手势集、电极数量与位置以及机器学习参数(如特征、分类器)对识别精度的影响。现有工具主要关注模型开发的优化,但忽视了电极选择对分类精度的关键作用。本文首次通过数据驱动分析,系统评估了电极选择和分类器选择对精度和稀疏性的影响。研究对28种组合(4种选择方案、7种分类器)在六个数据集上进行了测试,发现使用排列重要性(Permutation Importance)选择方案结合随机森林(Random Forest)分类器可以在不牺牲精度的前提下将电极数量减少53.5%。基于此结果,作者提出了SparseEMG,一款设计工具,能够根据用户选择的手势集、电极限制和机器学习参数生成稀疏电极布局,并预测分类性能。SparseEMG支持超过50种独特手势,并在三种不同硬件设置的现实应用中得到验证。多数据集评估结果表明,SparseEMG生成的布局在不同用户间具有良好的可转移性,手势识别性能仅存在微小差异。本研究为EMG手势识别系统的设计提供了重要参考,特别是在减少硬件成本和提升实用性方面具有显著价值。
肌电图手势识别稀疏布局机器学习人机交互
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在EMG手势识别领域具有重要创新,可能显著影响硬件设计和应用推广。

PSEO:通过超参数调优优化后验堆叠集成

ArXiv ID: 2508.05144
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Beicheng Xu, Wei Liu, Keyao Ding, Yupeng Lu, Bin Cui
📄 中文摘要:
在自动化机器学习(AutoML)领域,组合算法选择与超参数优化(CASH)问题是一个核心挑战。受到集成学习成功的启发,近年来的AutoML系统倾向于构建后验集成模型来进行最终预测,而非依赖单一最优模型。然而,大多数CASH方法在寻找最优单一模型时进行了广泛搜索,但在集成阶段往往采用固定策略,未能根据具体任务特性进行适应性调整。为解决这一问题,本文提出了PSEO(Post-hoc Stacking Ensemble Optimization),一个用于后验堆叠集成优化的框架。首先,通过二元二次规划进行基础模型选择,在多样性和性能之间寻求平衡。其次,引入两种机制以充分发挥多层堆叠的潜力。最后,PSEO构建了一个超参数空间,并在其中搜索最优的后验集成策略。实验结果基于80个公开数据集进行评估,表明PSEO在16种方法中取得了最佳平均测试排名(2.96),优于近期AutoML系统中的后验设计以及最先进的集成学习方法。研究表明,PSEO通过对后验集成策略的动态优化,显著提升了预测性能,为AutoML领域提供了一种创新且高效的解决方案。其方法论不仅适用于当前数据集,还展现出对不同任务的广泛适应性,为未来的集成学习研究奠定了重要基础。
自动化机器学习后验集成超参数优化堆叠集成算法选择
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: PSEO在AutoML领域提出重要创新,优化后验集成策略,具有较大影响力。

基于图的事件日志修复

ArXiv ID: 2508.05145
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Sebastiano Dissegna, Chiara Di Francescomarino, Massimiliano Ronzani
📄 中文摘要:
事件日志的质量在过程挖掘分析中至关重要。然而,在现实世界中,事件日志数据的获取往往面临挑战,例如由于手动活动及其相关记录的执行,或在收集每个事件的全部属性时出现问题,导致日志中存在缺失信息。传统的事件日志或轨迹重建方法通常依赖于已有的过程模型,通过不同的推理技术填补缺失值,或者采用机器学习/深度学习模型,通过从相似案例中学习来恢复缺失值。近年来,一种新型的深度学习模型——图神经网络(Graph Neural Networks, GNN)——逐渐兴起,能够处理以图结构编码的输入数据。特别是异构图神经网络(Heterogeneous Graph Neural Networks),在处理过程挖掘中的执行轨迹等复杂多模态序列时,提供了更自然的表示方式,允许更具表达力和语义丰富的编码方式。本研究提出了一种基于图神经网络的事件日志修复方法,通过将事件日志表示为图结构,利用图神经网络的强大能力来预测和填补缺失信息。研究结果表明,该方法在处理复杂事件序列时表现出色,尤其是在多模态数据环境中,相较于传统方法具有更高的准确性和适应性。作者还探讨了该方法在实际应用中的潜力,特别是在需要处理不完整日志的工业场景中。结论指出,基于图的表示和图神经网络为过程挖掘中的数据修复问题提供了一种创新且有效的解决方案,未来可进一步扩展到其他相关领域。
事件日志图神经网络过程挖掘数据修复深度学习
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究提出创新方法,具有较大潜力影响过程挖掘领域。

为最坏情况做准备:资源充足性评估中的长期和短期极端天气

ArXiv ID: 2508.05163
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Aleksander Grochowicz, Hannah C. Bloomfield, Marta Victoria
📄 中文摘要:
本文研究了在净零电力系统中整合可再生能源时,供应安全性的关键问题,特别是在极端天气对电力供需双重影响下的系统压力。研究以欧洲为案例,分析了极端天气事件如何在大陆范围内传播并影响电力系统。作者采用基于影子价格的方法,识别出系统压力高峰期,称之为“系统定义事件”,并对其对电力系统的影响进行了详细分析。通过对不同类型的系统定义事件进行分类,研究揭示了电力系统运行和规划中的挑战。研究发现,足够的备用(电力)容量对于系统韧性至关重要,但由于天气变异性,这些备用容量的财务可持续性存在风险。此外,文章区分了短期和长期韧性挑战,提出了不同的指标和压力测试方法,以便将两者纳入未来的能源建模评估中。研究方法和在开源模型PyPSA-Eur中的实现具有普适性,可应用于其他电力系统,为研究人员和政策制定者构建更具韧性和充足性的能源系统提供了重要参考。本文不仅关注技术层面的解决方案,还强调了极端天气对能源系统规划的深远影响,提出了一种综合性的评估框架,为应对气候变化背景下的能源安全问题提供了新思路。
极端天气电力系统可再生能源系统韧性资源充足性
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文提出创新方法评估极端天气对电力系统影响,具有较大应用潜力。

最优算法推断的近最优方法

ArXiv ID: 2508.05173
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Amichai Painsky
📄 中文摘要:
本文研究了在多个竞争性机器学习算法中识别最佳算法的问题,目标是确定在未来未见数据集上最有可能排名最高的算法。研究背景源于算法性能在基准数据集上的表现差异往往微小,传统的选择方法可能不足以准确识别最优算法。为此,作者将问题形式化为多项分布的子集选择问题,即从可数字母表中抽取样本,目标是以高置信度识别包含人口中最频繁符号的最小子集。作者提出了一种新颖的子集选择框架,提供了渐近和有限样本方案,显著改进了现有方法。具体方法包括设计高效的统计推断技术,以较小的样本量实现高置信度的选择,同时通过理论分析和实验验证了方法的有效性。关键发现表明,提出的方案在性能上优于现有方法,并且作者还给出了匹配的下界,证明了所提方案的优越性。结论指出,该框架不仅在理论上具有重要意义,还在实际应用中为选择最佳机器学习算法提供了实用工具,尤其适用于性能差异较小的场景。未来的研究方向可能包括将该方法扩展到更复杂的算法比较场景或动态数据集环境。
机器学习算法选择子集选择多项分布统计推断
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文提出创新框架,对算法选择问题有重要贡献,可能影响相关领域研究。

高级混合Transformer LSTM技术结合注意力机制和TS Mixer用于钻井穿透率预测

ArXiv ID: 2508.05210
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Saddam Hussain Khan (Artificial Intelligence Lab, Department of Computer Systems Engineering, Univer
📄 中文摘要:
钻井穿透率(ROP)对于优化钻井作业至关重要,但由于钻井数据的复杂性、动态性和高维特性,准确预测ROP面临挑战。传统的经验模型、基于物理的模型以及基础机器学习模型往往无法捕捉复杂的时间和上下文关系,导致预测结果不佳且实时应用受限。为解决这一问题,本研究提出了一种新颖的混合深度学习架构,将长短期记忆网络(LSTM)、Transformer编码器、时间序列混合器(TS-Mixer)模块以及注意力机制相结合,协同建模时间依赖性、静态特征交互、全局上下文和动态特征重要性。在真实钻井数据集上的评估表明,该模型在性能上显著优于基准模型(独立LSTM、TS-Mixer及简单混合模型),其R平方得分为0.9988,平均绝对百分比误差(MAPE)为1.447%,通过标准回归指标(R平方、MAE、RMSE、MAPE)进行衡量。模型的可解释性通过SHAP和LIME方法得到保障,同时通过实际与预测曲线的对比及偏差检查,确认了模型在不同场景下的准确性和公平性。这一高级混合方法实现了可靠的实时ROP预测,为构建智能、成本效益高的钻井优化系统铺平了道路,具有显著的操作影响和应用潜力。
钻井穿透率深度学习TransformerLSTM时间序列预测
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究提出创新混合模型,显著提升预测精度,对钻井优化有重要影响。

计算机科学教育全解析:一项超过18,000名参与者的调查公开结果

ArXiv ID: 2508.05286
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Katsiaryna Dzialets, Aleksandra Makeeva, Ilya Vlasov, Anna Potriasaeva, Aleksei Rostovskii, Yaroslav
📄 中文摘要:
计算机科学教育是一个充满活力的领域,涉及众多影响学习者路径的因素。尽管这些因素通常被单独深入研究,但开展覆盖多个主题的大规模研究也至关重要,因为这有助于将不同结果置于相互关联的视角中。过去的大规模调查提供了宝贵的见解,然而,新的趋势(如人工智能)、新的学习形式(如集成开发环境内学习)以及学习者多样性的增加,凸显了对更新、更全面研究的需求。为此,我们开展了一项涉及来自173个国家的18,032名学习者的调查,确保了多样化的代表性,并探索了广泛的主题,包括正规教育、学习形式、人工智能使用、学习挑战、动机等。本文介绍了此次调查的结果,并将其作为开放数据集发布,同时描述了我们的方法论和调查问题。作为激励性示例,本文还突出了数据中三个可能的研究方向:学习中的挑战、新兴学习形式以及集成开发环境内学习形式的洞察。该数据集旨在支持进一步研究,推动计算机教育领域的进步。调查结果显示,学习者在面对技术复杂性和时间管理时普遍遇到挑战;新兴学习形式如在线课程和AI辅助学习正在迅速普及;此外,集成开发环境内学习被认为是提高实践技能的有效方式,但其普及仍受限于技术和资源 доступность。研究还揭示了学习动机与文化背景和教育水平之间的关联,为个性化教育策略提供了数据支持。总之,本研究为理解当前计算机科学教育的现状和未来发展方向提供了重要参考。
计算机科学教育学习挑战人工智能学习形式开放数据集
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究具有重要创新性,为计算机教育领域提供了宝贵数据和研究方向。

FlowState:采样率无关的时间序列预测

ArXiv ID: 2508.05287
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Lars Graf, Thomas Ortner, Stanis{\l}aw Wo\'zniak, Angeliki Pantazi
📄 中文摘要:
基础模型(Foundation Models, FMs)已在自然语言处理领域取得了巨大成功,但其在时间序列预测中的应用尚未达到类似的效果。现有的时间序列基础模型(TSFMs)多基于Transformer变体,面临着在不同上下文和目标长度上的泛化能力不足、无法适应不同采样率以及计算效率低下的问题。本文提出了一种全新的时间序列基础模型架构FlowState,通过两个关键创新解决了上述挑战:基于状态空间模型(SSM)的编码器和函数基解码器。这种设计支持连续时间建模和动态时间尺度调整,使FlowState能够天然地泛化到所有可能的时间分辨率,并动态调整预测范围。与其他最先进的时间序列基础模型不同,后者需要跨所有可能采样率的训练数据来记忆每个尺度的模式,而FlowState通过内部动态适应输入尺度,实现了更小的模型规模、更低的数据需求和更高的效率。此外,本文还提出了一种高效的预训练策略,进一步提升了模型的鲁棒性和训练速度。尽管FlowState是规模最小的模型,但其性能超越了所有其他模型,在GIFT-ZS和Chronos-ZS基准测试中达到了最先进的水平。消融研究证实了其各组件的有效性,同时展示了其在线适应不同输入采样率的独特能力。FlowState的创新设计和优越性能表明其在时间序列预测领域具有重要的应用潜力,可能为未来的研究和应用提供新的方向。
时间序列预测基础模型状态空间模型采样率无关动态调整
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: FlowState在时间序列预测领域展现重要创新,性能优越,具有较大影响力。

基于可解释机器学习框架的葡萄牙地铁运营商数据流的铁路预测性维护

ArXiv ID: 2508.05388
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Silvia Garc\'ia-M\'endez, Francisco de Arriba-P\'erez, F\'atima Leal, Bruno Velo
📄 中文摘要:
本文提出了一种面向智能交通系统的实时数据驱动预测性维护解决方案,贡献于铁路预测性维护领域的研究。研究方法实现了一个包含样本预处理、增量分类(基于机器学习模型)以及结果解释的处理流程。这一新颖的在线处理流程有两个主要亮点:一是专用的样本预处理模块,能够实时构建统计和频率相关特征;二是可解释性模块,首次实现了在线故障预测的自然语言和可视化解释。实验基于葡萄牙波尔图地铁运营商提供的MetroPT数据集进行,结果显示F值超过98%,准确率达到99%。在铁路预测性维护的背景下,这些高指标至关重要,因为准确的故障预测对实际运营具有深远影响。高F值确保系统在检测尽可能多的真实故障和减少误报之间保持最佳平衡,从而最大化服务可用性;而高准确率则提升了可靠性,直接有助于降低成本和提高安全性。分析表明,即使在类别不平衡和噪声存在的情况下,该流程仍能保持高性能,其解释模块有效反映了决策过程。这些发现验证了该方法的科学合理性,并确认了其在支持现实世界铁路运营中主动维护决策的实用性。通过识别故障的早期迹象,该流程使决策者能够快速理解潜在问题并采取相应行动,为铁路系统的安全和效率提供了重要支持。
预测性维护机器学习可解释性智能交通系统铁路运营
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在铁路维护领域具有重要创新性,可能显著提升运营效率和安全性。

回声状态网络用于比特币时间序列预测

ArXiv ID: 2508.05416
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Mansi Sharma, Enrico Sartor, Marc Cavazza, Helmut Prendinger
📄 中文摘要:
预测股票和加密货币价格是一项具有挑战性的任务,主要由于其高波动性和非平稳性,受到经济变化和市场情绪等多种因素的影响。已有研究表明,回声状态网络(ESNs)能够有效建模短期股票市场波动,捕捉动态数据中的非线性模式。本研究首次探索了ESNs在加密货币预测中的应用,特别是在极端波动时期。通过在混沌时期利用李雅普诺夫指数进行混沌分析,本文展示了ESNs方法在预测比特币时间序列方面的优越性。研究结果表明,与现有的机器学习方法(如Boosting和Naïve方法)相比,ESNs在混沌时期表现出显著的优势,尤其是在高混沌环境下具有更高的鲁棒性和预测精度。研究还通过李雅普诺夫指数分析验证了这一结论,表明ESNs在处理复杂非线性动态系统时具有独特的优势。总体而言,本文为加密货币价格预测提供了一种新的有效工具,并为未来在高波动性金融市场中的应用奠定了基础。研究结果不仅在理论上扩展了ESNs的应用范围,也在实际预测中展示了其潜力,尤其是在面对市场不确定性和混沌特性时。本研究为金融科技领域的研究者和从业者提供了重要的参考,未来可进一步探索ESNs在其他金融时间序列预测中的应用。
回声状态网络比特币预测时间序列混沌分析机器学习
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 论文在加密货币预测领域具有重要创新,可能对金融科技产生较大影响。

负二项变分自编码器用于过分散潜在建模

ArXiv ID: 2508.05423
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Yixuan Zhang, Wenxin Zhang, Hua Jiang, Quyu Kong, Feng Zhou
📄 中文摘要:
本文提出了一种新的变分自编码器(VAE)框架——NegBio-VAE,专门用于建模生物神经元通过尖峰序列进行通信时的高度变异性数据。传统的VAE模型无法充分捕捉神经活动中的不规则爆发特性,而近期的一些工作(如Poisson-VAE)通过使用泊松分布对尖峰计数进行建模,迈出了生物启发的第一步。然而,泊松分布假设均值和方差相等,这种刚性约束无法真实反映神经活动的随机本质。针对这一局限性,NegBio-VAE通过引入负二项分布对尖峰计数进行建模,突破了均值-方差相等的限制,实现了对分散度的显式控制,从而构建了更广泛、更准确的神经表示模型。本文进一步开发了两种针对负二项分布的证据下界(ELBO)优化方案以及两种可微分的重新参数化策略,仅通过引入一个额外的分散度参数,就将泊松潜在模型扩展为负二项模型。实验结果表明,这一微小但关键的改进显著提升了重建保真度,凸显了在尖峰样激活中显式建模过分散的重要性。研究不仅在理论上扩展了VAE框架的适用性,也为神经科学与机器学习的交叉领域提供了新的工具和视角,尤其是在处理生物数据的高度变异性方面展现了潜力。作者通过对比实验验证了NegBio-VAE相较于传统模型的优越性,强调了其在捕捉复杂神经活动模式中的应用价值。
变分自编码器负二项分布过分散神经活动建模尖峰序列
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在VAE框架中引入负二项分布,具有重要创新,可能显著影响神经数据建模领域。

竞争风险:对风险估计和算法公平性的影响

ArXiv ID: 2508.05435
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Vincent Jeanselme, Brian Tom, Jessica Barrett
📄 中文摘要:
准确的时间-事件预测对于决策制定至关重要,广泛应用于医疗指南制定、招聘决策和资源分配等领域。生存分析作为一种定量框架,用于建模时间-事件数据,考虑了研究期间未经历目标事件的患者,即所谓的删失数据。然而,许多患者会经历阻止目标事件观察的竞争事件,这些竞争风险常被视为删失处理,这种做法由于对其后果的理解不足而常被忽视。本研究从理论上证明了将竞争风险视为删失处理会引入显著的生存估计偏差,导致风险的系统性高估,并关键性地加剧了不平等现象。首先,本文形式化了将竞争风险误分类为删失的问题,并量化了由此产生的生存估计误差。具体而言,研究开发了一个框架来估计这一误差,并展示了其对预测性能和算法公平性的相关影响。此外,研究还探讨了不同人口群体间风险特征的差异如何导致群体特定的误差,可能进一步加剧现有不平等。通过对心血管管理数据的实证分析,研究结果表明,忽视竞争风险对最易受这些事件影响的个体产生了不成比例的影响,可能加剧不公平现象。本研究通过量化误差并强调将竞争风险视为删失的常见做法对公平性的影响,为生存模型的开发提供了关键见解:从业者必须考虑竞争风险,以提高准确性,减少风险评估中的差异,并更好地指导下游决策。
竞争风险生存分析风险估计算法公平性删失数据
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文揭示了竞争风险处理对公平性和准确性的重要影响,具有较大潜力。

具有PAC级别保证的尾部风险安全的蒙特卡洛树搜索

ArXiv ID: 2508.05441
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Zuyuan Zhang, Arnob Ghosh, Tian Lan
📄 中文摘要:
本文研究了在蒙特卡洛树搜索(MCTS)中仅基于期望回报进行决策的局限性,这种方法无法充分考虑决策可能带来的高风险和不利结果。为解决这一问题,传统的安全感知MCTS通常引入一些约束形式,如平均风险度量或硬性成本阈值,但这些方法无法对极端或高风险结果(即尾部风险)提供严格的安全保证,可能在高风险场景中导致严重后果。本文提出了两种创新解决方案以应对这一挑战。首先,作者提出了CVaR-MCTS方法,将一致性尾部风险度量——条件风险价值(CVaR)嵌入到MCTS中。通过参数α,CVaR-MCTS能够在‘最差(1-α)%情景’下的预期损失上实现明确的尾部风险控制。其次,针对有限样本导致的尾部风险估计偏差问题,作者进一步提出了Wasserstein-MCTS(W-MCTS)方法,通过引入半径为ε_s的一阶Wasserstein模糊集P_ε_s(s,a)来表征尾部风险估计中的不确定性。作者为CVaR-MCTS和W-MCTS提供了PAC尾部安全保证,并建立了它们的遗憾界(regret)。在多种模拟环境中的评估结果表明,所提出的方法优于现有基线方法,有效实现了稳健的尾部风险保证,同时提升了回报和稳定性。本研究为高风险决策场景下的安全感知决策提供了重要的理论和实践支持,具有显著的应用潜力。
蒙特卡洛树搜索尾部风险条件风险价值Wasserstein模糊集PAC保证
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文提出创新方法解决尾部风险问题,具有较大领域影响力。

学习几何感知的求积规则以实现函数最小化

ArXiv ID: 2508.05445
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Costas Smaragdakis
📄 中文摘要:
本文提出了一种名为QuadrANN的图神经网络(GNN)架构,旨在从点云的底层几何结构中直接学习最优求积权重,以解决非均匀点云上的精确数值积分问题,这对基于变分原理的现代无网格机器学习偏微分方程(PDE)求解器具有重要意义。传统的蒙特卡洛(MC)方法难以处理非均匀点云,而现代神经网络架构能够处理排列不变的输入,为任意点云创建求积规则。QuadrANN通过深度消息传递机制设计模型,其中初始层编码来自绝对和相对位置以及显式局部密度测量的丰富局部几何特征,而后续层则整合全局上下文向量。这些架构选择使得QuadrANN能够生成数据驱动的求积规则,该规则对局部点密度和整体域形状具有自适应性且保持排列不变性。研究通过一系列具有挑战性的测试案例验证了该方法,包括在凸域和非凸域上的积分以及热方程和Fokker-Planck方程解的估计。在所有测试中,QuadrANN通过将点云变形为在积分函数存在奇异性的关键区域更密集,从而降低了积分估计的方差,相较于标准的准蒙特卡洛方法表现出更高的稳定性。这种在关键区域的增强稳定性对于优化能量泛函至关重要,从而提升了基于深度学习的变分求解器的性能。研究结果表明,QuadrANN在函数最小化和数值积分任务中具有显著优势,为无网格PDE求解提供了新的可能性。
图神经网络数值积分点云几何变分求解器机器学习
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在数值积分和PDE求解领域具有重要创新,可能显著提升无网格方法的应用效果。

EnergyPatchTST:具有不确定性估计的多尺度时间序列变换器用于能源预测

ArXiv ID: 2508.05454
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Wei Li, Zixin Wang, Qizheng Sun, Qixiang Gao, Fenglei Yang
📄 中文摘要:
准确且可靠的能源时间序列预测对于电力生产规划和分配具有重要意义。当前,深度学习已成为时间序列预测的主流方法。然而,多尺度时间动态特性以及真实数据的不规则性导致现有方法存在局限性。为此,本文提出了EnergyPatchTST,一种专门为能源预测设计的Patch时间序列变换器的扩展模型。该方法的主要创新包括:(1)多尺度特征提取机制,能够捕捉不同时间分辨率的模式;(2)概率预测框架,通过蒙特卡洛剔除法估计不确定性;(3)集成未来已知变量(如温度和风力条件)的路径;(4)通过预训练和微调范式提升有限能源数据集的性能。在多个常用能源数据集上进行的实验表明,EnergyPatchTST优于其他常用方法,预测误差降低了7-12%,并提供了可靠的不确定性估计。这为能源领域的时间序列预测提供了重要参考。研究结果表明,该模型在处理复杂时间序列数据时具有显著优势,尤其是在多尺度动态特性和数据不规则性挑战下,能够有效提高预测精度和可靠性,为能源规划和决策支持提供了新的技术工具。此外,模型的不确定性估计功能进一步增强了其在实际应用中的可信度,为风险评估和管理提供了支持。总之,EnergyPatchTST在能源预测领域展现了重要的应用潜力。
能源预测时间序列多尺度特征不确定性估计深度学习
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在能源预测领域具有重要创新,可能对行业应用产生较大影响。

临床存在偏移下的生存结果预测:一种联合神经网络架构

ArXiv ID: 2508.05472
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Vincent Jeanselme, Glen Martin, Matthew Sperrin, Niels Peek, Brian Tom, Jessica Barrett
📄 中文摘要:
本研究聚焦于电子健康记录(EHR)在患者与医疗系统复杂交互中生成的数据,提出了一种新的预测模型以应对临床存在(clinical presence)对观察结果的影响。临床存在指的是患者与医疗系统交互的观察过程,通常会对预测结果产生影响。然而,在利用电子健康记录开发临床预测模型时,传统方法往往忽略了临床存在的影响,导致模型性能受限,尤其是在交互模式发生变化时,模型的可移植性(transportability)受到限制。本文提出了一种多任务循环神经网络(RNN),该网络并行建模了观察间隔时间、数据缺失过程以及目标生存结果之间的关系,旨在通过联合建模提高模型在不同临床环境下的适应性。研究从理论上论证了联合建模如何在临床存在发生变化(如部署到不同医院、地区或国家)时提升模型的可移植性。基于MIMIC-III数据集的真实世界死亡率预测任务实验表明,相较于未考虑观察过程的现有最先进预测模型,本文提出的方法在性能和可移植性方面均有显著提升。研究结果强调了利用临床存在信息的重要性,不仅能提升预测模型的准确性,还能增强其在不同医疗环境中的适用性,为构建更具普适性的临床预测模型提供了新思路。
临床存在生存预测电子健康记录循环神经网络模型可移植性
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在医疗预测模型领域具有重要创新,提升了模型的可移植性,具有较大潜力。

解构水晶球:从临时预测到基于SAISE框架的原则性初创企业评估

ArXiv ID: 2508.05491
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Seyed Mohammad Ali Jafari, Ali Mobini Dehkordi, Ehsan Chitsaz, Yadollah Yaghoobzadeh
📄 中文摘要:
本论文探讨了将人工智能(AI)技术整合进初创企业评估过程中的重要技术转变,指出当前学术研究在方法论上的碎片化问题。现有研究常常采用临时性的方法,导致成功定义不一致、特征缺乏理论依据以及验证过程不够严谨。这种碎片化严重限制了当前预测模型的可比性、可靠性和实际应用价值。论文提出了SAISE框架(Startup AI Systematic Evaluation),旨在通过系统化的方法解决上述问题。该框架从理论构建、特征选择到模型验证,提供了一套原则性的评估流程,以提升预测模型的科学性和实用性。研究方法包括对现有文献的系统性回顾、特征工程的理论化设计以及多数据集的实证验证。关键发现表明,基于SAISE框架的模型在预测初创企业成功率方面显著优于传统临时性方法,尤其是在跨数据集的泛化能力和长期预测稳定性上表现出色。此外,研究还揭示了某些关键特征(如团队背景和市场适应性)在预测中的核心作用。结论指出,SAISE框架不仅为学术研究提供了统一的评估标准,也为投资者和政策制定者提供了更可靠的决策工具。未来研究可进一步扩展框架的应用场景,探索其在不同行业和文化背景下的适应性。
人工智能初创企业评估SAISE框架预测模型特征工程
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 论文提出创新性框架,具有较大应用潜力,可能影响创业评估领域。

概率电路的可处理锐度感知学习

ArXiv ID: 2508.05537
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Hrithik Suresh, Sahil Sidheekh, Vishnu Shreeram M. P, Sriraam Natarajan, Narayanan C. Krishnan
📄 中文摘要:
概率电路(Probabilistic Circuits, PCs)是一类生成模型,支持对多种查询进行精确且可处理的推理。尽管近年来的发展使得学习深层且表达能力强的PCs成为可能,但这种能力的提升往往导致过拟合问题,尤其是在数据有限的情况下。本研究从对数似然景观的角度分析了PCs的过拟合问题,发现其通常是由收敛到锐度较高的最优解导致的,而这些最优解的泛化能力较差。受神经网络中锐度感知最小化(Sharpness-Aware Minimization)的启发,本文提出了一种基于Hessian矩阵的正则化方法来训练PCs。作为主要贡献,本研究展示了如何高效计算对数似然Hessian矩阵的迹(trace),这是一个通常在深层神经网络中难以处理的锐度代理指标。通过最小化Hessian迹,诱导了一种基于梯度范数的正则化方法,该方法为期望最大化(EM)算法提供了简单的闭式参数更新,并能与基于梯度的学习方法无缝集成。在合成数据集和真实世界数据集上的实验表明,该方法能够持续引导PCs趋向于更平坦的最小值,从而显著提升模型的泛化性能。研究结果不仅为PCs的训练提供了新的视角,也为生成模型的优化提供了重要的理论和实践指导。
概率电路锐度感知过拟合泛化性能Hessian矩阵
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究提出创新方法提升概率电路泛化能力,具有较大领域影响力。

TrajEvo:基于大语言模型驱动的进化设计轨迹预测启发式方法

ArXiv ID: 2508.05616
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Zhikai Zhao, Chuanbo Hua, Federico Berto, Kanghoon Lee, Zihan Ma, Jiachen Li, Jinkyoo Park
📄 中文摘要:
轨迹预测是建模人类行为的关键任务,特别是在社交机器人和自动驾驶导航等安全关键领域。传统的基于手工规则的启发式方法往往缺乏准确性和泛化能力。尽管深度学习方法在性能上有所提升,但其计算成本高、解释性有限,且在分布外(OOD)场景中的泛化能力较差。本文提出了一种名为TrajEvo的框架,利用大语言模型(LLMs)自动设计轨迹预测启发式方法。TrajEvo采用进化算法从过去的轨迹数据中生成并优化预测启发式规则,提出了两项关键创新:跨代精英采样以促进种群多样性,以及统计反馈循环使LLM能够分析并改进替代预测方案。实验评估表明,TrajEvo在多个真实世界数据集上的表现优于现有的启发式方法,并且在泛化到未见过的OOD真实世界数据集时,显著超越了传统的启发式和深度学习方法。TrajEvo在自动化设计快速、可解释且泛化能力强的轨迹预测启发式方法方面迈出了重要一步。作者公开了源代码(https://github.com/ai4co/trajevo),以促进未来的研究工作。本研究不仅展示了LLM在自动化算法设计中的潜力,也为安全关键领域的轨迹预测提供了新的解决方案,具有重要的理论和应用价值。
轨迹预测大语言模型进化算法启发式设计泛化能力
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: TrajEvo在轨迹预测领域展现重要创新,对安全关键应用有较大潜力影响。

从震荡到咆哮:MambaStock在标普500指数上的优化器对决

ArXiv ID: 2508.04707
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Alena Chan, Maria Garmonina
📄 中文摘要:
本研究针对MambaStock模型在预测标普500指数回报的任务上,对多种优化器的性能进行了评估。研究背景聚焦于金融市场预测中机器学习模型的优化问题,特别是在处理复杂时间序列数据时优化器的选择对模型性能的影响。研究方法主要包括对当前广泛使用的优化算法进行比较测试,具体包括梯度平滑和自适应学习率优化器(如Adam和RMSProp)以及Lion优化器。通过实验发现,Adam和RMSProp等优化器在测试误差方面表现最佳,取得了较低的预测误差;而Lion优化器则在训练速度上具有显著优势,缩短了模型训练时间。然而,Lion优化器在训练过程中常伴随损失函数的振荡行为,影响模型稳定性。为解决这一问题,研究团队提出了一类新型优化器家族——Roaree。该优化器通过抑制Lion优化器中常见的振荡损失行为,同时保留其快速训练的特点,实现了性能与效率的平衡。关键发现表明,Roaree优化器在标普500指数预测任务中不仅保持了较快的训练速度,还显著降低了测试误差,展现出比现有优化器更优的综合性能。研究结论指出,Roaree优化器的设计理念为未来的优化算法研究提供了新思路,尤其是在金融预测等高复杂性任务中具有潜在的应用价值。此外,本研究还探讨了不同优化器在实际应用中的适用场景,为机器学习模型在金融领域的部署提供了实用指导。
优化器MambaStock标普500机器学习金融预测
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 论文提出新型优化器Roaree,具有重要创新性,可能对金融预测领域产生较大影响。

盐岩蠕变变形预测:基于深度神经网络和解析模型的地下能源存储应用研究

ArXiv ID: 2508.05248
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Pradeep Kumar Shukla, Tanujit Chakraborty, Mustafa Sari, Joel Sarout, Partha Pratim Mandal
📄 中文摘要:
本研究深入分析了时间序列预测方法,用于预测盐岩在不同围压条件下的时间依赖性变形趋势(即蠕变)。蠕变变形评估对于设计和运营用于核废料、氢能或放射性物质的地下存储设施至关重要。盐岩因其低孔隙率、低渗透性、高延展性以及出色的蠕变和自愈合能力等力学特性而被选为研究对象。研究利用多级三轴(MSTL)蠕变数据,在围压水平为5至35 MPa的条件下,记录了5.8至21天内每5至10秒的轴向应变数据集。初始分析包括季节-趋势分解(STL)和格兰杰因果检验,结果显示轴向应变与温度数据之间几乎不存在季节性和因果关系。进一步的统计检验,如增强型迪基-富勒(ADF)检验,确认数据具有平稳性(p值小于0.05),而小波相干图(WCP)分析则显示出重复趋势。本研究采用了一系列深度神经网络(DNN)模型,包括基于神经基扩展分析的时间序列模型(N-BEATS)、时间卷积网络(TCN)、循环神经网络(RNN)和Transformer(TF),并将其与统计基线模型进行比较。预测性能通过均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和对称平均绝对百分比误差(SMAPE)进行评估。结果表明,N-BEATS和TCN模型在不同应力水平下表现优于其他模型。特别是N-BEATS和TCN等DNN模型相较于传统解析模型在准确性上提高了15-20%,有效捕捉了复杂的时间依赖性和模式。本研究为地下存储设施的设计提供了重要的预测工具和理论支持。
盐岩蠕变深度神经网络时间序列预测地下存储岩石力学
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 研究创新性地结合深度学习与岩石力学,具有较大应用潜力。

基于有用工作量证明的区块链用于可信生物医学超维计算

ArXiv ID: 2202.02964
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Jinghao Wen, Dongning Ma, Sizhe Zhang, Hasshi Sudler, Xun Jiao
📄 中文摘要:
超维计算(HDC)是一种受生物启发的学习范式,因其在性能与效率之间的平衡优势而备受关注,并在生物医学领域得到了越来越多的应用。在生物医学应用中,训练学习模型的可信度(如可重复性和可验证性)至关重要。本研究提出了HDCoin,这是首个针对HDC的有用工作量证明(Proof-of-Useful-Work, PoUW)区块链框架。通过HDCoin,传统的能源浪费型挖矿过程被转变为一个竞争性过程,旨在开发高精度、可信且可验证的超维模型。本研究探索了四个不同的生物医学数据集,并对区块链矿工的关键HDC超参数(如维度、学习率和重新训练迭代次数)进行了广泛的设计空间探索,以评估模型性能、自适应挖矿难度以及有用工作量证明的公平性。研究结果表明,HDCoin框架能够有效提升生物医学领域中HDC模型的可信度和实用性,同时通过将计算资源导向有意义的科学问题,减少了传统区块链挖矿中的资源浪费。关键发现包括:通过调整超参数和挖矿难度,HDCoin能够在不同数据集上实现较高的模型精度,同时保证了挖矿过程的公平性和参与者的激励机制。此外,本研究还讨论了如何通过区块链技术确保模型训练过程的透明性和结果的可验证性,为生物医学领域的可信计算提供了一种创新解决方案。结论指出,HDCoin不仅为HDC在生物医学领域的应用开辟了新路径,也为区块链技术在科学计算中的应用提供了新思路。
超维计算区块链有用工作量证明生物医学可信计算
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 论文提出创新性区块链框架,解决生物医学计算可信问题,具有较大潜力。

通过调谐透镜从Transformer中提取潜在预测

ArXiv ID: 2303.08112
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Nora Belrose, Igor Ostrovsky, Lev McKinney, Zach Furman, Logan Smith, Danny Halawi, Stella Biderman,
📄 中文摘要:
本文从迭代推理的角度分析了Transformer模型,旨在理解模型预测如何在每一层中逐步优化。为此,作者在冻结的预训练模型的每个模块上训练了一个仿射探针,使得能够将每个隐藏状态解码为词汇表上的概率分布。研究提出了一种名为‘调谐透镜’的方法,这是对早期‘逻辑透镜’技术的改进。早期技术虽然提供了一些有用的见解,但往往不够稳定。调谐透镜通过对每一层的隐藏状态进行更精确的分析,揭示了Transformer模型在处理输入数据时如何逐步改进其预测。研究发现,不同层级的隐藏状态反映了模型在理解和生成文本时的不同阶段特征,早期层更多关注语法和局部语义,而较深层则逐渐聚焦于全局语义和上下文依赖的预测。这种分层预测机制为理解Transformer的内部工作原理提供了新的视角。此外,作者还探讨了调谐透镜在模型解释性和调试中的潜在应用,例如识别模型在特定任务上的失败模式或优化模型的中间表示。研究结果表明,调谐透镜不仅提高了对模型行为的洞察力,还为改进模型设计和训练策略提供了可能。总之,本文通过调谐透镜方法深入剖析了Transformer的层级预测过程,为自然语言处理领域的研究者提供了宝贵的工具和理论支持。
Transformer调谐透镜迭代推理隐藏状态模型解释性
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文提出调谐透镜方法,具有重要创新性,可能对模型解释性研究产生较大影响。

无监督图深度学习揭示城市区域突发洪水风险特征

ArXiv ID: 2309.14610
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Kai Yin, Junwei Ma, Ali Mostafavi
📄 中文摘要:
城市洪水风险源于洪水灾害、暴露程度、社会和物理脆弱性等多重特征之间的复杂非线性交互,以及空间洪水依赖关系的复杂性。然而,现有的城市洪水风险表征方法主要基于洪泛区地图,仅关注有限的特征(主要是灾害和暴露特征),未考虑特征间的交互或空间区域间的依赖关系。为解决这一问题,本研究提出了一种基于新型无监督图深度学习模型(FloodRisk-Net)的综合城市洪水风险评级模型。该模型能够捕捉区域间的空间依赖性以及洪水灾害与城市特征之间的复杂非线性交互,从而识别突发洪水风险。研究利用美国多个大都市统计区(MSAs)的数据,将其洪水风险分为六个城市特定的风险等级。该模型具有可解释性,支持对每个洪水风险等级内区域的特征分析,从而识别出每个MSA内塑造最高洪水风险的三个典型模式。研究发现,洪水风险在每个MSA内呈现出层次化的空间分布,其中核心城市不成比例地承担了最高的洪水风险。多个城市被发现具有较高的总体洪水风险水平和较低的空间不平等性,这表明平衡城市发展和洪水风险减缓的选择有限。文章还讨论了相关的洪水风险减缓策略,考虑了最高洪水风险及洪水风险空间分布不均的形成方式。
城市洪水风险无监督图深度学习空间依赖性FloodRisk-Net风险评级
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究创新性地结合图深度学习与城市洪水风险评估,具有较大潜在影响。

迈向建模感知的因果框架

ArXiv ID: 2401.13408
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Jose M. Alvarez, Salvatore Ruggieri
📄 中文摘要:
感知是个体对相同信息产生不同解释的认知现象,对人类决策中的偏见具有重要影响。然而,在机器学习(ML)领域中,感知研究仍显不足。这是一个亟待解决的问题,因为现代决策流程,无论部分还是完全由ML应用自动化,始终涉及人类专家。例如,当两位专家对ML模型的同一延迟实例或解释产生不同理解时,我们应如何处理?解决此类问题首先需要对感知进行形式化表述,尤其是在与ML支持的决策流程整合的方式上。本研究提出了一种初步方法,通过因果推理建模感知。我们使用结构因果模型(SCMs)在因果推理框架下定义感知,将个体经验形式化为专家决策者所拥有的额外因果知识,并以SCM的形式应用于决策过程中。我们定义了两种概率因果感知:结构型和参数型。通过一系列现代决策流程的示例,我们展示了该框架的应用。此外,我们强调在公平机器学习中解决感知问题的重要性,讨论了相关的公平性影响及可能的实际应用。本研究为理解和整合感知在ML决策中的作用奠定了基础,有助于减少因个体差异导致的决策偏差,并为构建更公平的自动化决策系统提供了理论支持。研究结果表明,通过因果框架建模感知,可以更好地解释和预测专家在复杂决策环境中的行为差异,为未来的ML系统设计提供了新的视角。
感知建模因果推理机器学习公平性决策流程
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在ML中引入因果感知建模,具有重要创新性,可能对公平决策产生较大影响。

使用欧几里得距离校准深度神经网络

ArXiv ID: 2410.18321
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Wenhao Liang, Chang Dong, Liangwei Zheng, Wei Zhang, Weitong Chen
📄 中文摘要:
在现实世界场景中,不确定性是一个基本特征,完美信息往往难以获得。人类通过发展复杂的内部模型来处理不完整数据,并有效应对未预见或部分观察到的事件。在机器学习领域,焦点损失(Focal Loss)常用于通过强调难以分类的样本降低误分类率。然而,焦点损失无法保证预测概率的良好校准,可能导致模型过度自信或信心不足。高校准误差表明预测概率与实际结果之间存在偏差,影响模型的可靠性。本研究提出了一种新的损失函数——焦点校准损失(Focal Calibration Loss, FCL),旨在改善概率校准,同时保留焦点损失在处理困难样本方面的优势。FCL通过最小化欧几里得范数并采用严格适当的损失函数,对逐实例的校准误差进行惩罚并约束边界。本文提供了该方法的理论验证,并将其应用于校准CheXNet模型,以支持其在基于Web的医疗保健系统中的潜在部署。在多种模型和数据集上的广泛评估表明,我们的方法在校准和准确性指标上均达到了最先进的(SOTA)性能。研究结果显示,FCL不仅提高了模型的预测可靠性,还在保持分类精度的同时显著降低了校准误差。这一方法为深度学习模型在高风险应用场景(如医疗诊断)中的部署提供了重要支持,具有广泛的实际应用价值。最终,本研究为机器学习模型的校准问题提供了一种创新且有效的解决方案,为未来的研究奠定了基础。
深度神经网络概率校准焦点校准损失欧几里得距离机器学习
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究提出创新校准方法,具有较大应用潜力,可能影响深度学习领域。

Transformer能否在上下文中学习完整的贝叶斯推断?

ArXiv ID: 2501.16825
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Arik Reuter, Tim G. J. Rudner, Vincent Fortuin, David R\"ugamer
📄 中文摘要:
Transformer已成为深度学习领域的主导架构,广泛应用于多个领域,并展现出卓越的上下文学习(ICL)能力。尽管ICL的机制尚未完全被理解,但这一现象已显示出令人着迷的前景,使Transformer能够在不需额外训练的情况下在上下文中进行学习。本研究进一步推动了对ICL的理解,证明了Transformer能够在上下文中对常用统计模型执行完整的贝叶斯推断。具体而言,研究团队提出了一种通用框架,该框架基于先前拟合网络和连续归一化流的思想,允许推断广义线性模型和潜在因子模型等模型的复杂后验分布。通过在真实世界数据集上的广泛实验,研究表明其ICL方法生成的后期样本质量与最先进的马尔可夫链蒙特卡洛(MCMC)或变分推断方法相当,而后者并非在上下文中操作。这一发现揭示了Transformer在统计推断中的潜力,为其在无需额外训练的情况下处理复杂概率模型提供了新的视角。研究还提供了开源代码,以便进一步验证和扩展相关工作。结论指出,Transformer的ICL能力不仅限于简单的模式识别,还能扩展到复杂的统计推断任务,这可能对未来的机器学习模型设计和应用产生深远影响。
Transformer上下文学习贝叶斯推断深度学习统计模型
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 研究展示了Transformer在贝叶斯推断中的创新应用,具有较大潜力影响领域发展。

如何适应控制障碍函数?一种基于学习的方法及其在垂直起降四旋翼飞机中的应用

ArXiv ID: 2504.03038
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Taekyung Kim, Randal W. Beard, Dimitra Panagou
📄 中文摘要:
本文提出了一种新颖的理论框架,用于在线适应控制障碍函数(Control Barrier Function, CBF)的参数,即CBF条件中包含的K类函数,同时考虑输入约束。作者引入了局部验证CBF参数的概念,通过基于Nagumo定理和切锥分析得出的条件,在线适应参数以保证有限时间范围内的安全性。为了在线识别这些参数,本文将基于学习的方法与考虑神经网络预测中固有的认知不确定性和偶然不确定性的不确定性感知验证过程相结合。该方法在垂直起降(VTOL)四旋翼飞机模型上进行了验证,特别是在具有挑战性的过渡和着陆操作中,展示了在保持安全性的同时显著提升性能。研究背景在于控制障碍函数在机器人和自动驾驶等领域的安全保障中具有重要作用,但其参数的动态适应性仍是一个挑战。本文通过理论推导和学习算法的结合,提出了一种能够在复杂动态环境中实时调整CBF参数的方法。关键发现包括:局部验证参数能够在有限时间内确保系统安全;学习方法结合不确定性分析能够有效应对预测误差。结论表明,该方法不仅适用于VTOL四旋翼飞机,还可能推广到其他需要高安全性保障的动态系统,具有重要的理论和应用价值。
控制障碍函数在线适应垂直起降飞机基于学习安全性保障
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文提出创新性方法解决CBF参数适应问题,对机器人安全控制有较大影响。

面向可扩展贝叶斯优化的梯度信息贝叶斯神经网络研究

ArXiv ID: 2504.10076
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Georgios Makrygiorgos, Joshua Hang Sai Ip, Ali Mesbah
📄 中文摘要:
贝叶斯优化(BO)是一种广泛应用于数据驱动优化的方法,通常依赖于目标函数的零阶数据来构建概率代理模型。这些代理模型指导探索-利用过程以寻找全局最优解。尽管高斯过程(GPs)常被用作未知目标函数的代理模型,但近期研究表明贝叶斯神经网络(BNNs)作为可扩展且灵活的替代方案具有潜力。此外,已有研究表明,当梯度信息可用时,将其融入高斯过程中可以提升贝叶斯优化的性能。然而,在BNN代理模型中利用梯度信息仍未被充分探索。本研究通过利用自动微分技术,将梯度信息无缝集成到BNN的训练过程中,从而构建更具信息量的代理模型用于贝叶斯优化。我们提出了一种梯度信息损失函数用于BNN训练,有效地通过局部梯度信息增强函数观测值。在多个知名基准测试上的实验结果表明,该方法在提升BNN预测性能和加速BO收敛速度方面具有显著优势,尤其是在决策变量数量增加的情况下。这一研究为可扩展贝叶斯优化提供了新的视角和方法,展示了梯度信息在提升代理模型质量和优化效率中的重要作用。研究结论表明,梯度信息贝叶斯神经网络在处理高维优化问题时具有显著潜力,为未来的数据驱动优化研究奠定了基础。
贝叶斯优化贝叶斯神经网络梯度信息数据驱动优化高维优化
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在贝叶斯优化领域提出重要创新,可能显著提升高维优化效率。

保守分类器在改进代理中的一致表现:统计与在线学习的特性分析

ArXiv ID: 2506.05252
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Dravyansh Sharma, Alec Sun
📄 中文摘要:
本文研究了机器学习在社会决策中的应用,特别是在评估求职者或贷款申请等场景中,分类代理如何对学习算法做出反应的问题。近年来,战略分类领域的研究主要集中在减少和对抗分类代理的欺骗行为,但Attias等人近期的工作揭示了当代理真正改进以获得理想分类时,学习能力的一些令人惊讶的特性,例如比标准PAC学习更小的泛化误差。本文从多个新维度对所谓的改进学习能力进行了表征。作者引入了最小一致概念类的非对称变体,并用它在可实现设置下对改进学习的适当性提供了精确的表征。相较于先前仅研究一般、任意代理改进区域下的学习能力,本文针对更自然的欧几里得球改进集合给出了积极结果,特别是在数据分布的温和生成假设下,表征了非适当学习。此外,作者展示了如何在更具挑战性的环境中学习,在广受研究的有限噪声模型下实现更低的泛化误差,并在可实现和不可知的在线学习中获得错误界限。本文还解决了Attias等人提出的关于适当和非适当学习的开放性问题,为该领域的研究提供了新的视角和理论支持。研究结果表明,保守分类器在面对改进代理时能够持续表现出色,为机器学习在动态环境中的应用提供了重要启示。
机器学习战略分类改进学习泛化误差在线学习
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文在战略分类领域有重要创新,对改进学习的研究具有较大影响力。

HydroChronos:预测数十年地表水变化

ArXiv ID: 2506.14362
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Daniele Rege Cambrin, Eleonora Poeta, Eliana Pastor, Isaac Corley, Tania Cerquitelli, Elena Baralis,
📄 中文摘要:
地表水动态预测对于水资源管理和气候变化适应至关重要。然而,该领域缺乏全面的数据集和标准化的基准测试。本研究推出了HydroChronos,这是一个大规模、多模态的时空数据集,专门用于地表水动态预测,旨在填补这一空白。数据集涵盖了超过三十年的Landsat 5和Sentinel-2影像、气候数据以及欧洲、北美和南美的多样化湖泊与河流的数字高程模型(DEM),并结合了三种预测任务。此外,本文提出了一种新的时空架构AquaClimaTempo UNet,该模型包含一个专门的气候数据分支,作为强有力的基准模型。研究结果表明,该模型在预测未来水动态方面显著优于Persistence基准模型,在变化检测和变化方向分类任务中F1分数分别提高了+14%和+11%,在变化幅度回归任务中MAE提高了+0.1。此外,通过可解释人工智能(Explainable AI)分析,研究识别出影响地表水变化的关键气候变量和输入通道,为未来的建模工作提供了重要的见解和指导。本研究不仅为地表水动态预测提供了宝贵的数据资源和方法基准,还通过揭示气候因素与水资源变化之间的关系,为水资源管理和气候适应策略的制定提供了科学依据。
地表水动态预测模型HydroChronos气候数据时空数据集
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究创新性地提供了大规模数据集和模型基准,对水资源管理领域有重要影响。

Nexus:在LLM服务中主动进行GPU内部预填充与解码的分离

ArXiv ID: 2507.06608
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Xiaoxiang Shi, Colin Cai, Junjia Du, Zhihao Jia
📄 中文摘要:
本文提出了一种名为Nexus的创新方法,旨在解决大型语言模型(LLM)服务中预填充(prefill)和解码(decode)阶段的GPU资源利用问题。研究背景在于,传统的整体服务方法通过批量处理预填充和解码来提高GPU利用率,但会遭受细粒度的阶段干扰问题。引擎级别的预填充-解码分离虽然避免了干扰,但带来了更高的硬件和协调开销。之前的GPU内部分离方法通过在单个GPU内多路复用预填充和解码,依赖于基于服务水平目标(SLO)的调优,并通过离线分析或反应性反馈循环的启发式方法进行指导。然而,这些方法仅在性能问题出现后做出反应,而无法预测动态工作负载下的变化,限制了适应性。Nexus提出了一种主动的GPU内部分离策略,通过预测工作负载变化并提前调整资源分配,显著减少了性能瓶颈。研究采用了一种基于机器学习的预测模型,结合实时监控数据,动态优化预填充和解码的资源分配比例。实验结果表明,Nexus在多种动态工作负载下均表现出色,相较于传统方法,其延迟降低了约20%,吞吐量提升了15%。此外,Nexus在高负载场景下仍能保持稳定的服务质量,展现了其鲁棒性。结论指出,Nexus为LLM服务中的资源管理提供了一种高效且前瞻性的解决方案,可能对未来的GPU资源优化研究产生深远影响。
大型语言模型GPU资源管理预填充与解码动态工作负载机器学习预测
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: Nexus提出主动分离策略,具有重要创新性,可能显著影响LLM服务优化领域。

AbbIE:自回归块状迭代编码器用于高效序列建模

ArXiv ID: 2507.08567
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Preslav Aleksandrov, Meghdad Kurmanji, Fernando Garcia Redondo, David O'Shea, William Shen, Ale
📄 中文摘要:
本文提出了一种新颖的自回归块状迭代编码器(AbbIE),这是对仅编码器Transformer架构的一种递归泛化方法。AbbIE在困惑度(perplexity)方面优于标准Transformer,并且能够在测试时动态调整计算资源。这种简单且递归的方法为通过参数和token数量扩展大型语言模型(LLM)性能提供了补充。AbbIE在潜在空间中执行迭代,但与潜在推理模型不同,它不需要专门的数据集或训练协议。研究表明,AbbIE在测试时具备向上泛化能力(即能够泛化到任意迭代长度),仅在训练时使用2次迭代,就远远超过了其他迭代方法。AbbIE能够根据任务复杂性调整计算开销的能力,使其在零样本情境学习任务中相较于其他迭代方法和标准方法提升了高达12%的性能,在语言困惑度方面提升了高达5%。本研究的成果为Transformer性能扩展开辟了新的途径。所有评估均在参数规模高达3.5亿的模型上进行。作者通过实验验证了AbbIE在高效序列建模中的潜力,特别是在资源动态分配和性能优化方面的优势。这一方法不仅展示了迭代策略在Transformer架构中的应用前景,也为未来的模型设计提供了新的思路,尤其是在计算资源受限或任务复杂度变化较大的场景中具有重要意义。
自回归编码器迭代方法Transformer序列建模零样本学习
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 论文提出创新性迭代方法,对Transformer性能扩展有重要影响。

可解释的证据聚类

ArXiv ID: 2507.12192
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Victor F. Lopes de Souza, Karima Bakhti, Sofiane Ramdani, Denis Mottet, Abdelhak Imoussaten
📄 中文摘要:
无监督分类是机器学习中的一个基本问题。现实世界的数据往往存在不确定性和不精确性的缺陷,传统方法难以有效处理这些问题。基于Dempster-Shafer理论的证据聚类方法能够应对这些挑战。本文探讨了证据聚类结果的可解释性问题,这在医疗等高风险领域尤为重要。研究分析表明,在一般情况下,代表性是决策树作为溯因解释器的必要且充分条件。基于代表性概念,本文通过效用函数将其推广到部分标注的情境中。这些效用函数能够表示“可容忍”的错误,从而定义了证据错误性作为解释成本,并构建了针对证据分类器的定制化解释器。此外,本文提出了迭代证据错误最小化(IEMM)算法,该算法为证据聚类函数提供了可解释且谨慎的决策树解释。通过在合成数据和真实世界数据上的验证,研究表明,考虑决策者的偏好后,该方法能够在高达93%的情况下提供令人满意的解释。研究结果不仅推动了证据聚类在实际应用中的可解释性,还为高风险领域中基于证据的决策提供了重要的理论和实践支持。通过结合决策者的偏好和数据特性,IEMM算法展现了在复杂数据环境下的适应性和有效性,为未来的研究奠定了基础。
证据聚类可解释性决策树Dempster-Shafer理论机器学习
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文在证据聚类可解释性方面有重要创新,对高风险领域有较大潜在影响。

BOASF:通过自适应连续过滤加速自动机器学习的统一框架

ArXiv ID: 2507.20446
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Guanghui Zhu, Xin Fang, Feng Cheng, Lei Wang, Wenzhong Chen, Chunfeng Yuan, Yihua Huang
📄 中文摘要:
机器学习在众多应用领域取得了巨大成功,但对于非专家从业者而言,成功且高效地完成机器学习任务始终是一个挑战。从大量可能的模型或超参数组合中找到最优解通常需要丰富的专家知识和经验。为解决这一问题,本文提出了一种结合贝叶斯优化与自适应连续过滤的算法框架(BOASF),基于统一的多臂老虎机模型,用于自动化模型选择和超参数优化。具体而言,BOASF 包含多个评估轮次,在每一轮中通过贝叶斯优化为每个臂选择有前景的配置。随后,基于高斯 UCB 的概率模型,自适应连续过滤(ASF)能够提早淘汰表现较差的臂。此外,采用 Softmax 模型自适应地为进入下一轮的有前景臂分配可用资源,概率较高的臂将获得更多资源。实验结果表明,BOASF 在加速模型选择和超参数优化过程方面非常有效,同时在预测性能上优于现有的最先进的自动机器学习方法,表现出更强的鲁棒性。此外,BOASF 在各种时间预算下均展现出更优的随时性能(anytime performance)。本文的研究为自动机器学习提供了一种高效且实用的解决方案,有助于降低非专家用户的使用门槛,并推动机器学习技术的广泛应用。
自动机器学习贝叶斯优化自适应过滤超参数优化多臂老虎机
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究提出创新框架,显著提升自动机器学习效率,具有较大潜力影响领域发展。

模块化增量合并与正交约束:一个可扩展的持续与可逆模型组合框架

ArXiv ID: 2507.20997
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Haris Khan, Sadia Asif, Shumaila Asif
📄 中文摘要:
在现实世界的机器学习部署中,模型需要持续更新、组合,并在必要时选择性地撤销。然而,现有的模型合并和持续学习方法常常面临任务干扰、灾难性遗忘或缺乏可逆性的问题。本文提出了一种新颖的框架——模块化增量合并与正交约束(MDM-OC),该框架实现了可扩展、无干扰且可逆的微调模型组合。每个任务特定的模型被编码为共享基础模型的增量,并投影到正交子空间中以消除冲突。通过基于梯度的优化方法,这些投影后的增量被合并为一个统一的模型,从而在多个任务中保持性能。该方法支持新模型的持续集成,结构化的拆分以满足如GDPR等合规性要求,并通过弹性权重巩固和合成回放确保模型稳定性。在视觉和自然语言处理基准测试上的广泛实验表明,MDM-OC在准确性、反向迁移和拆分保真度方面优于现有基线,同时保持内存效率和计算可行性。该框架为模块化和合规的AI系统设计提供了一种原则性解决方案。研究结果表明,MDM-OC不仅能够有效应对任务干扰和灾难性遗忘,还能在动态环境中实现模型的灵活管理和更新,为构建适应性强且合规的机器学习系统奠定了基础。
模块化增量合并正交约束持续学习可逆模型组合任务干扰
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究提出创新框架,解决持续学习和模型合规问题,具有较大潜力。

基于MLI指导的电子健康记录中亚组感知建模框架(AdaptHetero)

ArXiv ID: 2507.21197
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Ling Liao, Eva Aagaard
📄 中文摘要:
本研究提出了一种新颖的基于机器学习解释(MLI)的框架AdaptHetero,旨在将解释性洞察转化为可操作的指导策略,用于在电子健康记录(EHRs)中针对不同亚组定制模型训练和评估方法。传统的MLI主要用于增强临床医生信任和从EHRs中提取洞察,而本框架则填补了将其应用于指导亚组特定建模策略的空白。研究在三个大规模EHR数据集(GOSSIS-1-eICU、WiDS和MIMIC-IV)上进行了评估,重点分析了预测ICU死亡率、住院死亡率和隐性低氧血症时的模型行为异质性。通过结合基于SHAP的解释方法和无监督聚类技术,AdaptHetero成功识别出具有临床意义的亚组特定特征。在多个亚组中,该框架显著提升了预测性能(最高增益达174.39%),同时对其他亚组中潜在的风险进行了前瞻性警示。研究结果表明,AdaptHetero在实现更稳健、公平和上下文感知的临床部署方面具有重要潜力。该框架不仅揭示了模型在不同亚组中的异质性表现,还为临床决策提供了更精细的支持,有助于减少医疗结果中的偏差并提升模型的适用性。总之,AdaptHetero为基于EHRs的机器学习模型在临床环境中的应用开辟了新的可能性。
机器学习解释电子健康记录亚组建模临床预测模型异质性
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究创新性地将MLI应用于亚组建模,具有较大的临床应用潜力。

ByteGen:一种无分词器的字节空间限价簿事件生成模型

ArXiv ID: 2508.02247
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Yang Li, Zhi Chen
📄 中文摘要:
生成式建模高频限价簿(LOB)动态是量化金融领域中一个关键且尚未解决的挑战,对于稳健的市场模拟和策略回测至关重要。传统方法往往受限于简化的随机假设,而现代深度学习模型(如Transformer)则依赖于分词方案,通过离散化和分箱处理影响金融数据的高精度数值特性。为解决这些局限性,本文提出了ByteGen,一种直接在LOB事件的原始字节流上操作的新型生成模型。该方法将问题视为自回归的下一字节预测任务,并设计了一种紧凑高效的32字节打包二进制格式来表示市场消息,确保信息无损。研究的核心创新在于完全消除了特征工程和分词过程,使模型能够从市场动态的最基本表示中学习。通过适配H-Net架构(一种结合Mamba和Transformer的混合模型),利用动态分块机制在无预定义规则的情况下发现市场消息的内在结构。本文的主要贡献包括:1)首个端到端的字节级LOB建模框架;2)高效的打包数据表示方法;3)在高频数据上的全面评估。ByteGen在超过3400万条CME比特币期货事件数据上进行训练,成功重现了金融市场的关键风格化事实,生成了逼真的价格分布、重尾收益和突发性事件时间分布。研究结果表明,直接从字节空间学习是建模复杂金融系统的一种有前景且高度灵活的范式,在标准市场质量指标上取得了有竞争力的表现,同时避免了分词带来的偏差。这一方法为金融市场动态的生成式建模提供了新的视角和可能性。
生成模型限价簿字节空间金融科技深度学习
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究提出创新的字节级建模方法,对金融科技领域有较大潜在影响。

评估全球供应链基础设施投资组合的动态关联性:风险因素和极端事件的影响

ArXiv ID: 2508.04858
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Haibo Wang
📄 中文摘要:
本文研究了全球供应链基础设施投资中的风险因素,包括能源市场、投资者情绪和全球航运成本,并提出了与动态风险相关的投资组合策略。研究采用时变参数向量自回归(TVP-VAR)模型,分析了2010年1月5日至2023年6月29日期间全球供应链基础设施投资组合与环境、社会和治理(ESG)指数相关的风险因素之间的溢出效应和相互关联性。研究还计算并比较了COVID-19疫情爆发前后极端事件对风险溢出和投资策略的影响。结果表明,风险冲击显著影响了全球供应链基础设施投资组合与能源市场(以西德克萨斯中质原油WTI为代表)、投资者情绪波动指数(VIX)和波罗的海干散货指数(BDI)之间的动态关联性。具有较高ESG评分的投资组合与其他组合和风险因素之间的动态关联性更强。净总方向性关联性分析显示,WTI、BDI和VIX持续为风险溢出的净接受者,而以GLFOX为代码的投资组合在不同时间点表现为净接受者和净给予者。成对关联性分析表明,WTI和VIX主要为净接受者,而以CSUAX、GII和FGIAX为代码的投资组合则主要为净给予者。COVID-19疫情的爆发改变了投资组合动态关联性的结构,疫情前后投资策略中多头/空头头寸权重的平均值(HR和HE)发生了结构性变化。此外,研究发现,具有较高ESG评分的全球供应链基础设施投资组合的对冲能力更优。总体而言,本文揭示了极端事件对全球供应链基础设施投资组合风险溢出和投资结果的影响,为投资者在动态风险环境下的决策提供了重要参考。
全球供应链动态关联性风险溢出ESG指数COVID-19
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文在供应链风险管理领域具有重要创新,可能对投资策略产生较大影响。

函数因子回归及其在电价曲线建模中的应用

ArXiv ID: 2503.12611
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Sven Otto, Luis Winter
📄 中文摘要:
本文提出了一种针对时间依赖曲线数据的函数-函数线性回归模型,通过对回归变量施加因子结构来实现一致性估计。研究引入了一个基于交叉协方差的积分算子,将每个函数回归变量分解为两个部分:一个低维预测成分及其相关因子,确保与因变量相关;以及一个无预测能力的无穷维成分。为了准确估计每个回归变量的因子数量,作者提出了一种函数特征值差异检验方法。传统函数线性模型的估计量难以在分布上收敛,而本文方法建立了渐近正态性,从而可以构建置信区间并进行统计推断。该模型被应用于三个不同能源市场的电价曲线预测,其预测精度与流行的机器学习方法相当,同时提供了统计上有效的推断和对电价条件相关结构的解释性见解。研究背景在于函数数据分析的复杂性,尤其是在处理高维时间序列数据时,传统的线性回归方法往往失效,而本文通过因子结构和函数分析的结合,成功应对了这一挑战。关键发现包括模型在电价预测中的高精度和可解释性,尤其是在揭示市场间价格相关性方面具有重要意义。结论表明,该方法不仅在预测性能上具有竞争力,还为能源市场分析提供了新的统计工具。
函数回归因子结构电价曲线统计推断预测精度
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在函数数据分析领域具有重要创新,对能源市场预测有较大影响。

数字孪生信道辅助的CSI预测:基于环境的子空间提取方法实现低开销与鲁棒性

ArXiv ID: 2508.05142
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Yichen Cai, Jianhua Zhang, Li Yu, Zhen Zhang, Yuxiang Zhang, Lianzheng Shi, Yuelong Qiu
📄 中文摘要:
为了满足第六代(6G)移动通信系统在复杂场景下对鲁棒性和高速通信的需求,基于感知和人工智能(AI)的数字孪生信道(DTC)技术成为一种有前景的方法,以降低系统开销。本文提出了一种基于环境特定信道子空间基(EB)的部分到整体信道状态信息(CSI)预测方法(EB-P2WCP),用于实现DTC支持的低开销信道预测。具体而言,EB被用于表征电磁环境的静态特性,从数字孪生地图中提取,作为预测任务的环境先验信息。随后,将EB与实时估计的本地CSI融合,以预测当前和未来时间点的整个空间-频率域信道。为此,设计了一种基于EB的部分到整体CSI预测网络(EB-P2WNet),以在各种复杂场景中实现鲁棒的信道预测方案。仿真结果表明,在低信噪比和导频比例条件下,引入EB带来了显著的好处,导频开销最多可减少50%。此外,所提出的方法对多用户干扰保持了鲁棒性,能够容忍3米的定位误差,仅导致0.5 dB的归一化均方误差(NMSE)增加,同时在1.3毫秒内预测下一个信道相干时间的CSI。这一方法展示了在复杂通信环境中的高效性和可靠性,为6G系统的信道预测提供了重要的技术支持,具有潜在的实际应用价值。
数字孪生信道CSI预测子空间提取低开销鲁棒性
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究在6G通信领域具有重要创新性,可能显著降低系统开销并提升鲁棒性。

用人工智能重新发现标准模型

ArXiv ID: 2508.04923
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Aya Abdelhaq, Pellegrino Piantadosi, Fernando Quevedo
📄 中文摘要:
本研究探讨了人工智能是否能够在没有任何理论输入的情况下,仅依靠实验数据自主恢复粒子物理标准模型的已知结构。研究团队采用了无监督机器学习技术,包括数据降维和聚类算法,分析粒子的内在属性和衰变模式,从而揭示了粒子物理中的关键组织特征,例如不同相互作用的相对强度以及重子与介子之间的差异。研究还识别出了一些守恒量,如重子数、奇异数和粲数,并发现了同位旋结构和八重道多重态的模式。此外,分析表明聚类方法能够根据相互作用、味对称性以及量子数对粒子进行分类。研究还观察到与重子激发态中Regge轨迹一致的模式。研究结果表明,机器学习能够直接从数据中重现标准模型的关键方面,这为基于数据的物理学基础研究开辟了一条充满前景的道路。通过这种方法,人工智能不仅验证了已知的物理学结构,还展示了在未来发现未知物理规律的潜力。这一研究为粒子物理学中的数据驱动方法提供了新的视角,可能对未来的理论发展和实验设计产生深远影响。
人工智能标准模型粒子物理机器学习数据驱动
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 此研究创新性地用AI重现标准模型,具有较大潜在影响。

全保形预测集的条件有效性及快速近似公式

ArXiv ID: 2508.05272
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Nicolai Amann
📄 中文摘要:
本文研究了基于全保形预测(full conformal prediction)的预测集在统计学习中的应用,特别是在其普遍的边际覆盖保证方面的潜力。然而,由于计算成本极高(甚至超过交叉验证)以及从业者更关注基于特定训练数据的条件覆盖保证而非边际覆盖保证,全保形预测在实际应用中受到限制。本文通过两方面解决这些问题:首先,证明了在一致性分数(conformity score)具有随机有界性和满足稳定性条件的情况下,全保形预测集在给定训练数据时是条件保守的。其次,提出了一种全保形预测集的近似方法,该方法在之前推导的稳定性假设下,与全保形预测具有渐近相同的训练条件覆盖率,并且计算更为简便。此外,研究表明,在稳定性假设下,n折交叉保形预测同样具有与全保形预测相同的渐近训练条件覆盖保证。如果一致性分数定义为样本外预测误差,则本文提出的全保形预测集近似公式与对称化的Jackknife方法一致。最终结论是,对于基于稳定预测算法的一致性分数,全保形预测、n折交叉保形预测、Jackknife+、本文的近似公式以及Jackknife方法均具有相同的渐近训练条件覆盖保证。本研究为全保形预测的实际应用提供了理论支持和计算效率的改进。
全保形预测条件覆盖统计学习近似公式稳定性条件
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文提出重要创新,显著提升全保形预测的实用性,可能对统计学习领域产生较大影响。

输入-输出光学作为因果时间序列映射:一种生成式机器学习解决方案

ArXiv ID: 2411.19897
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Abhijit Sen, Bikram Keshari Parida, Kurt Jacobs, Denys I. Bondar
📄 中文摘要:
本文研究了多体量子系统对光学脉冲的响应建模问题,这是一个极具挑战性的任务。作者提出了一种基于神经网络的方法,包括传统神经网络和生成式模型,用于从数据中学习并模拟量子系统的响应。量子系统被视为执行从输入时间序列(光学脉冲)到输出时间序列(系统响应,通常也是光学脉冲)的复杂映射。以横向和非可积Ising模型为例,研究表明时间卷积网络不仅能够捕捉系统生成的输入/输出映射,还可以通过最小潜在空间的大小来量化映射的复杂性,该潜在空间能够准确建模映射关系。此外,作者发现生成式模型,特别是变分自编码器,在学习多体量子系统的复杂响应方面显著优于传统自编码器。在生成最复杂映射的示例中,变分自编码器生成的输出在测试数据中超过90%的输入误差小于10%。研究结果表明,生成式机器学习方法在模拟量子系统响应方面具有显著优势,为处理复杂的量子动力学问题提供了新的工具和视角,同时也为量化系统映射复杂性提供了有效手段。这一方法可能进一步推广到其他量子系统的研究中,具有重要的理论和应用价值。
多体量子系统光学脉冲生成式机器学习变分自编码器时间序列映射
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 本文提出创新方法解决量子系统建模难题,具有较大潜在影响。

基于条件自回归VaR的尾部风险预警:回归分位数与机器学习算法的应用

ArXiv ID: 2412.06193
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Zong Ke, Yuchen Yin
📄 中文摘要:
随着人工智能在金融领域的广泛应用,本研究利用人工智能算法探讨尾部风险,并开发了一种模型以调整尾部风险,从而促进美国金融市场的稳定性并增强美国经济的韧性。具体而言,本文构建了一个多变量多层次的条件自回归VaR(CAViaR)模型,通过梯度下降和遗传算法进行优化,用于研究美国股票市场、外汇市场和信贷市场之间的尾部风险溢出效应。该模型被用于对美国股票、美国信贷债券等相关风险提供早期预警。研究结果表明,通过分析风险溢出的方向、大小以及伪脉冲响应,发现信贷市场对股票市场的溢出效应及其持续时间均大于股票市场及其他两个市场对信贷市场的溢出效应。这使得信贷市场在极端风险预警中处于核心地位,其极端风险的历史信息可以作为其他市场VaR的预测指标。研究通过结合回归分位数和机器学习算法,揭示了不同金融市场间尾部风险的动态关联,为金融监管和风险管理提供了重要的理论依据和实践指导。作者强调,基于人工智能的尾部风险预警模型能够有效提升市场对极端事件的响应能力,对维护金融系统稳定具有重要意义。研究结论为未来的金融风险管理提供了新的视角,尤其是在利用历史数据预测潜在市场波动方面展现了显著的应用价值。
尾部风险条件自回归VaR机器学习风险溢出金融市场稳定
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 研究创新性强,结合AI与金融风险管理,对市场稳定有重要影响。

梯度提升伪权重方法:基于非概率样本的人群推断方法

ArXiv ID: 2508.00089
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Kangrui Liu, Lingxiao Wang, Yan Li
📄 中文摘要:
非概率样本在多个领域中迅速兴起,用于解决时间敏感的优先议题。尽管这些数据具有时效性,但容易受到选择偏差的影响。为了减轻选择偏差,大量调查研究文献探讨了使用倾向评分(PS)调整方法来提高非概率样本的人群代表性,并以基于概率的调查样本作为外部参考。近期的一项进展,即基于2步PS的伪权重调整方法(2PS,Li 2024),已被证明在均方误差方面优于近期其他方法。然而,这些方法在减少偏差方面的有效性高度依赖于底层倾向模型准确反映真实选择过程的能力,而参数回归方法在这方面存在挑战。本研究提出了一组伪权重构建方法,利用梯度提升方法(GBM)在2PS框架中估计倾向评分以构建伪权重,相较于基于逻辑回归的方法提供了更大的灵活性。研究比较了所提出的基于GBM的伪权重与包括2PS在内的现有方法。通过蒙特卡洛模拟研究评估了人群均值估计器的性能。此外,研究还使用1988-1994年NHANES III作为非概率样本,以1994年NHIS作为参考调查,评估了包括15年死亡率在内的多种健康结果的流行率。研究结果表明,基于GBM的伪权重方法在减少选择偏差和提高估计精度方面表现出显著优势,尤其是在复杂选择机制下。这为非概率样本的推断提供了一种更鲁棒的工具,可能在公共健康和社会科学研究中具有广泛应用前景。最终,本研究强调了非参数方法在处理非概率样本偏差问题中的潜力,并为未来的方法改进提供了方向。
非概率样本倾向评分梯度提升伪权重选择偏差
⭐ 重要性评分: 8/10 查看原文
🤖 AI评价: 该研究提出创新方法改进非概率样本推断,具有较大应用潜力。

在1 AU处对风数据进行聚类以情境化太阳风中的磁重联

ArXiv ID: 2508.05579
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Francesco Carella, Giovanni Lapenta, Alessandro Bemporad, Stefan Eriksson, Maria Elena Innocenti, So
📄 中文摘要:
本研究聚焦于太阳风中磁重联事件的观测与情境化分析,旨在通过对1 AU处风数据的聚类,揭示太阳风条件对磁重联事件发生率及特性的影响。研究背景在于,磁重联作为太阳风中常见的物理现象,其发生机制和特性与太阳风的整体结构和动态密切相关,而对太阳风模式和结构的深入理解有助于更准确地解释磁重联事件的观测结果。研究采用数据聚类方法,对1 AU处的太阳风数据进行分类和模式识别,探索不同太阳风条件下的特征分布及其与磁重联事件的相关性。主要方法包括对风速、密度、温度等参数的多维分析,并结合统计工具和数值模拟,识别出影响磁重联的关键环境因素。研究的关键发现表明,太阳风中的特定结构和动态模式与磁重联事件的频率和强度存在显著关联,例如高速太阳风流与低速流交界处的湍流区域往往是磁重联的高发区。此外,研究还揭示了某些太阳风参数的组合模式可能作为磁重联事件的预测指标。结论指出,通过对太阳风数据的聚类分析,可以有效情境化磁重联事件,为未来空间天气预报和太阳风物理研究提供重要参考,同时也为理解太阳风与地球磁层相互作用的复杂机制奠定了基础。
太阳风磁重联数据聚类空间物理1 AU
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 研究具有重要创新性,为太阳风与磁重联研究提供了新视角,可能影响空间物理领域。

基于事件的深度学习方法追踪眼球运动

ArXiv ID: 2508.04827
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Chirag Seth, Divya Naiken, Keyan Lin
📄 中文摘要:
本研究致力于解决在特定事件中精确追踪眼球运动的挑战,基于前期研究成果展开。人类眼球运动速度极快,可达300度/秒,因此精确的眼球追踪通常需要昂贵的高速摄像头。本研究的主要目标是利用事件相机的输入数据,定位眼球中心位置(x, y)。眼球运动分析在消费电子领域具有广泛应用,特别是在虚拟现实(VR)和增强现实(AR)产品开发中。因此,本研究的最终目标是开发一种可解释且成本效益高的算法,通过深度学习方法预测人类注意力,从而提升设备舒适度和整体用户体验。为了实现这一目标,研究团队探索了多种方法,其中CNN_LSTM模型表现最为出色,达到了约81%的准确率。此外,研究还提出了未来的工作方向,重点关注层级相关性传播(Layer-wise Relevance Propagation, LRP),以进一步提升模型的可解释性和预测性能。本研究不仅在技术上实现了创新,还为VR和AR设备的用户体验优化提供了重要参考。通过结合事件相机和深度学习技术,本文提出了一种潜在的低成本解决方案,为眼球追踪技术在消费电子领域的应用开辟了新的可能性。研究结果表明,CNN_LSTM模型在处理快速眼球运动数据时具有较高的准确性和稳定性,为后续研究奠定了坚实基础。
眼球追踪深度学习事件相机VR/ARCNN_LSTM
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 研究具有重要创新性,可能对VR/AR领域产生较大影响。

基于问卷数据的机器学习短期体能表现电池未来得分预测

ArXiv ID: 2508.05222
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Marcin Kolakowski, Seif Ben Bader
📄 中文摘要:
随着老年人口的增加,减缓老年人身体机能退化成为重要的公共健康问题。本研究旨在探索通过问卷数据预测老年人未来四年短期体能表现电池(Short Physical Performance Battery, SPPB)得分的可能性,以实现早期干预。研究背景聚焦于老年人的身体机能评估,SPPB作为一种常用的体能测试工具,能够反映老年人的下肢力量、平衡能力和行走速度。本文采用多种机器学习算法进行预测,包括随机森林(Random Forest)、XGBoost、线性回归(Linear Regression)、密集神经网络(Dense Neural Network)以及TabNet神经网络。通过对比实验,XGBoost算法表现最佳,其预测的平均绝对误差(Mean Absolute Error, MAE)为0.79分,显示出较高的预测精度。为了进一步优化模型,研究基于Shapley值分析方法,从原始特征集中筛选出10到20个关键特征,并重新训练XGBoost回归模型,最终取得了接近原始模型的预测性能,MAE为0.82分。这表明通过较少的特征仍可实现高精度的预测,从而降低了数据采集的复杂性。研究的关键发现是问卷数据可以有效用于预测老年人的未来体能表现,为早期识别体能下降风险提供了技术支持。结论指出,基于机器学习的预测模型在老年健康管理中具有潜在的应用价值,未来可进一步结合更多数据源和长期随访数据以提升模型的鲁棒性和实用性。
机器学习短期体能表现电池老年人健康XGBoost特征选择
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 研究具有重要创新性,为老年健康管理提供新工具,可能产生较大影响。

基于LSTM-RF混合模型的海洋叶绿素预测与驱动因素分析

ArXiv ID: 2508.05260
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Zhouyao Qian, Yang Chen, Baodian Li, Shuyi Zhang, Zhen Tian, Gongsen Wang, Tianyue Gu, Xinyu Zhou, H
📄 中文摘要:
海洋叶绿素浓度是生态系统健康和碳循环强度的重要指标,其准确预测对于赤潮预警和生态响应至关重要。本研究提出了一种LSTM-RF混合模型,结合了长短期记忆网络(LSTM)和随机森林(RF)的优势,解决了单一模型在时间序列建模和非线性特征刻画方面的不足。研究利用多源海洋数据(包括温度、盐度、溶解氧等)进行训练,实验结果表明,LSTM-RF模型在测试集上的表现显著优于单独使用LSTM或RF模型,具体表现为R^2值为0.5386,均方误差(MSE)为0.005806,平均绝对误差(MAE)为0.057147,而单独使用LSTM和RF的R^2值分别为0.0208和0.4934。此外,通过标准化处理和滑动窗口方法,模型的预测精度得到进一步提升,为海洋生态变量的高频预测提供了创新性解决方案。本研究不仅在技术上实现了对海洋叶绿素浓度的精准预测,还为理解海洋生态系统的动态变化和驱动因素提供了重要参考。研究结果表明,LSTM-RF混合模型在处理复杂的海洋环境数据时具有显著优势,未来可进一步应用于其他海洋生态指标的预测和分析,为海洋环境保护和资源管理提供科学依据。
海洋叶绿素LSTM-RF模型时间序列预测生态系统健康赤潮预警
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 该研究在海洋生态预测领域具有重要创新,模型性能显著提升,可能对相关领域产生较大影响。

累积学习率适应:重新审视基于路径的SGD和Adam调度方法

ArXiv ID: 2508.05408
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Asma Atamna, Tom Maus, Fabian Kievelitz, Tobias Glasmachers
📄 中文摘要:
学习率是深度学习中的一个关键超参数,其理想值取决于具体问题,并且可能在训练过程中发生变化。本文研究了自适应学习率机制的实用性,这些机制能够根据损失景观动态调整步长。我们重新审视了2017年提出的一种基于累积路径的适应方案,该方案根据观察到的路径长度(以时间折扣的归一化梯度步长总和计算)与随机游走预期长度之间的差异来调整学习率。尽管原始方法提供了令人信服的直觉,但我们发现其对Adam优化器的适应机制在概念上存在不一致性,原因是Adam优化器内部的预条件处理。我们提出了一种修正变体,以更好地反映Adam的更新动态。为了评估在线学习率适应的实际价值,我们对SGD和Adam优化器(包括是否采用累积适应)进行了基准测试,并将其与一种最近提出的替代方法进行了比较。研究结果表明,累积学习率适应在某些情况下能够显著提高训练效率,尤其是在损失景观复杂且学习率难以手动调优的任务中。我们的实验还揭示了自适应策略在不同优化器和数据集上的表现差异,强调了其在特定场景下的适用性。最终,本文旨在阐明自适应学习率策略在何种情况下以及为何能够带来实际益处,为深度学习优化器的设计和应用提供了新的见解和指导。
学习率适应深度学习SGDAdam优化器
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 本文提出重要改进,对学习率适应有较大潜在影响。

基于大数据分析和机器学习的综合智能能源管理系统研究

ArXiv ID: 2508.05583
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Jinzhou Xu, Yadan Zhang, Paola Tapia
📄 中文摘要:
本文研究了大数据分析和机器学习在综合智能能源管理系统中的应用,特别是在项目文件管理与控制中的重要性。研究背景在于,大数据技术的应用是综合智能能源的一个显著特征,能够显著提升项目管理的效率和控制能力。文章首先探讨了在综合智能能源项目文件管理中实施大数据分析的益处与挑战,指出其在提高管理效率方面的潜力,同时也面临数据处理复杂性和技术实施难度等问题。随后,作者构建了一个大数据分析在综合智能能源项目文件管理中的实施框架,并提出了一种通过机器学习优化文件管理效率的方法。研究利用项目文件管理过程中产生的各类数据和信息,采用三种不同的机器学习方法对整个项目文件控制过程的效率进行优化。其中,通过拟合惩罚线性回归模型,研究发现当训练数据集充足时,模型的准确率可达到95%以上。关键发现表明,通过大数据分析和机器学习技术,可以实现对综合智能能源项目文件全流程的跟踪和业务流程的优化,从而加强项目建设的控制能力并提升项目建设效率。结论指出,该方法为智能能源管理提供了一种创新的解决方案,具有较高的实际应用价值,并为未来的研究奠定了基础。
大数据分析机器学习智能能源管理文件管理项目控制
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 论文提出创新方法,对智能能源管理领域有较大潜在影响。

增强PyKEEN:知识图谱嵌入模型的多重负采样解决方案

ArXiv ID: 2508.05587
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Claudia d'Amato, Ivan Diliso, Nicola Fanizzi, Zafar Saeed
📄 中文摘要:
知识图谱嵌入方法因其在链接预测和三元组分类任务上的可扩展性而广受欢迎。嵌入模型的训练依赖于正样本和负样本三元组。然而,由于缺乏负断言,通常需要通过各种负采样策略人工生成负样本,这些策略从随机破坏到更复杂的技术不等,对整体性能产生重要影响。目前,大多数流行的知识图谱嵌入库仅支持基本的负采样策略,缺乏高级解决方案。为解决这一问题,本研究为流行的知识图谱嵌入框架PyKEEN开发了一个扩展模块,集成了多种高级负采样器(包括静态和动态破坏策略),在一致的模块化架构内生成有意义的负样本,同时与现有的PyKEEN工作流程和管道保持兼容。该扩展不仅增强了PyKEEN本身的功能,还便于嵌入方法的开发和定制。作为概念验证,本文通过全面的实证研究展示了所开发扩展对不同嵌入方法性能(链接预测任务)的影响,并为设计更有效的负采样策略提供了有用的见解。研究背景表明,负采样策略的选择直接影响模型的训练效果和预测精度,而本研究的创新在于提出并实现了多种高级负采样方法,填补了现有框架的不足。关键发现包括不同负采样策略对模型性能的具体影响,以及动态策略相较于静态策略在某些场景下的优越性。结论指出,该扩展为知识图谱嵌入研究提供了重要的工具支持,并为未来的方法改进奠定了基础。
知识图谱嵌入模型负采样PyKEEN链接预测
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 该研究在知识图谱嵌入领域具有重要创新,可能提升模型性能和研究效率。

利用Kolmogorov-Arnold网络优化物联网威胁检测

ArXiv ID: 2508.05591
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Natalia Emelianova, Carlos Kamienski, Ronaldo C. Prati
📄 中文摘要:
随着物联网(IoT)的指数级增长,安全问题日益凸显,物联网网络已成为网络攻击的主要目标。本研究探讨了Kolmogorov-Arnold网络(KANs)作为传统机器学习模型的替代方案,用于物联网网络中的入侵检测。KANs通过采用可学习的激活函数,在性能上超越了传统的多层感知器(MLPs),并且与最先进的模型(如随机森林和XGBoost)相比,取得了具有竞争力的准确率,同时在物联网网络入侵检测中提供了更高的可解释性。本研究首先分析了物联网网络面临的威胁特征及其对检测模型的特殊需求,随后详细介绍了KANs的理论基础和实现方法。通过在多个公开数据集上的实验验证,研究表明KANs不仅能够有效识别复杂的攻击模式,还能通过其结构化的函数分解提供对检测结果的深入洞察。此外,KANs在计算效率上也表现出一定的优势,适合资源受限的物联网设备环境。研究还讨论了KANs在实际部署中的潜在挑战,包括模型训练的复杂性和对大规模网络流量的适应性问题。最终,本文得出结论,KANs为物联网威胁检测提供了一种有前景的解决方案,未来可通过优化算法和硬件加速进一步提升其性能和适用性。这一研究为物联网安全领域引入了一种创新的检测工具,具有重要的理论和实践意义。
物联网威胁检测Kolmogorov-Arnold网络网络安全机器学习
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 该研究在物联网安全领域引入创新方法,具有较大潜在影响。

基于量化测量的径向网络拓扑学习误差界限

ArXiv ID: 2508.05620
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Samuel Talkington, Aditya Rangarajan, Pedro A. de Alc\^antara, Line Roald, Daniel K. Molzahn, Daniel
📄 中文摘要:
本文研究了径向网络拓扑学习问题中的误差界限,重点在于同时估计网络的连接性和线路参数。研究模型考虑了由于传感器精度限制(即量化)引入的数据误差,这种量化效应导致了一个非线性测量模型,将传感器通信网络的操作嵌入到学习问题中,超越了电力系统估计算法中常见的加性噪声模型。作者通过概率方法对学习到的径向网络拓扑的误差进行了界定,证明了误差与量化区间宽度成正比,并且在节点数量增加时呈次线性增长,前提是每个节点的样本数量与节点数量的对数成正比。这一结果揭示了量化误差对网络拓扑学习精度的影响规律,为设计更鲁棒的电力系统拓扑估计算法提供了理论基础。研究还探讨了样本数量与节点规模之间的关系,强调了在有限精度测量环境下优化学习性能的关键因素。结论表明,通过合理控制量化精度和样本数量,可以有效降低拓扑学习误差,为实际电力 电力系统中的网络拓扑识别和参数估计提供了重要的理论支持和实践指导。
径向网络拓扑量化测量误差界限电力系统网络学习
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 本文在量化测量环境下对网络拓扑学习误差的分析具有重要创新性,可能影响电力系统估计领域。

多准则决策问题的统一贝叶斯框架

ArXiv ID: 2208.13390
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Majid Mohammadi
📄 中文摘要:
本文提出了一种基于贝叶斯框架的多准则决策(MCDM)问题解决方案,通过对MCDM方法的概率解释,应对该领域中的多种挑战。作者利用贝叶斯模型的灵活性,为MCDM中的关键问题提供了统计学上优雅的解决方案,包括群体决策问题和准则相关性问题。所提出的框架能够适应决策者(DMs)偏好中的多种不确定性形式,例如正态分布、三角分布以及区间偏好。为了解决大规模群体MCDM场景,研究开发了一种概率混合模型,用于识别决策者的同质子群体。此外,作者设计了一种概率排名方案,根据决策者的偏好评估准则和备选方案的相对重要性。通过对多个数值示例的实验验证,证明了所提出框架的有效性,并突显了其相较于其他方法的独特优势。研究结果表明,该贝叶斯框架在处理复杂决策问题时具有较高的适应性和准确性,尤其是在处理不确定性和群体异质性方面表现突出。作者还讨论了该框架在实际应用中的潜在价值,例如在企业管理、政策制定和资源分配等领域的应用前景。总之,本文为MCDM领域提供了一种创新且实用的工具,为未来的研究和应用奠定了坚实基础。
多准则决策贝叶斯框架群体决策概率模型不确定性
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 该研究在MCDM领域提出创新框架,具有较大潜在影响。

聊天大语言模型的概率校准失准但仍能预测多项选择问答的正确性

ArXiv ID: 2402.13213
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Benjamin Plaut, Nguyen X. Khanh, Tu Trinh
📄 中文摘要:
本研究对15个经过微调的聊天大语言模型(LLMs)进行了分析,发现其最大softmax概率(MSPs)在多项选择问答任务中普遍存在校准失准的问题。然而,这些MSPs可能仍然蕴含了有用的不确定性信息。研究假设错误答案的MSPs会低于正确答案的MSPs,通过严格的统计测试,验证了这一假设在表现良好的模型中成立。研究还发现,问答准确性与MSP正确性预测之间存在强烈的正相关关系,而问答准确性与校准误差之间无相关性。这表明,在当前的微调范式下,随着大语言模型能力的提升,正确性预测能力有望改善,但校准问题可能持续存在。为了展示正确性预测的实用性,研究表明,当模型有选择弃权的选项时,可以通过基于初始模型响应的MSP选择性弃权来提升性能,且仅需少量标注数据即可确定MSP阈值。这一发现为利用MSP改进模型决策提供了新思路,同时也揭示了当前大语言模型在概率校准方面的局限性。研究结果对未来改进模型校准方法以及在不确定性估计中的应用具有重要意义,特别是在需要高可靠性输出的场景中。
大语言模型概率校准正确性预测多项选择问答不确定性估计
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 研究揭示了聊天模型校准问题与正确性预测的潜力,具有一定创新性和应用价值。

利用生存分析预测工业打印头寿命

ArXiv ID: 2504.07638
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Dan Parii, Evelyne Janssen, Guangzhi Tang, Charalampos Kouzinopoulos, Marcin Pietrasik
📄 中文摘要:
准确预测关键设备部件的寿命对于维护计划和生产优化至关重要,是学术界和工业界共同关注的重点课题。本研究探讨了生存分析在预测佳能生产打印公司开发的工业打印头寿命中的应用。研究具体聚焦于五种技术来估计生存概率和故障率,包括Kaplan-Meier估计量、Cox比例风险模型、Weibull加速失效时间模型、随机生存森林以及梯度提升方法。通过等张回归进一步优化得到的估计结果,并将其聚合以确定预期故障数量。预测结果在多个时间窗口内与真实数据进行验证,以评估模型的可靠性。研究通过三种性能指标进行定量评估,结果表明,生存分析在打印头寿命预测方面显著优于行业标准的基线方法。研究背景在于工业生产中设备维护的高成本和复杂性,传统的预测方法往往无法准确捕捉部件寿命的动态变化,而生存分析通过统计建模和机器学习技术的结合,提供了更精确的预测工具。关键发现包括不同模型在特定场景下的表现差异,例如随机生存森林在处理非线性关系时表现更优,而Cox模型在解释变量影响方面更具优势。结论指出,生存分析不仅提高了预测精度,还为工业维护策略的制定提供了数据支持,具有显著的实际应用价值。未来研究可以进一步探索更多复杂数据集和模型优化方法,以提升预测的鲁棒性和适用性。
生存分析打印头寿命工业维护机器学习预测模型
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 研究具有重要创新性,对工业维护领域有较大潜在影响。

大型时间序列模型在水文学中的有效性如何?以大沼泽地水位预测为研究对象

ArXiv ID: 2505.01415
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Rahuul Rangaraj, Jimeng Shi, Azam Shirali, Rajendra Paudel, Yanzhao Wu, Giri Narasimhan
📄 中文摘要:
大沼泽地(Everglades)在洪水和干旱调控、水资源规划以及周边生态系统管理中扮演着至关重要的角色。然而,传统的基于物理和统计的水位预测方法常常面临显著挑战,包括高计算成本和对多样化或不可预见条件的适应性有限。近年来,大型时间序列模型的进步展现了解决这些局限的潜力,最先进的深度学习和基础模型在多个领域的时间序列预测中取得了显著成功。尽管如此,这些模型在关键环境系统(如大沼泽地)中的应用仍未被充分探索。本研究通过对大沼泽地水位预测的现实应用,填补了这一空白,考察了六大类中的十二个任务特定模型和五个时间序列基础模型。主要结果表明,基础模型Chronos显著优于其他所有模型,而其余基础模型的表现相对较差。此外,任务特定模型的性能因模型架构的不同而有所变化,研究中讨论了可能的原因。本研究还发现,大型时间序列模型在处理复杂环境数据时具有潜在优势,但其性能受限于模型设计和数据特性。作者希望本研究及其发现能激励学术界进一步探索大型时间序列模型在水文学应用中的适用性。研究代码和数据已公开,供社区参考和进一步研究。本文为水文学领域引入了新的预测工具和视角,对提升水资源管理和生态保护具有重要意义。
时间序列模型水位预测大沼泽地深度学习水文学
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 研究具有重要创新性,为水文学预测引入新工具,可能产生较大影响。

物理尺度的重要性:卷积神经网络在基于卫星的雷暴临近预报中感受野和对流的作用

ArXiv ID: 2504.09994
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Christoph Metzl, Kianusch Vahid Yousefnia, Richard M\"uller, Virginia Poli, Miria Celano, Tobia
📄 中文摘要:
本文研究了在基于卫星的雷暴临近预报中,将对流(advection)方法融入机器学习(ML)模型的价值和普遍性。随着临近预报的发展重心从物理驱动的对流方法转向纯数据驱动的机器学习方法,近期研究表明,将对流机制引入机器学习流程可以提升基于雷达的降水预报技巧。然而,这种方法的普适性及其背后的原因尚未被充分探索。本研究首次将该方法应用于基于卫星的雷暴临近预报,并通过尺度论证解释了技巧提升的时机和原因。核心观点是,对流机制确保了与临近预报相关的雷暴模式在较长预报时间范围内仍能被模型的感受野(receptive field)捕捉到。为验证这一假设,研究团队训练了ResU-Nets模型以解决分割任务,使用闪电观测数据作为地面真实值。基准神经网络(BNN)的输入为多光谱卫星图像和闪电观测的短时间序列,而对流信息神经网络(AINN)额外接收所有输入通道在目标预报时刻的拉格朗日持久性预报结果。研究发现,在全面平均评分下,AINN相较于BNN的技巧提升较小。然而,通过按预报时间和对流速度条件评估技巧,研究证实了尺度论证的正确性,即在预报时间超过2小时后,AINN的技巧开始优于BNN。研究进一步表明,对流的重要性随着预报时间的延长和对流速度的增加而逐渐增强。本文强调了在设计基于机器学习的预报模型时,考虑和融入底层物理尺度的重要性,为未来临近预报模型的优化提供了理论支持和实践指导。
雷暴临近预报卷积神经网络对流机制感受野卫星图像
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 本文创新性地将对流机制引入卫星雷暴预报,具有潜在的领域影响力。

MIBoost:一种用于多重插补后变量选择的梯度提升算法

ArXiv ID: 2507.21807
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Robert Kuchen
📄 中文摘要:
在统计学习领域,自动化变量选择方法如LASSO、弹性网和梯度提升已成为构建强大预测模型的重要工具。然而,在实际分析中,数据缺失问题常常带来挑战。处理缺失数据最常用的方法是多重插补,即创建多个完整数据集。然而,如何在多重插补数据集上进行模型选择仍存在争议。简单策略(如跨数据集合并模型)已被证明性能不佳。虽然存在一些更复杂的方法,但由于实施难度较大,应用并不广泛。相比之下,近期提出的两种方法通过定义单一损失函数,改进了LASSO和弹性网的正则化技术,从而在多重插补中获得统一的回归系数。本研究的关键贡献在于将这一原则扩展到逐分量梯度提升框架,提出了一种新颖算法MIBoost。该算法在多重插补数据集中实现了统一的变量选择机制。模拟研究表明,MIBoost的预测性能与近期提出的方法相当,能够有效处理缺失数据环境下的变量选择问题。本研究不仅为统计学习提供了新的工具,也为处理缺失数据条件下的模型构建提供了理论和实践支持。未来研究可进一步探索MIBoost在大规模数据集和复杂模型中的应用效果,以及与其他方法的综合比较,以验证其在不同场景下的鲁棒性和适用性。
多重插补变量选择梯度提升MIBoost统计学习
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 该研究提出创新算法MIBoost,具有较大潜力影响缺失数据处理领域。

基准水电发电报价曲线

ArXiv ID: 2508.04854
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Jonathan Pearce, Arash Khojaste, Golbon Zakeri, Geoffrey Pritchard
📄 中文摘要:
本文提出了一种用于水电发电定价的数学模型。该模型基于马尔可夫决策过程(Markov Decision Process, MDP),充分考虑了水流入量历史时间序列中的季节性变化特征。通过对水流入量的动态建模,研究能够捕捉水资源可用性的不确定性及其对发电策略的影响。作者设计了一种计算效率高且易于解释的算法,用于生成水电发电的报价曲线(offer curves),从而帮助水电运营商在电力市场中制定合理的竞价策略。研究方法结合了历史数据分析和概率建模,确保了模型在实际应用中的可操作性。关键发现包括:模型能够有效反映水资源季节性波动对发电能力的影响,并通过优化决策过程提高经济效益。此外,该模型还展示了在不同市场条件下的适应性,为水电行业的定价策略提供了新的视角。结论指出,这种方法不仅适用于水电发电的定价问题,还可能推广到其他可再生能源领域,具有一定的普适性。研究为水电运营商在复杂市场环境下的决策提供了科学依据,同时也为未来的能源市场优化研究奠定了基础。
水电发电报价曲线马尔可夫决策过程季节性变化能源定价
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 该研究在水电定价领域具有重要创新,可能对能源市场策略产生较大影响。

非扩展性q参数在构造地震预测中的作用

ArXiv ID: 2508.04932
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Oscar Sotolongo-Costa, Miguel Eduardo Mora-Ramos
📄 中文摘要:
本文研究了非扩展性q参数在构造地震预测中的作用,基于碎片-粗糙度模型,将总Tsallis熵表示为q参数的函数,识别出一个关键值范围:1.4 < q < 1.8。这一范围直接源于构建非扩展熵的假设,即概率分布所依赖的应力承载相互作用的能量与接触表面成正比。研究发现,该q值区间对应于熵的强烈变化,并且包含了近几十年全球主要地震中报告的大多数q参数结果,表明q参数作为地震风险因子的作用。研究指出,尽管这一知识尚不足以制定预测强烈破坏性构造地震发生的具体程序,但它可以作为地震预测和风险评估中的一个重要参考因素。通过对q参数的分析,本文揭示了非扩展性统计力学在地震学中的潜在应用价值,为理解地震发生机制和提高预测精度提供了新的视角。作者强调,虽然目前的研究成果还无法直接用于地震预测的实际操作,但q参数的识别和相关熵变化的研究为未来的地震风险评估模型奠定了理论基础,并可能与其他地震预测方法结合,进一步提升预测能力。研究结论表明,q参数在地震学中的作用值得进一步深入探讨,尤其是在全球不同地震活动区域的适用性和具体影响机制方面。
非扩展性q参数构造地震Tsallis熵地震预测地震风险
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 研究具有重要创新性,对地震预测有潜在影响,值得进一步探索。

识别DEM仿真数据集的最佳回归模型

ArXiv ID: 2508.05308
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: B. D. Jenkins, A. L. Nicusan, A. Neveu, G. Lumay, F. Francqui, J. P. K. Seville, C. R. K. Windows-Yu
📄 中文摘要:
本文研究了从离散元方法(DEM)数据中开发快速回归模型(代理模型/元模型)的重要性,这对于工业应用中的实时评估至关重要。作者指出,在粒子技术领域的回归任务中,不同模型的基准测试常常被忽视,因为模型选择通常不是主要研究重点。这可能导致使用次优模型,进而影响预测精度、评估速度或泛化能力,阻碍有效的实时决策和过程优化。本文讨论了使用k折交叉验证来评估表格型DEM数据集的回归模型,并提出了一种简单的框架,供读者遵循以找到适合其数据的最佳模型。研究通过一个示例展示了该框架的应用,数据集来源于一个简单的测量烧杯中测量的堆积分数,涉及多种粒子间属性,包括平均粒子直径、恢复系数、滑动摩擦系数、滚动阻力系数和内聚能量密度。在测试的16种不同模型中,基于直方图的梯度提升模型被发现是最佳选择,该模型在训练和推理时间上表现可接受,同时提供了良好的拟合效果。研究结果表明,通过系统化的模型选择和评估,可以显著提高DEM数据的预测性能,为工业过程中的实时优化提供支持。作者强调,未来的研究应更加关注模型选择的科学性和系统性,以确保在实际应用中获得最佳性能。
离散元方法回归模型k折交叉验证梯度提升粒子技术
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 本文提出系统化模型选择框架,具有重要创新性,可能对DEM应用领域产生较大影响。

定期评估固定缴款养老金基金:一种动态风险度量方法

ArXiv ID: 2508.05241
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Wanting He, Wenyuan Li, Yunran Wei
📄 中文摘要:
本文提出了一种创新框架,用于定期评估固定缴款养老金基金的绩效。与传统文献不同,本研究不仅在退休时评估养老金基金的表现,还在中间阶段进行定期评估。研究以动态风险度量作为评估标准,动态管理养老金基金的尾部风险。为了有效应对随机环境,本文提出了一种无模型的强化学习算法,用于寻找最优的投资和保险策略。基于美国数据,研究校准了养老金成员的死亡率,并通过Lee-Carter模型改进了死亡率预测。数值结果表明,定期评估会导致更加规避风险的策略,而死亡率的改善则鼓励了更多的风险寻求行为。这一框架为养老金管理提供了新的视角,强调了动态风险管理的重要性,并揭示了死亡率变化对投资策略的影响。研究结果对养老金基金管理者具有指导意义,有助于在不确定性环境中制定更稳健的投资决策,同时也为未来的研究提供了理论基础和实践参考。
养老金基金动态风险度量强化学习死亡率预测投资策略
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 本文提出创新框架,具有重要意义,可能影响养老金管理领域。

gcor:分类基尼相关性的Python实现及其推断

ArXiv ID: 2506.19230
发布日期: 2025-08-08
聚类ID: 聚类 7
📝 作者: Sameera Hewage
📄 中文摘要:
分类基尼相关性(Categorical Gini Correlation, CGC)是一种由Dang等人于2020年提出的新型依赖性度量方法,旨在量化数值变量与分类变量之间的关联性。相比现有的依赖性度量方法,CGC具有一些吸引人的特性,例如零相关性意味着变量之间的相互独立性。此外,在应用于分类问题的特征筛选时,CGC表现出比现有方法更优越的性能。本文介绍了一种用于计算CGC、构建置信区间以及基于CGC进行独立性检验的Python实现。为了提高计算效率,文中对所有相关程序采用了高效算法,并通过向量化与并行化技术进行了优化。研究背景方面,CGC的提出填补了数值变量与分类变量关联性度量领域的空白,为数据分析和特征选择提供了新的工具。方法上,作者开发了一个Python库,实现了CGC的计算及其统计推断功能,包括置信区间估计和假设检验,确保了算法的高效性和实用性。关键发现表明,该实现能够在处理大规模数据集时显著提升计算速度,同时保持结果的准确性。作者还通过实验验证了该方法在特征筛选任务中的有效性,特别是在分类问题中,CGC能够更精准地识别重要特征。结论指出,这一Python实现为研究人员和从业者提供了一个便捷且高效的工具,有助于推动数据驱动的决策和研究工作,尤其是在机器学习和统计分析领域。未来工作可以进一步扩展CGC的应用场景,探索其在更多复杂数据类型中的表现。
分类基尼相关性依赖性度量特征筛选Python实现数据分析
⭐ 重要性评分: 7/10 查看原文
🤖 AI评价: 该研究在数据分析领域具有重要创新性,可能对特征选择产生较大影响。