← 返回总览
22
论文总数
22
高分论文
8.0
平均评分
5
关键词数
建议、补充、启发:Allegro.com 双塔推荐系统的故事
📝 作者: Aleksandra Osowska-Kurczab, Klaudia Nazarko, Mateusz Marzec, Lidia Wojciechowska, Eli\v{s}ka Kreme\v
📄 中文摘要:
本文介绍了在欧洲最大的电子商务平台Allegro.com上部署的统一内容推荐系统,重点解决大规模电子商务推荐系统中的三大技术挑战:设计跨数十个推荐位置的通用架构、降低高昂的维护成本以及管理高度动态的产品目录。研究基于广泛应用的双塔(Two Tower)检索框架,通过文本和结构化属性表示产品,并结合近似最近邻(ANN)搜索实现高效检索。作者展示了如何通过仅修改模型或服务逻辑中的少量组件,将同一模型架构适应于三种不同的推荐任务:相似性搜索、补充产品建议和启发性内容发现。具体而言,相似性双塔(Similarity-TT)用于检索替代或相似产品,补充双塔(Complementary-TT)通过修改查询塔和引入补充类别映射推荐互补产品,而启发性双塔(Inspirational-TT)通过分层ANN索引和用户浏览历史聚合提供多样化的个性化建议。两年的广泛A/B测试结果表明,该系统在桌面和移动应用渠道的用户参与度和基于利润的指标上均取得了显著提升。研究表明,灵活且可扩展的架构能够在最小的维护成本下服务于多样化的用户意图。作者还指出,系统性能依赖于内容特征的质量,未来工作将探索将用户上下文集成到模型中并评估其生产影响。
推荐系统大规模检索补充推荐多样化推荐电子商务
大语言模型驱动的推荐系统的隐私风险:逆向攻击视角
📝 作者: Yubo Wang, Min Tang, Nuo Shen, Shujie Cui, Weiqing Wang
📄 中文摘要:
本文系统性地研究了大语言模型(LLM)驱动的推荐系统(RecSys)在隐私保护方面的脆弱性,特别关注逆向攻击(Inversion Attack)对系统和用户隐私的威胁。研究背景指出,传统推荐系统在处理冷启动用户或新项目时存在局限性,而LLM驱动的推荐系统通过语义理解和泛化能力显著提升了推荐性能。然而,这种方法也引入了新的隐私风险,攻击者可能通过模型输出的logits重建包含用户偏好、交互历史和人口统计属性的原始提示。本文提出了一种优化的逆向攻击框架,结合vec2text方法和相似性引导的精炼策略(Similarity-Guided Refinement),通过束搜索生成候选提示并迭代选择与目标logits余弦相似度最高的提示,从而提高重建精度。在电影和书籍两个领域、两种代表性LLM推荐模型上的广泛实验表明,该方法能够高保真地重建用户提示,恢复近65%的用户交互项目,并以87%的准确率推断用户的年龄和性别。研究还发现,隐私泄露对目标模型的推荐性能不敏感,但高度依赖领域一致性和提示复杂性。结论指出,LLM驱动的推荐系统存在严重的隐私漏洞,亟需开发防御策略以减轻提示逆向攻击的风险。
推荐系统大语言模型隐私风险逆向攻击用户提示重建
评估生成式人工智能工具在个性化离线推荐中的应用:一项比较研究
📝 作者: Rafael Salinas-Buestan, Otto Parra, Nelly Condori-Fernandez, Maria Fernanda Granda
📄 中文摘要:
本研究探讨了生成式人工智能(GenAI)工具在个性化离线推荐领域的应用,特别是在针对软件开发者等高风险群体预防重复性劳损(RSI)方面的潜力。研究背景聚焦于RSI作为软件开发者中常见的职业健康问题,传统预防措施如静态人体工学检查和定时休息提醒因缺乏个性化和用户参与度而效果有限。本文通过比较五种广泛使用的GenAI工具(Gemini、Phi-4、Mistral、Qwen 2.5和LLaMA 3.2),评估其在生成非数字化活动推荐时的性能和用户满意度。研究方法基于目标/问题/指标(GQM)范式,结合定量指标(如精确率、召回率、F1分数和MCC分数)与定性反馈(如用户满意度和情感响应)进行评估。研究设计包括80名计算机科学学生的实验,采用用户画像驱动的场景生成个性化推荐,并通过专家评估和用户反馈验证推荐的相关性。关键研究问题包括:哪种GenAI工具提供最相关的离线活动推荐,以及工具选择如何影响用户满意度。研究尚未完成数据收集,但预期结果将揭示不同工具在推荐质量和用户体验方面的差异,为以人为本的软件工程提供新见解。结论部分强调了GenAI在支持软件开发者身心健康方面的潜力,并指出了性能与用户满意度之间的权衡问题。本研究为健康相关干预中的个性化推荐系统开辟了新方向,尤其是在RSI预防领域具有创新意义。
生成式人工智能推荐系统重复性劳损用户满意度离线干预
与用户共同推荐,而非为用户推荐:为社会福祉共同设计推荐系统
📝 作者: Michael D. Ekstrand, Afsaneh Razi, Aleksandra Sarcevic, Maria Soledad Pera, Robin Burke, Katherine L
📄 中文摘要:
本研究探讨了推荐系统在促进社会福祉方面的设计与评估方法,提出了一种新的设计理念——参与式推荐(Participatory Recommendation)。研究背景指出,传统的推荐系统设计主要由工程师和研究人员主导,用户的参与仅限于用户研究或测试阶段,缺乏对系统设计和评估的实质性影响。这种设计方式往往反映了设计者的社会目标,而非用户的真实需求或价值观,可能导致系统偏离社会福祉目标或产生负面影响。为此,作者主张推荐系统应与用户、内容提供者及其他利益相关者共同设计,而不仅仅是为他们设计。研究方法基于参与式设计(Participatory Design, PD)和共同设计(Co-Design)原则,强调在系统设计、评估和持续监控的各个阶段,与利益相关者建立权力共享的合作关系,确保系统目标和价值观源于受影响的社区。关键发现包括:通过参与式方法,推荐系统可以更好地服务于个体和社会福祉,例如在公平多方市场、社交媒体安全和教育资源推荐等领域的应用案例表明,用户的直接参与有助于识别潜在危害、定义公平性标准并设计更符合实际需求的系统。作者还指出了实现参与式推荐的挑战,包括技术、组织和政治层面的障碍,并提出了未来研究方向,如开发支持非专家参与的评估工具和低数据需求的推荐技术。结论强调,参与式推荐不仅是方法论的转变,也是对设计权力分配的政治承诺,旨在构建真正赋能社区的推荐系统,避免传统设计中可能出现的家长式或有害结果。
参与式设计推荐系统社会福祉共同设计用户参与
二维稀疏并行性在大规模深度学习推荐模型训练中的应用
📝 作者: Xin Zhang, Quanyu Zhu, Liangbei Xu, Zain Huda, Wang Zhou, Jin Fang, Dennis van der Staay, Yuxi Hu, J
📄 中文摘要:
随着深度学习推荐模型(DLRM)复杂性的不断增加,大规模分布式训练系统的需求日益迫切。DLRM中的稀疏嵌入表是处理稀疏分类特征的关键组件,通常包含数万亿参数,内存需求巨大,传统模型并行策略在扩展至大规模GPU集群时面临显著的挑战,包括负载不平衡、通信开销大以及嵌入激活内存占用过高等问题。为解决这些问题,本文提出了一种新颖的二维稀疏并行性(2D Sparse Parallelism)方法。该方法在模型并行性基础上引入数据并行性,将GPU分为多个并行组,每组维护嵌入表的完整副本,从而减少了全对全通信的开销并降低了峰值内存消耗。此外,针对训练范式转变导致的性能损失,作者开发了动量缩放的行级AdaGrad算法(Momentum-Scaled Row-wise AdaGrad),通过调整有效学习率来维持模型性能。通过广泛的实验验证,该方法在保持模型性能的同时显著提升了训练效率,在高达4000个GPU的规模上实现了近线性训练速度扩展,刷新了推荐模型训练的最新基准。本研究不仅解决了大规模分布式训练中的关键瓶颈,还为工业级推荐系统的训练提供了高效解决方案,具有重要的应用价值。
深度学习推荐模型二维稀疏并行性大规模分布式训练嵌入表AdaGrad算法
推荐系统的稳定性和可塑性测量
📝 作者: Maria Jo\~ao Lavoura, Robert Jungnickel, Jo\~ao Vinagre
📄 中文摘要:
本文提出了一种评估推荐系统模型稳定性和可塑性的新方法框架,旨在解决传统离线评估协议无法捕捉模型随时间演变的能力的问题。研究背景源于学习系统中的稳定性-可塑性困境,即模型在保留过去模式(稳定性)和适应新变化(可塑性)之间的权衡。作者设计了一种与数据集、算法和评估指标无关的离线评估协议,通过引入人工数据变化模拟现实世界中的模式转变,并分别训练基于旧数据和新数据的模型,测量模型在不同数据环境下的表现差异。具体方法包括将数据集分为两个时序子集,通过改变部分项目标识制造数据变化,并定义稳定性和可塑性指标来量化模型的表现。实验在GoodReads数据集上测试了三种不同类型的推荐算法(基于用户的KNN、贝叶斯个性化排序矩阵分解和神经矩阵分解),初步结果显示不同算法在稳定性和可塑性上存在显著差异,例如KNN表现出较高的稳定性但较低的可塑性,而矩阵分解方法在可塑性上更优,暗示两者之间可能存在权衡关系。结论指出,该框架能够系统性地揭示推荐模型的长期动态行为,尽管仍需更多实验验证假设和扩展应用场景,但已展现出深入理解模型特性的潜力。未来工作将包括更多数据集和算法的测试,以及扩展到准确性之外的指标如覆盖率、多样性和公平性。
推荐系统稳定性可塑性评估框架长期动态
通过构建动态用户知识图谱与大语言模型增强意外推荐系统
📝 作者: Qian Yong, Yanhui Li, Jialiang Shi, Yaguang Dou, Tian Qi
📄 中文摘要:
本文针对工业推荐系统中由于反馈循环导致的过滤气泡效应,提出了一种利用大语言模型(LLMs)动态构建用户知识图谱以增强意外推荐(serendipity recommendation)的方法。研究背景在于传统推荐系统因“系统推荐→用户反馈→系统再推荐”的循环机制,易导致推荐内容同质化,降低用户满意度。作者提出了一种两阶段框架:第一阶段为双跳兴趣推理,利用用户静态画像和历史行为,通过大语言模型动态构建用户知识图谱,并在图谱上执行双跳推理以识别用户的潜在兴趣;第二阶段为近线适应,通过近线缓存用户兴趣解决大语言模型在线服务延迟问题,并设计了一种结合用户-物品(u2i)和物品-物品(i2i)检索能力的双塔检索模型,确保推荐结果既与用户新兴趣高度相关,又保持较高的转化率。此外,引入多智能体辩论机制以提高推理结果的准确性和相关性。实验在得物App(拥有数千万用户)上进行,离线评估显示96%的用户潜在兴趣评分达到最高分2分;在线A/B测试表明,该方法使曝光新颖率提升4.62%,点击新颖率提升4.85%,人均浏览时长增加0.15%,独立访客点击率和互动渗透率分别提高0.07%和0.30%。研究结论表明,该方法有效打破了过滤气泡,提升了用户体验,并展示了在大规模工业推荐系统中部署大语言模型的潜力。未来工作将探索更多用户行为数据的整合及兴趣生成的相关性优化。
意外推荐大语言模型知识图谱双跳推理过滤气泡
从丰富中获益:解决搜索增强推荐中的搜索交互稀疏问题
📝 作者: Teng Shi, Weijie Yu, Xiao Zhang, Ming He, Jianping Fan, Jun Xu
📄 中文摘要:
本文针对搜索增强推荐(Search-Enhanced Recommendation, S&R)中搜索交互数据稀疏的问题,提出了一种创新方法GSERec。研究背景在于现代在线平台中搜索与推荐服务并存,现有方法通过引入搜索信号提升推荐性能,但其效果高度依赖于丰富的搜索交互数据,对于搜索行为稀疏的大多数用户改进有限。作者识别出两个关键挑战:如何为搜索交互稀疏的用户学习有用的搜索特征,以及如何在稀疏条件下设计有效的训练目标。为此,作者提出利用搜索交互丰富的用户特征来增强稀疏用户的表示,基于此理念开发了GSERec方法。该方法通过构建用户-代码图(User-Code Graphs)并进行消息传递,缓解数据稀疏问题。具体而言,利用大型语言模型(LLMs)结合向量量化生成离散代码,连接相似用户并构建图结构,通过图上的消息传递将丰富搜索数据的用户嵌入传播到稀疏用户,增强其表示。此外,引入对比损失以更好地建模用户相似性,确保消息传递捕捉到有意义的信息。最终,增强后的用户表示被整合到下游搜索增强推荐模型中。实验在三个真实世界数据集(Amazon CDs、Electronics和Qilin)上进行,结果表明GSERec在所有数据集上均优于基线方法,尤其对搜索交互稀疏的用户表现出显著改进,验证了其在缓解数据稀疏问题上的有效性。作者还通过消融研究和可视化分析进一步确认了各模块的作用,强调了用户-代码图和对比学习在提升稀疏用户表示质量中的重要性。结论指出,GSERec为搜索增强推荐提供了一种有效解决方案,对推荐系统的性能提升具有重要意义。
搜索增强推荐数据稀疏用户-代码图消息传递大型语言模型
通过潜在交叉推理桥接搜索与推荐
📝 作者: Teng Shi, Weicong Qin, Weijie Yu, Xiao Zhang, Ming He, Jianping Fan, Jun Xu
📄 中文摘要:
本文针对搜索与推荐(S&R)系统中有效利用搜索行为提升推荐性能的挑战,提出了一种基于潜在交叉推理(Latent Cross Reasoning, LCR)的框架LCR-SER。研究背景源于现有方法在联合建模搜索和推荐历史时,未能明确区分哪些搜索行为对推荐真正有益,导致噪声干扰推荐效果。受人类决策过程中先识别意图再推理相关证据的启发,本文设计了一种两阶段方法:首先分别编码用户的搜索和推荐历史以捕捉全局兴趣,随后通过迭代推理逐步提取对推荐有益的搜索信号。框架采用交叉注意力机制实现搜索与推荐行为间的互补信息整合,并引入对比学习使潜在推理状态与目标物品对齐,同时结合基于GRPO的强化学习直接优化排序性能。实验在多个公开数据集(如Qilin和KuaiSAR)上进行,结果表明LCR-SER在推荐性能上显著优于传统推荐模型和搜索增强推荐基线,验证了推理机制在提升搜索感知推荐中的重要性。研究还通过消融实验和分析进一步揭示了各模块(如潜在交叉推理、目标感知聚合、对比学习和强化学习)的贡献,表明推理步骤的增加使隐藏表示更接近目标物品,但需平衡推理深度以避免过度思考。此外,推理延迟的增加被证明是可接受的,且可以通过离线预计算历史行为结果来减少在线开销。总之,本文为搜索增强推荐提供了一种创新方法,通过选择性提取相关信号显著提升了推荐效果。
推荐系统搜索增强潜在推理对比学习强化学习
ViLLA-MMBench:用于LLM增强的多模态电影推荐的统一基准套件
📝 作者: Fatemeh Nazary, Ali Tourani, Yashar Deldjoo, Tommaso Di Noia
📄 中文摘要:
本文介绍了ViLLA-MMBench,一个面向下一代大型语言模型(LLM)增强的多模态电影推荐研究的统一基准套件。研究背景源于长篇视频内容推荐的复杂性,传统方法往往忽略内容特征或仅采用单一融合策略,且缺乏透明度和可重复性。ViLLA-MMBench基于MovieLens和MMTF-14K数据集,整合了视觉、音频和文本三种模态的密集嵌入,并利用先进的LLM(如OpenAI GPT Ada模型)自动增强缺失或稀疏的项目元数据,生成数千部电影的高质量概要。文本数据通过多种可配置的密集编码器(如OpenAI Ada、LLaMA-2、Sentence-T5)生成嵌入。此外,该工具支持早、中、晚期融合操作(如拼接、PCA、CCA、排名聚合)以及多种推荐算法(如矩阵分解、变分自编码器协同过滤、VBPR、AMR、VMF),通过YAML文件声明实验参数,实现透明和版本化的实验设置。评估指标不仅包括准确性(Recall、nDCG),还涵盖冷启动率、覆盖率、新颖性、多样性和公平性等多维度指标。实验结果表明,基于LLM的文本增强和密集嵌入提取显著提升了冷启动和覆盖性能,尤其是在将强文本表示与视听描述符融合时。系统性基准测试揭示了哪些嵌入和融合组合具有普适性,哪些则依赖于特定模型或指标。ViLLA-MMBench提供开源代码、嵌入和配置模板,为多模态推荐系统的可重复、可扩展和公平比较奠定了坚实基础,并在生成式AI与大规模电影推荐的整合方面迈出了重要一步。
多模态推荐大型语言模型电影推荐融合策略基准测试
离散事件张量分解:为连续域学习平滑嵌入
📝 作者: Joey De Pauw, Bart Goethals
📄 中文摘要:
本文研究了推荐系统如何通过用户过去的行为数据来预测未来的用户偏好。研究指出,最近的交互行为比较早的交互更能反映用户未来的偏好。传统的推荐算法通常通过丢弃较旧的交互数据或降低其权重来强调近期信息的重要性,以便模型能够更关注信息量更大的近期数据。然而,很少有方法明确地对时间流逝进行建模。本文提出了一种离散事件张量分解方法,旨在为连续时间域学习平滑嵌入。通过将时间作为连续变量纳入模型,本方法能够捕捉用户行为随时间变化的动态特性,并在推荐系统中实现更精确的预测。研究中,作者设计了一种新颖的张量分解框架,结合了离散事件数据和时间连续性,克服了传统方法在处理时间维度时的局限性。实验结果表明,该方法在多个公开数据集上显著优于现有的推荐算法,尤其是在预测用户未来偏好时表现出更高的准确性和鲁棒性。此外,本文还探讨了时间建模对推荐系统性能的影响,揭示了时间动态在用户行为预测中的关键作用。结论指出,显式时间建模不仅提升了推荐系统的性能,还为理解用户行为的长期演变提供了新的视角。未来研究可以进一步扩展该框架,探索更多复杂的时间依赖模式,以应对动态环境下的推荐挑战。
推荐系统张量分解时间建模用户偏好平滑嵌入
推荐系统是否真正利用了多模态内容?多模态表示在推荐中的全面分析
📝 作者: Claudio Pomo, Matteo Attimonelli, Danilo Danese, Fedelucio Narducci, Tommaso Di Noia
📄 中文摘要:
多模态推荐系统通过整合异构内容(如图像和文本元数据)来提升推荐精度。尽管其效果显著,但目前尚不清楚其性能提升是源于真正的多模态理解,还是仅仅由于模型复杂性的增加。本研究深入探讨了多模态项目嵌入的作用,重点关注表示的语义信息量。初步实验表明,使用标准提取器(如ResNet50、Sentence-Bert)生成的嵌入能够提升性能,但这些方法依赖于特定模态的编码器和临时融合策略,缺乏对跨模态对齐的控制。为了解决这一局限性,本研究利用大型视觉-语言模型(LVLMs)通过结构化提示生成设计上的多模态嵌入。这种方法无需任何融合即可生成语义对齐的表示。跨多种设置的实验显示出显著的性能改进。此外,LVLMs嵌入具有独特优势:它们可以解码为结构化的文本描述,从而直接评估其多模态理解能力。当这些描述作为辅助内容融入推荐系统时,推荐性能得到进一步提升,实证验证了LVLMs输出中编码的语义深度和对齐性。本研究强调了语义丰富表示的重要性,并将LVLMs定位为构建推荐任务中稳健且有意义的多模态表示的强大基础。通过对多模态内容在推荐系统中的作用进行全面分析,本文为未来研究提供了新的视角和方法论支持,特别是在如何有效利用多模态数据以提升推荐效果方面。
多模态推荐系统大型视觉-语言模型语义对齐项目嵌入推荐性能
HiD-VAE:通过分层和解耦语义ID实现可解释的生成推荐
📝 作者: Dengzhao Fang, Jingtong Gao, Chengcheng Zhu, Yu Li, Xiangyu Zhao, Yi Chang
📄 中文摘要:
推荐系统在帮助用户浏览现代在线平台海量物品目录中发挥着不可或缺的作用。近年来,生成推荐作为一种新兴范式,统一了传统的检索与排序流程,形成了能够动态生成的端到端模型。然而,现有的生成方法受到无监督分词的根本限制,导致生成的语义ID存在两个关键缺陷:一是语义平坦且不可解释,缺乏连贯的层次结构;二是容易出现表示纠缠(即‘ID冲突’),这损害了推荐的准确性和多样性。为解决这些问题,本文提出了HiD-VAE,一种通过两个核心创新学习分层解耦物品表示的新框架。首先,HiD-VAE开创了一种分层监督量化过程,将离散代码与多层次物品标签对齐,生成更均匀且解耦的ID。关键在于,训练后的代码簿能够预测分层标签,为每次推荐提供可追踪且可解释的语义路径。其次,为解决表示纠缠问题,HiD-VAE引入了一种新颖的唯一性损失,直接惩罚潜在空间的重叠。这种机制不仅解决了关键的ID冲突问题,还通过确保更全面地利用物品表示空间来提升推荐多样性。这些高质量、解耦的ID为下游生成模型提供了强大的基础。在三个公开基准数据集上的广泛实验验证了HiD-VAE相较于最先进方法的优越性能。本研究为生成推荐领域提供了重要的技术进步,特别是在提升推荐系统的可解释性和多样性方面具有显著价值。
生成推荐分层解耦语义ID推荐系统可解释性
基于生成模型的推荐系统研究
📝 作者: Yashar Deldjoo, Zhankui He, Julian McAuley, Anton Korikov, Scott Sanner, Arnau Ramisa, Rene Vidal, M
📄 中文摘要:
生成模型是一类人工智能模型,通过学习数据的统计分布并从中采样,能够生成新的数据实例。近年来,随着生成对抗网络(GAN)、变分自编码器(VAE)以及基于Transformer的架构(如GPT)等方法的快速发展,生成模型在机器学习领域中获得了显著关注。这些模型在图像生成、文本合成和音乐创作等多个领域展现了广泛的应用前景。在推荐系统领域,生成模型(称为Gen-RecSys)通过生成结构化输出、基于文本的交互以及多媒体内容,显著提升了推荐的准确性和多样性。Gen-RecSys利用生成模型的能力,能够为用户提供更加个性化、引人入胜且动态的使用体验,从而扩展了人工智能在电子商务、媒体等领域的应用角色。本研究详细探讨了生成模型在推荐系统中的应用背景,分析了其主要方法,包括如何通过生成技术解决传统推荐系统中的冷启动问题和数据稀疏性问题。研究还指出了生成模型在提升用户交互体验方面的关键优势,例如通过生成自然语言描述或个性化内容来增强用户参与度。最终,本文总结了生成模型在推荐系统中的潜力,并展望了未来可能的研究方向,如如何进一步优化模型的计算效率和生成内容的质量,以适应更大规模的实际应用场景。研究表明,Gen-RecSys不仅提升了推荐系统的性能,还有望在多个行业中推动人工智能技术的深入应用。
生成模型推荐系统机器学习个性化推荐人工智能
设备端推荐系统:一项全面综述
📝 作者: Hongzhi Yin, Liang Qu, Tong Chen, Wei Yuan, Ruiqi Zheng, Jing Long, Xin Xia, Yuhui Shi, Chengqi Zhan
📄 中文摘要:
推荐系统在众多现实应用中被广泛部署,帮助用户从海量信息中找到感兴趣的内容。传统的推荐系统通过在云端数据中心收集用户-项目交互数据并训练集中式模型来提供推荐服务。然而,这种基于云的推荐系统(CloudRSs)不可避免地面临资源消耗过大、响应延迟以及数据和模型的隐私与安全风险等问题。近年来,随着边缘设备在存储、通信和计算能力方面的进步,研究焦点从CloudRSs转向了设备端推荐系统(DeviceRSs)。DeviceRSs利用边缘设备的能力,减少对集中式数据存储的需求,降低通信开销导致的响应延迟,并通过本地化数据处理和模型训练增强用户隐私和安全性。尽管DeviceRSs发展迅速,但目前缺乏系统性介绍、分类和对比这些方法的及时文献综述。为了填补这一空白,本文对DeviceRSs进行了全面综述,涵盖三个主要方面:(1)DeviceRSs的部署与推理;(2)DeviceRSs的训练与更新;(3)DeviceRSs的安全性与隐私保护。此外,本文对每个方面涉及的方法进行了细粒度和系统性的分类,并讨论了相关挑战和未来研究方向。这是首篇全面综述DeviceRSs的文献,覆盖了满足不同需求的多种任务。本文旨在帮助读者有效了解该领域当前研究现状,掌握相关技术基础,并激发开发DeviceRSs的新研究思路。
设备端推荐系统边缘计算用户隐私响应延迟模型训练
Paragon:可控多任务推荐的参数生成方法
📝 作者: Chenglei Shen, Jiahao Zhao, Xiao Zhang, Weijie Yu, Ming He, Jianping Fan
📄 中文摘要:
商业推荐系统面临任务需求动态变化的挑战,例如平台或用户对准确性或多样性的偏好不断调整。理想情况下,模型应在重设目标函数后重新训练以适应这些变化,但实际中,重新训练的高计算成本使得这一过程在在线环境中不可行。因此,如何在部署后通过控制模型参数高效适应不同任务需求,而无需重新训练,成为一个新的挑战。为解决这一问题,本文提出了一种新颖的可控学习方法——Paragon(参数生成用于可控多任务推荐)。该方法允许在不重新训练的情况下,根据新的任务需求定制和调整推荐模型参数。具体而言,首先通过适配器调优基于可行的任务需求获取优化后的模型参数;随后,利用生成模型作为参数生成器,采用无分类器指导的条件训练方法,学习在不同任务需求下优化模型参数的分布;最后,在测试时适应性地应用参数生成器,根据任务需求高效生成模型参数。此外,Paragon能够与多种现有推荐模型无缝集成,提升其可控性。在两个公开数据集和一个商业数据集上的广泛实验表明,Paragon能够高效生成模型参数以替代重新训练,计算时间至少减少了94.6%。该方法为推荐系统的动态适应提供了创新解决方案,具有显著的实用价值和潜在的应用前景。
推荐系统参数生成可控学习多任务推荐动态适应
利用大型语言模型进行群体兴趣点推荐
📝 作者: Jing Long, Liang Qu, Junliang Yu, Tong Chen, Quoc Viet Hung Nguyen, Hongzhi Yin
📄 中文摘要:
随着基于位置的社交网络(LBSNs)的快速发展,兴趣点(POI)推荐系统在提升用户体验方面的重要性日益凸显。传统的个体POI推荐方法通过分析用户的签到历史提供个性化建议,但难以应对需要群体决策的场景。群体POI推荐系统旨在满足多用户的集体偏好,然而现有方法面临两大挑战:群体偏好的多样性以及群体签到数据的极端稀疏性。为解决这些问题,本文提出了一种新颖的框架LLMGPR,利用大型语言模型(LLMs)进行群体POI推荐。LLMGPR引入了语义增强的POI标记,并结合丰富的上下文信息来建模群体决策的多样性和复杂动态。为了进一步提升性能,研究团队开发了一种基于量化低秩适应(QLoRA)的序列适配器,将LLMs与群体POI推荐任务对齐。针对群体签到数据稀疏的问题,LLMGPR采用聚合适配器将个体表征整合为有意义的群体表征。此外,设计了一种自监督学习(SSL)任务,用于预测签到序列的目的(如商务旅行或家庭度假),从而为群体表征注入更深层次的语义洞察。大量实验验证了LLMGPR的有效性,展示了其在显著提升群体POI推荐的准确性和鲁棒性方面的能力。研究结果表明,LLMGPR在处理群体决策的复杂性和数据稀疏性问题上具有显著优势,为基于位置的推荐系统提供了新的研究方向和应用潜力。
大型语言模型群体兴趣点推荐基于位置的社交网络数据稀疏性自监督学习
GraphRAG诱导的双重知识结构图在个性化学习路径推荐中的应用
📝 作者: Xinghe Cheng, Zihan Zhang, Jiapu Wang, Liangda Fang, Chaobo He, Quanlong Guan, Shirui Pan, Weiqi Luo
📄 中文摘要:
学习路径推荐旨在为学习者提供结构化的学习项目序列(如知识概念或练习),以优化学习效率。尽管该领域已有诸多研究,但现有方法主要依赖于知识概念之间的先决关系,存在两大局限:1)先决关系的获取需要专家标注,成本高昂,限制了当前学习路径推荐方法的应用;2)基于先决关系的单一、顺序依赖的知识结构意味着学习过程中的任何阶段性困难都可能导致学习阻塞,进而影响后续学习过程。为解决这些问题,本文提出了一种新颖的方法——GraphRAG诱导的双重知识结构图个性化学习路径推荐(KnowLP)。该方法通过结合知识概念之间的先决关系和相似关系,增强了学习路径推荐的效果。具体而言,本文引入了一个知识概念结构图生成模块EDU-GraphRAG,能够自适应地为不同教育数据集构建知识概念结构图,显著提升了学习路径推荐方法的泛化能力。此外,提出了一种基于区分学习的强化学习(DLRL)模块,有效缓解了学习路径阻塞问题,进一步提升了推荐效果。最后,在三个基准数据集上进行的广泛实验表明,该方法不仅取得了最先进的性能,还为推荐的学习路径提供了可解释的推理依据。这一研究为个性化教育推荐系统的发展提供了新的视角和方法,具有重要的理论和实践意义。
学习路径推荐知识结构图个性化教育强化学习GraphRAG
基于大语言模型重排序与多数投票增强的图推荐系统改进
📝 作者: Minh-Anh Nguyen, Bao Nguyen, Ha Lan N. T., Tuan Anh Hoang, Duc-Trong Le, Dung D. Le
📄 中文摘要:
推荐系统常常因用户-物品交互数据的稀疏性而性能下降,并在现实场景中加剧了流行度偏差的问题。本文提出了一种新颖的数据增强框架,利用大语言模型(LLMs)和物品的文本描述来丰富交互数据。通过对LLMs进行多次少样本提示以对物品进行重排序,并通过多数投票机制聚合结果,本研究生成了高置信度的合成用户-物品交互数据,并基于测量集中的理论提供了保障。为了在图推荐系统的背景下有效利用增强数据,本文将其集成到图对比学习框架中,以缓解分布偏移并减轻流行度偏差。大量实验表明,该方法在提升推荐准确性的同时显著降低了流行度偏差,优于多个强有力的基线模型。研究背景方面,数据稀疏性是推荐系统面临的核心挑战之一,尤其是在冷启动场景下,传统的推荐算法往往难以提供准确的个性化推荐。本文的方法通过引入外部知识(物品文本描述)和LLMs的强大语义理解能力,弥补了交互数据的不足。主要方法包括:利用LLMs生成潜在的用户偏好排序,结合多数投票确保生成数据的可靠性,以及通过图对比学习优化模型对增强数据的适应性。关键发现是,增强数据不仅提升了推荐系统的整体性能,还在长尾物品推荐中表现出色,有效缓解了流行度偏差问题。结论指出,该框架为解决推荐系统中的数据稀疏性问题提供了一种创新且实用的解决方案,未来可进一步探索LLMs在其他推荐场景中的应用潜力。
推荐系统大语言模型数据增强图对比学习流行度偏差
对话推荐系统用户体验评估:传统方法与基于大语言模型方法的系统综述
📝 作者: Raj Mahmud, Yufeng Wu, Abdullah Bin Sawad, Shlomo Berkovsky, Mukesh Prasad, A. Baki Kocaballi
📄 中文摘要:
对话推荐系统(CRSs)近年来在多个领域内受到越来越多的研究关注,然而对其用户体验(UX)的评估仍显不足。现有的综述大多忽略了针对适应性系统及基于大语言模型(LLM)的CRSs的实证UX研究。为填补这一空白,本研究依据PRISMA指南进行系统综述,综合分析了2017年至2025年间发表的23项实证研究,探讨了UX的概念化、测量方式以及领域、适应性和LLM对UX的影响。研究发现,当前UX评估存在持续性局限:评估多依赖事后调查,缺乏对交互回合层面的情感UX构建的关注,且适应性行为与UX结果之间的关联研究较少。基于LLM的CRSs带来了额外挑战,如知识不透明性和冗长表达,但相关评估很少涉及这些问题。本研究贡献了UX指标的结构化综合、适应性与非适应性系统的比较分析,以及面向LLM的UX评估的前瞻性议程。这些发现为开发更透明、引人入胜且以用户为中心的CRSs评估实践提供了支持。研究强调了未来在评估方法上的改进方向,特别是在结合LLM技术时需更加关注用户体验的动态性和透明性,以提升系统的实用性和用户满意度。
对话推荐系统用户体验大语言模型适应性系统系统综述
通过场内-场外图进行Pinterest广告的实体表示学习
📝 作者: Jiayin Jin, Zhimeng Pan, Yang Tang, Jiarui Feng, Kungang Li, Chongyuan Xiang, Jiacheng Li, Runze Su,
📄 中文摘要:
本文研究了如何通过图神经网络(GNN)提升Pinterest广告推荐系统的性能。传统的GNN模型,如GraphSage、TwHIM和LiGNN,主要基于用户在平台上的场内活动构建图结构并学习节点嵌入。然而,用户在场外的转化行为对于捕捉其购物兴趣同样至关重要。为此,作者构建了一个大规模异构图,结合用户的场内广告互动和自愿提供的场外转化数据,以探索场内与场外活动之间的联系。此外,作者提出了一种新的知识图谱嵌入(KGE)模型TransRA(基于TransR并引入锚点),以更高效地将图嵌入集成到广告排序模型中。初期尝试直接将KGE嵌入广告排序模型时效果有限,仅在离线实验中观察到微小提升。为解决这一问题,作者采用了大规模ID嵌入表技术,并创新了一种基于注意力的KGE微调方法,最终在点击率(CTR)和转化率(CVR)预测模型中实现了显著的AUC提升。该框架已部署于Pinterest的广告参与模型中,实现了2.69%的CTR提升和1.34%的CPC(每次点击成本)降低。作者认为,本文提出的技术可为其他大规模工业模型提供借鉴,具有广泛的应用潜力。
图神经网络知识图谱嵌入广告推荐系统场内场外数据点击率预测
基于算法特征元学习的推荐系统算法选择
📝 作者: Jarne Mathi Decker, Joeran Beel
📄 中文摘要:
推荐系统中算法选择问题——为特定用户或情境选择最佳算法——仍然是一个重大挑战。传统的元学习方法通常将算法视为分类选项,忽略了算法的内在特性。近期研究表明,通过特征明确表征算法可以在其他领域提升模型性能。在此基础上,本文提出了一种基于用户的元学习方法,用于推荐系统的算法选择。该方法结合了用户元特征和从源代码中自动提取的算法特征。初步结果显示,在六个多样化数据集上的平均表现中,将算法特征加入元学习器后,模型的平均NDCG@10性能从0.135(仅用户特征)提升至0.147,增幅达8.83%。这一增强模型超越了单一最佳算法基线(0.131),并成功缩小了与理论最优选择器性能差距的10.5%。研究发现表明,即使是静态源代码度量也能提供有价值的预测信号,为构建更健壮和智能的推荐系统提供了有前景的方向。本文通过结合算法特征和用户特征,探索了算法选择的新路径,展示了算法内在特性在提升推荐系统性能中的潜力。未来的研究可以进一步扩展算法特征的提取方法,优化元学习模型,以实现更精准的算法选择,从而提升推荐系统的整体效能。
推荐系统算法选择元学习算法特征用户特征