推荐算法

缘起

如果说数学是所有学科王冠上的明珠，那么推荐算法就是软件领域的明珠；在众多的商业模式中，通过推荐算法提升业务转化，亚马逊35%订单来自商品推荐，重要地位可见一斑。

推荐系统（有时将“系统”为平台或引擎）是信息过滤系统的一个子类，旨在预测用户对推荐目的“评级”或“偏好”。

推荐系统应用于各种领域，包括电影、音乐、新闻、书籍、研究文章、搜索查询、社交标签和一般产品。还有专家推荐系统，作者，笑话、餐馆、服装、金融服务，保险、在线约会等。

推荐系统通常以两种方式之一生成推荐列表-通过协作过滤或基于内容的过滤（也称为基于个性的方法）。

协作过滤方法根据用户过去的行为（以前购买或选择的项目）构建模型。以及其他用户做出的类似决定。然后，该模型用于预测用户可能感兴趣的项目（或评级）。

基于内容的筛选方法利用项目的一系列离散特性，以推荐具有类似属性的其他项目。通常是组合的（见混合推荐系统）。

通过比较两种流行的音乐推荐系统（last.fm和pandora radio），可以证明协作过滤和基于内容的过滤之间的区别。

last.fm通过观察用户定期收听的乐队和个人曲目，并将其与其他用户的收听行为进行比较，创建推荐歌曲的“电台”。last.fm将播放未出现在用户库中的曲目，但通常由其他具有类似兴趣的用户播放。由于这种方法利用了用户的行为，因此它是协作过滤技术的一个例子。
潘多拉使用歌曲或艺术家的属性（音乐基因组项目提供的400个属性的一个子集）来种子一个“站”，播放具有类似属性的音乐。用户反馈用于优化电台的结果，当用户“不喜欢”某首歌时取消某些属性，当用户“喜欢”某首歌时强调其他属性。这是一个基于内容的方法的例子。

每种类型的系统都有其优点和缺点。在上面的例子中，last.fm需要大量关于用户的信息来做出准确的建议。这是冷启动问题的一个例子，并且在协作过滤系统中很常见，尽管潘多拉启动时需要的信息很少，但其范围更为有限（例如，它只能提出类似于原始种子的建议）。

推荐系统是搜索算法的一个有用的替代方案，因为它们可以帮助用户发现可能没有找到的项目。值得注意的是，推荐系统通常是使用搜索引擎索引非传统数据来实现。

推荐系统于1990年由哥伦比亚大学的Jussi Karlgren在一份技术报告中提到，称为“数字书架”，并于1994年起由Jussi Karlgren在技术报告和出版中进行了大规模实施，随后在SICS和麻省理工学院的Pattie Maes领导的研究小组与GroupLens的合作获得了2010年ACM软件系统奖。

Montaner从智能代理的角度提供了推荐系统的第一个概述Adomavicius提供了推荐系统的新的替代概述Herlocker提供了推荐系统评估技术的其他概述和Beel等人。讨论了离线评估的问题。还提供了关于现有研究论文推荐系统和现有挑战的文献调查。

推荐系统一直是被授予专利的焦点。

算法准确性

通常，对推荐系统的研究关注于找到最精确的推荐算法。然而，也有许多重要的因素。

多样性-当列表内的多样性更高时，用户倾向于更满意推荐，例如来自不同艺术家的物品。

持续性-在某些情况下，重新显示推荐或让用户重新评价项目，比显示新项目更有效。这有几个原因。例如，用户在第一次显示时可能会忽略项目，因为他们没有时间仔细查看推荐。

隐私-推荐系统通常必须处理隐私问题，因为用户必须公开敏感信息。从隐私的角度来看，使用协作过滤构建用户画像可能存在问题。许多欧洲国家都有很强的数据隐私文化，每一次尝试引入任何级别的用户分析都可能导致客户的负面反应。

关于Netflix为Netflix大奖赛提供的数据集，出现了许多隐私问题。尽管这些数据集是匿名的，以保护客户隐私，但2007年，德克萨斯大学的两名研究人员通过将这些数据集与互联网电影数据库上的电影评级相匹配，能够识别个人用户。

因此，2009年12月，一位匿名的Netflix用户在DOE诉Netflix一案中起诉Netflix，声称Hat Netflix通过发布数据集违反了美国公平贸易法和视频隐私保护法。这在一定程度上导致了2010年第二次Netflix大奖赛的取消。

在这一领域，对正在进行的隐私问题进行了大量研究。Ramakrishnan等人对个性化和隐私之间的权衡进行了广泛的概述，发现弱关系（提供意外建议的意外连接）和其他数据源的组合可以用来发现匿名数据集中用户的身份。

用户统计–Beel等人研究发现，用户的统计数据可能会影响用户对推荐的满意程度。在他们的论文中，他们表明老年用户比年轻用户更喜欢推荐。

稳健性-当用户可以参与推荐系统时，必须解决欺诈问题。

机缘巧合-机缘巧合是对“建议有多令人惊讶”的一种度量。例如，一个向杂货店顾客推荐牛奶的推荐系统可能是完全准确的，但这不是一个好的推荐，因为它是顾客购买的一个明显的物品。

信任-如果用户不信任系统，推荐系统对用户来说就没有什么价值。通过解释推荐系统如何生成推荐以及为什么推荐项目，推荐系统可以建立信任。

标签-用户对建议的满意度可能会受到建议标签的影响。例如，在引用的研究中，标记为“赞助”的建议的点击率（ctr）低于标记为“有机”的相同建议的点击率（ctr=5.93%）（ctr=8.86%）。在这项研究中，没有标签的建议表现最好（ctr=9.87%）。

移动推荐系统

移动推荐系统是推荐系统领域研究的一个日益增长的领域。随着互联网接入智能手机的普及，现在有可能提供个性化、上下文敏感的建议。这是一个特别困难的研究领域，因为移动数据比推荐系统通常必须处理的数据更复杂（它是异构的、有噪声的、需要空间和时间自相关的、具有验证和一般性问题）。此外，移动推荐系统存在移植问题，推荐可能不适用于所有地区（例如，在可能无法提供所在地区推荐是不明智的）。

移动推荐系统的一个例子是为城市中的出租车司机提供潜在的有利可图的驾驶路线。该系统以GPS的形式记录了出租车司机在工作时所走路线的输入数据，包括位置（纬度和经度）、时间戳和运行状态（有无通行证）。RS）。它使用这些数据推荐路线上的取货点列表，目的是优化占用时间和利润。这种类型的系统显然依赖于位置，而且由于它必须在手持或嵌入式设备上运行，因此计算和能量需求必须保持在较低水平。

移动推荐的另一个例子是为专业用户开发的（Bouneffouf等人，2012年）。利用GPS追踪用户及其日程安排，根据他的情况和兴趣，建议提供合适的信息。该系统利用机器学习技术和推理过程，动态地使移动推荐系统适应用户兴趣的演变。作者称他的算法为混合-ε-贪婪。

移动推荐系统也已成功建立，使用“数据网”作为结构化信息的来源。SmartMuseum是此类系统的一个很好的例子。该系统使用语义建模、信息检索和机器学习技术，以推荐与用户兴趣相匹配的内容，即使在呈现的用户数据很少或最少时也是如此。

影响移动推荐系统和预测结果准确性的因素有三个：背景、推荐方法和隐私。

风险定义

“推荐系统中的风险是干扰或扰乱用户的可能性，从而导致给用户错误答案。”

为了应对这些挑战，DRARS中的作者开发了一个动态风险感知推荐系统，称为DRARS（动态风险感知推荐系统），它将上下文感知推荐建模为一个问题。该系统结合了基于内容的技术和上下文土匪算法。研究表明，DRARS通过计算最佳勘探值来改善当前可用的最佳算法上置信区间（UCB）策略，从而根据当前用户情况的风险水平在勘探和开采之间保持平衡。作者在真实数据和真实用户的工业环境中进行了实验，结果表明，考虑到用户情况的风险水平，推荐系统的性能显著提高。

Netflix奖

Netflix奖是激励推荐系统研究的一个事件。从2006年到2009年，Netflix赞助了一场比赛，为团队提供了100万美元的大奖，该团队可以获得超过1亿个电影评级的数据集，并返回比公司现有推荐系统提供的更准确10%的推荐。这场竞争激发了对新的更精确算法的搜索。2009年9月21日，贝尔科尔的团队使用打破平局的规则获得了100万美元的大奖。

2007年，最精确的算法使用了107种不同算法方法的集成方法，并将其融合到单个预测中：

在混合多个预测因子时，预测精度得到了显著提高。我们的经验是，大多数的努力应该集中在派生出实质上不同的方法上，而不是提炼出单一的技术。因此，我们的解是许多方法的集合。

Netflix项目给网络带来了许多好处。一些团队已经将他们的技术应用到其他市场。完成排名第二的团队中的一些成员创建了Gravity R&D，一个活跃于Recsys社区的推荐引擎。为电子商务网站创建了一个Netflix项目衍生解决方案。

第二场比赛是计划中的，但最终由于联邦贸易委员会正在进行的诉讼和担忧而被取消。

效果评估

评估对于评估推荐算法的有效性很重要。常用的度量是均方误差和均方根误差，后者已被用于Netflix奖。信息检索指标（如精度和召回或DCG）可用于评估推荐方法的质量。近年来，多样性、新颖性和覆盖度也被认为是评价的重要方面然而，许多经典的评价方法受到了高度批评。通常，所谓的离线评价结果与实际评价的用户满意度不相关，作者总结道：“我们建议带着怀疑态度看待离线评估（即经典效果衡量）。

多标准推荐系统

多标准推荐系统（MCR）可以定义为在多个标准上包含偏好信息的推荐系统。这些系统不是基于单个标准值（用户u对项目i的总体偏好）开发推荐技术，而是通过利用影响总体偏好值的多个标准上的偏好信息来预测未探索项目u的评级。一些研究人员将MCMS作为一个多标准决策（MCDM）问题来处理，并将MCDM方法和技术应用于实现MCRS系统有关详细介绍。

基于反馈的推荐系统

在某些情况下，允许用户对项目留下文本评论或反馈。这些用户生成的文本是推荐系统的隐式数据，因为它们可能是项目特征方面的丰富资源，以及用户对项目的评估情感。从用户生成的评论中提取的特性是对项目的元数据的改进，因为它们也反映了项目的一些方面，如元数据，所以提取的特性被用户广泛关注。从评论中提取的情感可以看作是用户对相应功能的评分。基于意见的推荐系统的流行方法使用各种技术，包括文本挖掘、信息检索和情绪分析（另见多模态情绪分析）。

科研圈推荐研究

近年来，人们越来越认识到，许多以前的研究对推荐系统的实际应用几乎没有影响。Ekstrand、Konstan等人批评“目前很难复制和扩展推荐系统研究成果”，评价“处理不一致”。Konstan和Adomavicius得出结论，“推荐系统研究界正面临一场危机，其中大量论文呈现的结果对评估结果的贡献不大。”通常是因为研究缺乏正确的评估，因此，提供有意义的贡献。”因此，许多关于推荐系统的研究都被认为是不可复制的。因此，推荐系统的运营商在当前的研究中几乎找不到指导。推荐系统中使用哪种推荐方法。赛义德和贝洛恩对该领域最近发表的论文进行了研究，并对一些最流行的推荐框架进行了基准测试，发现即使使用了相同的算法和数据集，结果也存在很大的不一致性。ARIOS导致了推荐系统有效性的强烈变化。他们得出结论，有七项行动是必要的，以改善目前的状况：“（1）调查其他研究领域并从中学习，（2）找到对再现性的共同理解，（3）确定和理解影响再现性的决定因素，（4）进行更全面的实验（5）现代化的出版实践，（6）促进推荐框架的开发和使用，（7）为推荐系统研究建立最佳实践指南。”

预期设计

预期设计是物联网、用户体验设计和机器学习的结合。预期设计不同于传统设计，在预期设计中，目标是通过代表用户做出决策来简化流程并将难度降至最低。使用不同层次的预期设计的服务的例子有：亚马逊和Netflix生产推荐（根据以前的行为推荐产品）、移动应用程序peapod（使用推荐引擎允许用户根据以前的订单填充购物篮）以及预测基于用户输入和一天中的时间设置完美的室温。

缘起

推荐算法

协同过滤

基于内容的推荐

混合推荐系统