JobPlus知识库 互联网 大数据 文章
大数据的协同过滤——发现新的兴趣点

智能推荐算法是电子商务领域中非常关键的大数据应用技术。B2C平台上的智能引擎可以根据记录的用户信息,对用户感兴趣的商品进行推荐,从而促成更高的成交额。实现智能推荐需要对用户的行为规律、兴趣爱好、购物能力等诸多方面的信息具有充分的了解,因此,成熟的B2C网站都会客户的相关信息进行详细的存储统计。

当对用户进行产品推荐时,智能引擎所采用的推荐策略大致可以分为两类:基于内容的推荐策略和协同过滤推荐策略。基于内容的推荐策略的思想是比较直观的,智能引擎只需要根据用户详细的行为信息和基本信息做统计分析,就可以很好地预测出用户感兴趣的产品组合。基于内容的分析策略定位到企业战略层面,也就是我们通常所理解的客户关系管理(CRM)过程。而后者,协同过滤策略,则构成了近些年来比较流行的新型智能推荐算法系列。

最著名的电子商务推荐系统应用的案例当属Amazon电子书城,用户可以在“Customer Who Bought This Item Also Bought”这个词条项中轻易地发现自己感兴趣的书单列表。尽管当用户惊奇之余会认识到Amazon强大的预测推荐功能甚至怀疑自己的电脑是否被安装了后门程序而被窥探了隐私,但很少有人能真正意识到Amazon智能推荐引擎的算法实现机理。实际上,Amazon正是采用了协同过滤算法来对用户的兴趣项来进行预测的。

协同过滤算法是基于这样的假设:相似的客户往往也会具有相似的兴趣取向。举个例子可以很好地说明,比如说小A同学喜欢看足球、打篮球和游泳,小B同学喜欢看韩剧、烹饪和插花艺术,小C同学则乐忠于看足球、打篮球和赛车。凭直观,我们很容易看到,小A同学和小C同学则更有可能是一类小伙伴,小C同学的爱好则很有可能也是小A同学的爱好。那么智能引擎则会将小C的爱好(同时不属于小A的爱好)推荐给小A,即推荐项是赛车而不是其他的。也就是说,尽管用户不可能对所有的产品项做出详细的评价,但是我们可以根据现有的数据去寻找与该用户性状相似的用户,而预测出其对未评价产品的真实喜好。


协同过滤算法可以进一步分为Item-basedCF(基于产品项)和User-based CF(基于用户项),其区别只是在具体的算法实现层,而他们提出的基本理念则是一致的。协同过滤算法的最大优点就是能够发现令用户“出乎意料”的兴趣点,但是由于需要被评估的数据项规模太大,会产生很高的算法复杂性。不过在计算机技术高速发展的当今时代,海量数据的处理能力已经不是主要障碍,相信在不久的将来协同过滤技术能够在更广泛的领域展现其强大的功能。


如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

¥ 打赏支持
280人赞 举报
分享到
用户评价(0)

暂无评价,你也可以发布评价哦:)

扫码APP

扫描使用APP

扫码使用

扫描使用小程序