背景介绍

推荐系统已经成为互联网应用提升点击率、转化率、留存率和用户体验的必备手段,然而,随着流量和数据量的爆发式增长,以及企业竞争环境日新月异的变化,快速搭建一套易用、精准、可灵活扩展的个性化推荐系统已成为每一家互联网企业必备的生存技能。

推荐系统一方面需要能够及时处理海量的用户行为日志,从中挖掘出用户的画像信息及行为偏好;另一方面又要对海量的物料数据(推荐候选集)进行精准的分析,预测每个候选物料未来一段时间内的转化概率;同时还需要对推荐的上下文进行分析,精准预测出在应该在什么时间、什么地点、给什么用户推荐什么内容。推荐内容的精准度、时效性、多样性、短长期受益平衡等各方面都对推荐系统提出了很高的要求。从零开始搭建一套合格的推荐系统绝非易事。所幸,随着云计算平台的兴起,搭建推荐系统所需要的各种基础技术、工具、产品和平台越来越成熟,在云上的智能推荐系统对中小企业来说是一个比较好的选择。

推荐系统从整体结构上,可大致分为算法方案和工程方案两部分,算法方案由算法同学负责,通常聚焦在样本选取、特征选取、模型效果优化等业务层面,工程方案负责提供从数据回流、离线/实时样本生成、模型训练环境到端到端在线服务(数据服务、模型服务)等完整的工具、系统支撑,一套完整、灵活的推荐工程方案可以支持算法同学以工程工具为基础,高效、快速的任意定制算法方案,并且上线后服务在并发、响应速度、数据一致性等方面有足够的性能保证。

本文中的最佳实践,以PAI团队预置的基础版算法方案为例子,演示如何以阿里云提供的数据、AI类产品为基础,离线部分采用Maxcompute&Dataworks&PAI 或EMR-datascience两种不同的大数据&AI体系,在线服务采用推荐引擎PAI-REC、A/B测试系统PAI-A/B、在线模型服务PAI-EAS、在线数据服务Hologres/BE/igraph(基于实际业务情况选型),并通过PAI-REC运维与实验操作台,从0到1搭建一套高效、精准、易用、可扩展的智能推荐系统。 该方案的核心是以最小的接入成本,支持用户熟悉端到端工程方案的使用,通过配置中心的图形化配置,快速获取算法方案源码并进行个性化迭代。同时以PAI-REC提供的工程方案为基础,可以任意扩展更多的算法方案,具体可联系PAI-REC咨询。