架构概述

PAI-REC推荐全链路深度定制开发平台涵盖了推荐系统全链路的各个开发阶段。用户可以一站式地进行数据处理,数据加工,模型训练,部署模型,上线服务,进行A/B实验。 如下图所示,PAI-REC的整体架构上,包含了建模(数据诊断、离在线特征工程、模型训练评估),推理(召回引擎、模型推理引擎),预测(推荐服务引擎),实验(A/B实验、指标报表)等模块。PAI-REC的各个模块在保证高可用、高易用性、易配置的基础上,同时还保持了较高的灵活性。用户可以对PAI-REC中的模块进行深度定制开发,以灵活地扩展满足多种多样的推荐业务场景。以推荐服务引擎PAI-REC engine为例,在召回,过滤,排序,重排等各个阶段中都支持简单易用的扩展点,用户能很方便地定制化扩展自己的策略和算法。
image.png

本最佳实践将基于一个内容行业的场景,选型PAI-Studio + MaxCompute + DataWorks + Hologres的方案。讲解如何基于PAI-REC快速定制上线一路召回和一个精排算法,并观察算法效果,进行A/B实验。本最佳实践,将从PAI-REC产品开通和示例数据准备出发,一步步讲解如何诊断数据、定制算法、上线服务和进行在线实验,具体章节如下:

  • **产品开通:**本章节将主要讲解如何在阿里云上开通和授权PAI-REC及相关的产品,如MaxCompute/Dataworks/Hologres等

  • **数据准备:**本章节将主要讲解如何准备一份内容行业的场景的示例数据

  • **数据诊断:**本章节将以内容场景的示例数据为例,讲解如何使用PAI-REC的数据诊断功能,诊断数据中潜在的问题

  • **推荐算法定制:**本章节将基于示例数据,以定制一路Etrec协同过滤召回和一个DBMTL多目标精排为例,介绍如何基于PAI-Rec构建多种召回/粗排/精排/冷启动算法

  • **在线服务:**本章节将基于上述构建的Etrec召回和DBMTL精排算法,讲解如何基于PAI-REC搭建和发布一个最简单的在线推荐服务

  • **A/B实验:**本章节将以调整多目标精排模型中各目标打分的融合公式为例,讲解如何在PAI-REC上快速上线分层的A/B实验,如何配置和查看分层实验的指标报表