特征平台介绍

特征平台是用来生产,共享,管理机器学习模型特征的存储库。特征平台可以方便的向多人、多团队共享特征,保证离线在线的一致性,并提供高效的在线特征访问。

特征平台基本适用于所有需要特征的场景,典型的比如推荐场景。特征表注册在特征平台中,特征平台可以自动完成在线和离线表的构建,保证在线和离线的一致性,同时保证特征表只存一份的情况下,能够向多人共享特征,减少资源成本。特征平台还可以节省时间成本,原来需要复杂的 sql 操作,比如导出训练表,数据导入到 Hologres 表中等操作,现在在特征平台中都可以通过一行代码完成。

目前的特征平台相当于封装了整个特征到模型的流程,离线支持 MaxCompute 平台和 EMR-DataScience 等平台,在线支持 Hologres,Redis, MySQL 等平台,这意味着开发者或者算法工程师不需要再去深入各个平台的细节,所有的操作在特征平台中都可以通过网页手动操作或者 Python SDK 的 Python 代码完成。提升团队工作效率,同时也会避免一些可能存在的问题,比如推荐场景中比较常见的里在线不一致的问题。

目前的特征平台已经与 EasyRec 深度集成,可以非常方便高效的进行 FG(特征工程) 和模型训练,并且能够直接部署到线上,可以做到在短时间内搭建起一套前沿的推荐系统并且可以取得优良的效果。

目前特征平台已经在多个客户业务中稳定上线,并且其功能还在不断迭代中。除了可以试用 Notebook 中的功能外,有任何其他的问题可以在钉钉群中讨论与交流:32260796 (钉钉群)。

快速开始

目前特征平台支持网页操作,Python SDK 操作。其具体操作可以查看详细介绍:

网页操作

Python SDK 操作

添加新特征上线操作

主要功能

主要功能部分介绍

Feature Store Python SDK API

Python SDK API