中国开源软件网

当前位置: 首页 > 互联网 >

那么该如何设计这样一款推荐系统呢,1,—大智慧RES从0到1实战

时间:2020-08-12 14:37来源:互联网 作者:小狐

导语:百万日活的推荐是很多人可望而不可求的,其的设计也并不简单,那么该如何设计这样一款推荐呢?本文基于自己的实际搭建经验,为我们了他的产品设计历程,希望能够帮助大家在搭建的过程中少走一些弯路。

那么该如何设计这样一款推荐系统呢,1,—大智慧RES从0到1实战(图1)

前言:

本系列专栏主要讲述本人从0到1搭建RES推荐的一些经验,记录下产品设计的心路历程,以此激励自己不断探索新知识。

与市面上泛泛而谈的博客不同的是,本文主要从产品的角度,结合行业特性,剖析踩过的坑。

一、产品架构

任何一款再简单的产品,都需要商业模式和产品架构的设计。架构不需要多么复杂、花哨,深入理解行业背景,适合产品规划才是最重要。

那么该如何设计这样一款推荐系统呢,1,—大智慧RES从0到1实战(图2)

用visio画的一个比较满意的产品图,基本能把要表达的思路全部画了出来。

不同于前任设计的基于规则的1.0版本,这次重构主要在于搭建一个可扩展的体系,同时引入数据驱动、算法赋能,而不是拍脑袋决定。

从产品的角度看推荐,应属于业务应用层。

推荐的整体流程分为召回、过滤、排序(因为数据量不是非常大,所以不需要粗排、精排)重排序,这次主要讲召回层最易理解但最重要的热门召回。

二、整体流程

那么该如何设计这样一款推荐系统呢,1,—大智慧RES从0到1实战(图3)

根据整体流程,发现核心在于热门值的计算方案。

资讯热度分=初始热度值+用户交互产生热度值-低质量惩罚分暂无*时间衰减系数。

1. 初始热度值

1不同类别的文章给与不同的权重

根据用户数据反馈,选择其中某些热门主题类型的文章,同时综合考虑高质量的类目,给与较高的权重。

类别初始热门值:

2人工构建热门词库

新媒体的专家是最懂行业,最懂当前热点的了,引入人工规则,维护一张热门词库。

那么该如何设计这样一款推荐系统呢,1,—大智慧RES从0到1实战(图4)

字段类型说明:

热词idstring自增,主键热门词string不可为空,不可重复状态string枚举值:

对文章进行提取关键字,进行匹配,根据匹配程度适当提升热门权重。提取关键字的算法也很简单,利用textrank,弥补tf-idf无法提取上下文关系的劣势,取共现词topN。

作为关键词,当然前置工作有去除停用词,后置工作有同义词归并等等,所以NLP的底层基础能力很重要。

3自动发现热词

2. 交互热度值

取前M小时用户的不同行为赋予不同的分数,如【具体分值根据数据表现配置】

几个核心的点:

评论:无法单一的根据内容得出用户的偏好。需要对内容做正负面分析。

采用经典的hacker news的排行算法:

那么该如何设计这样一款推荐系统呢,1,—大智慧RES从0到1实战(图5)

G重力衰减因子默认为1.8,值越大衰减越快:

那么该如何设计这样一款推荐系统呢,1,—大智慧RES从0到1实战(图6)

那么该如何设计这样一款推荐系统呢,1,—大智慧RES从0到1实战(图7)

至于接下来的,LR+adam排序算法,将在后续章节介绍。

本文相关词条概念解析:

热门

《热门》是由腾讯视频、腾讯娱乐联合打造的寻找“MR.KEY”互联网综艺游戏节目,由何炅、黄子佼主持,于每周二在腾讯视频播出。首播时间:2015年6月23日。

推荐

推荐(拼音:tuījiàn,英译:recommended),介绍,建议最好去选择你看中的答案,推举;指把好的人或事物向人或组织介绍,希望被任用或接受。出自《汉书·王莽传上》:“收赡名士,交结将相卿大夫甚众。故在位者更推荐之。”

网友评论

相关文章