一种基于深度强化学习的信息多样性推荐方法

实质审查的生效

摘要

本发明公开一种基于深度强化学习的信息多样性推荐方法，方法首先使用自注意力机制模块根据用户的历史行为数据生成状态表示，并将状态表示输入到Actor策略神经网络中，根据策略函数对候选集进行筛选，挑选出推荐动作向量；然后将状态表示和Actor策略神经网络生成的动作一起输入到Critic估值神经网络，对推荐行为进行动作打分，计算出状态价值Q值，然后通过梯度下降反向传播的方式更新参数，待Q值收敛结束从而完成训练过程，将输出的推荐动作作为项目空间，输入到总体多样性效应TDE模块，排序后输出多样性推荐结果。本发明将用户的动态偏好考虑在推荐过程中，并在考虑推荐项目即时回报的基础上，保证了推荐项目的收益最大化。

基本信息

专利标题：

一种基于深度强化学习的信息多样性推荐方法

专利标题（英）：

暂无

公开（公告）号：

CN114547466A

申请号：

CN202210190018.7

公开（公告）日：

2022-05-27

申请日：

2022-02-28

授权号：

暂无

授权日：

暂无

发明人：

高天寒高燊

申请人：

东北大学

申请人地址：

辽宁省沈阳市和平区文化路3号巷11号

代理机构：

沈阳东大知识产权代理有限公司

代理人：

李在川

优先权：

CN202210190018.7

主分类号：

G06F16/9535

IPC分类号：

G06F16/9535 G06K9/62

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06F

电数字数据处理

G06F16/9535

••••基于用户配置文件和个性化自定义搜索

法律状态

2022-06-14 ：

实质审查的生效

IPC(主分类) : G06F 16/9535
申请日 : 20220228

2022-05-27 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载