一种多任务强化学习推荐方法

实质审查的生效

摘要

本发明公开了一种多任务强化学习推荐方法，步骤1：采集用户在项目集上的评分信息，根据项目的配置文件构造项目的向量表示；步骤2：采集有用户评分的项目以及与其相关的所有知识图谱信息，构造对应的三元组；步骤3：构造马尔科夫决策过程，并建立Q网络；步骤4：建立基于DDQN的推荐模型；步骤5：建立知识表示学习模型；步骤6：将知识表示学习作为DDQN推荐模型的辅助任务进行训练，交替更新DDQN推荐模型和知识表示学习模型。本发明使得推荐模型能够更深入挖掘项目与动作之间潜在的语义关系，从而提高了推荐的长期收益以及推荐精确度；同时由于使用多任务模型，提高了强化学习训练中的泛化性，也提升了训练的速度。

基本信息

专利标题：

一种多任务强化学习推荐方法

专利标题（英）：

暂无

公开（公告）号：

CN114417124A

申请号：

CN202111450470.4

公开（公告）日：

2022-04-29

申请日：

2021-11-30

授权号：

暂无

授权日：

暂无

发明人：

曲立平胡雪歌冯晓宁

申请人：

哈尔滨工程大学

申请人地址：

黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室

代理机构：

代理人：

优先权：

CN202111450470.4

主分类号：

G06F16/9535

IPC分类号：

G06F16/9535 G06N3/04 G06N3/08 G06K9/62

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06F

电数字数据处理

G06F16/9535

••••基于用户配置文件和个性化自定义搜索

法律状态

2022-05-20 ：

实质审查的生效

IPC(主分类) : G06F 16/9535
申请日 : 20211130

2022-04-29 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载