深度学习-点击率预估-研究论文2024-09-14速读

深度学习-点击率预估-研究论文2024-09-14速读

1. Deep Target Session Interest Network for Click-Through Rate Prediction

H Zhong, J Ma, X Duan, S Gu, J Yao - 2024 International Joint Conference on Neural Networks, 2024

深度目标会话兴趣网络用于点击率预测

摘要:
这篇文章提出了一种新的深度学习模型,名为Deep Target Session Interest Network(DT-SIN),用于提高点击率(CTR)预测的准确性。该模型特别关注用户会话中的行为序列,通过捕捉用户在会话期间的动态兴趣变化来预测点击行为。DT-SIN模型利用了注意力机制来加权用户会话中的不同项目,并结合了用户的历史行为和上下文信息来提高预测的准确性。

创新点:

  1. 提出了一种新的用户会话表示方法,能够捕捉用户在会话期间的兴趣演变。
  2. 引入了注意力机制来加权用户会话中的项目,使得模型能够关注更相关的用户行为。
  3. 结合了用户的历史行为和上下文信息,以提供更全面的用户画像,从而提高CTR预测的准确性。

算法模型:
DT-SIN模型包括以下几个关键组件:

  • 会话兴趣提取器:用于从用户会话中提取兴趣表示。
  • 注意力机制:用于加权会话中的不同项目,以突出用户最感兴趣的部分。
  • 用户画像构建器:结合用户的历史行为和上下文信息来构建用户画像。
  • 预测器:基于用户画像和会话兴趣来预测点击行为。

实验效果:
文章中进行了一系列的实验来评估DT-SIN模型的性能。实验结果表明,与现有的CTR预测模型相比,DT-SIN在多个数据集上都取得了更好的性能。具体来说,DT-SIN在AUC(Area Under the Curve)和Logloss等评价指标上均优于其他模型。实验数据和结论证明了DT-SIN在处理复杂的用户行为序列和提高CTR预测准确性方面的有效性。

推荐阅读指数:
★★★★☆

这篇文章对于那些对推荐系统、用户行为分析和深度学习在CTR预测应用感兴趣的研究人员和实践者来说是非常有价值。它提供了一种新的视角来理解和预测用户的点击行为,并且通过实验验证了其有效性。因此,我给予这篇文章较高的推荐指数。

2. DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

Huifeng Guo, Ruiming Tang, Yunming Ye, Zhenguo Li, Xiuqiang He, 2017

DeepFM:一种基于分解机的神经网络用于点击率预测
在这里插入图片描述

摘要:
文章提出了DeepFM模型,这是一个结合了分解机(Factorization Machines, FM)和深度神经网络(Deep Neural Networks, DNN)的端到端学习模型,用于提高推荐系统中的点击率(CTR)预测准确性。DeepFM模型能够同时捕捉低阶和高阶特征之间的复杂交互,并且不需要除了原始特征之外的任何特征工程。通过在基准数据集和商业数据上的全面实验,证明了DeepFM在CTR预测方面的有效性和效率,与现有模型相比有显著提升。

创新点:

  1. 提出了DeepFM模型,它整合了FM和DNN,能够同时学习低阶和高阶特征交互。
  2. 与Google的Wide & Deep模型相比,DeepFM的“宽”和“深”部分共享相同的输入,无需特征工程。
  3. 实现了高效的训练,因为其宽部分和深部分共享相同的输入和嵌入向量。

在这里插入图片描述

算法模型:
DeepFM模型包括两个主要组件:

  • FM组件:用于捕捉特征之间的二阶交互。
  • DNN组件:用于捕捉更高阶的特征交互。

这两个组件共享相同的输入特征,并且模型的参数是联合训练的。模型的输出是CTR的预测值,通过sigmoid函数得到。

实验效果:
在Criteo数据集和商业数据集上进行了实验,评估指标包括AUC(Area Under the ROC Curve)和Logloss(交叉熵损失)。实验结果显示,DeepFM在两个数据集上都优于现有的模型,包括FM、FNN、PNN变体、Wide & Deep模型等。具体来说,在商业数据集上,DeepFM在AUC上比LR模型提高了0.86%,在Logloss上降低了0.42%;在Criteo数据集上,DeepFM在AUC上提高了0.37%,在Logloss上降低了0.29%。

推荐阅读指数:
★★★★☆

这是一篇CTR预估领域比较有影响力的论文。该文章对于从事推荐系统、广告技术、机器学习等领域的研究者和工程师来说非常有价值。它不仅提出了一个新的模型,而且在实际数据集上展示了其优越的性能。因此,我给予这篇文章较高的推荐指数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1537627.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

鱼类计数与识别系统源码分享

鱼类计数与识别检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer V…

GAN的损失函数和二元交叉熵损失的对应及代码

以下解释为GPT生成 这里有个问题,使用二元交叉熵,的时候生成器的损失如何体现 看代码 import torch import torch.nn as nn import torch.optim as optim# 设置设备为GPU或CPU device torch.device("cuda" if torch.cuda.is_available() el…

【Java EE】文件IO

Author:MTingle major:人工智能 --------------------------------------- Build your hopes like a tower! 目录 一、文件是什么? 二、针对文件系统操作的API 1.文件路径,文件名,文件是否存在 2. 创建文件 3.删除文件&#…

软考中级软件设计师——数据结构与算法基础学习笔记

软考中级软件设计师——数据结构与算法基本概念 什么是数据数据元素、数据项数据结构逻辑结构物理结构(存储结构) 算法什么是算法五个特性算法效率的度量时间复杂度空间复杂度 什么是数据 数据是信息的载体,是描述客观事物属性的数、字符及所…

Flask-SQLAlchemy一对多 一对一 多对多关联

一. 组织一个 Flask 项目通常需要遵循一定的结构,以便代码清晰、可维护。下面是一个典型的 Flask 项目结构: my_flask_app/ │ ├── app/ │ ├── __init__.py │ ├── models.py │ ├── views.py │ ├── forms.py │ ├── tem…

【Matlab 肌电信号分析】

一、数据预处理 1.1 数据读取 使用matlab从rhd文件中读取原始数据,共64个通道。 1.2 数据滤波 使用 60Hz的Notch filter 和150Hz的高通Butterworth滤波器进行降噪 二、波峰提取 > 每个通道分别根据相应的规则提取出波峰、波谷附近的波形。 三、信号聚类 3.1 降…

Postman接口测试、Python接口自动化测试

接口自动化测试笔记,自用 来源:https://www.bilibili.com/video/BV1Cs4y1C73Hp45&vd_source37bf552472afa993fb78c918d1dea2bc 目录 一、Postman接口测试 1.postman自动关联 1)创建环境并选择 2)使用自动关联技术&#xf…

iPhone 上丢失了重要的联系人?如何恢复已删除的 iPhone 联系人

丢失 iPhone 上的联系人可能会带来灾难。无论是一份很棒的新工作机会、潜在的恋爱对象,还是您一直想打电话的老朋友,如果您打开“联系人”应用时看到空白,这绝不是好事。不过,一切并非全无,仍然可以通过备份或专业软件…

月薪14K的网安公司,来做一下笔试题呀~

《网安面试指南》http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247484339&idx1&sn356300f169de74e7a778b04bfbbbd0ab&chksmc0e47aeff793f3f9a5f7abcfa57695e8944e52bca2de2c7a3eb1aecb3c1e6b9cb6abe509d51f&scene21#wechat_redirect 网络安全简介…

【Linux】基础IO认识(2)

基础IO认识(2) 1、补充系统调用1、1、read调用1、2、stat 2、重定向2、1、文件描述符的分配规则2、2、实现重定向(dup2) 3、缓冲区的理解3、1、缓冲区典型实例3、2、缓冲区代码形式展示 4、深化和实践利用4、1、在shell中加入重定向4、2、简单实现库的封…

模拟火车世界5/Train Sim World 5 (容量289GB)百度网盘下载

版本介绍 Build.15665692|容量289GB|官方简体中文|支持键盘.鼠标.手柄 游戏介绍 来《模拟火车世界5》里,全世界的铁路尽属于你!在标志性的特色城市中,驾驶列车穿越铁轨,飞驰在 3 条全新线路上,用新的角色迎接新的挑战…

教师薪酬管理系统的设计与实现

摘 要 传统信息的管理大部分依赖于管理人员的手工登记与管理,然而,随着近些年信息技术的迅猛发展,让许多比较老套的信息管理模式进行了更新迭代,老师信息因为其管理内容繁杂,管理数量繁多导致手工进行处理不能满足广…

【FreeRL】Rainbow_DQN的实现和测试

文章目录 前言环境1 PER note2 C51 note3 Noisy note4 Rainbow note其他 前言 具体代码实现见:https://github.com/wild-firefox/FreeRL/blob/main/DQN_file/DQN_with_tricks.py 将其中所有的trick都用上即为Rainbow_DQN。 效果如下:(学习曲…

vue 案例使用

el-switch 按键的使用 <el-switchclass"switchStyle" v-model"boolValue" :active-value"1" :inactive-value"0" active-text"ON" inactive-text"OFF" active-color"#13ce66" inactive-color&qu…

明星御用剪辑师亲授:PR剪辑技巧大全

在这个视频内容大爆炸的时代&#xff0c;一个好的剪辑工具就如同一位得力的助手&#xff0c;能让你在视频制作的道路上事半功倍。今天&#xff0c;就让我来为大家揭秘几款PR剪辑工具&#xff0c;它们各具特色&#xff0c;能够帮助你轻松应对各种剪辑需求。让我们开始吧&#xf…

kali——tshark的使用

目录 前言 使用方法 tshark提取流量为文档 前言 tshark 是一个命令行的网络分析工具&#xff0c;它用于捕获和分析网络流量。它支持多种网络协议&#xff0c;包括 TCP、UDP、ICMP 等。Tshark 可以用于调试网络问题、进行安全审计、分析应用程序性能等。 在 Kali Linux 中&…

绿咖啡豆缺陷检测系统源码分享

绿咖啡豆缺陷检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer…

ubuntu虚拟机装载共享文件夹导致的诡异错误

最近使用vmware station 15 安装了 ubuntu22.04 的虚拟机。在装载共享文件夹不久后便会出现诡异的错误。目前在网络上好像没有人把这归结到装载共享文件夹的问题上&#xff0c;故以供参考。 第一次&#xff1a; 在装载之后大概第二次开机&#xff0c;出现报错界面。 提示蓝牙…

驱动器磁盘未格式化恢复实战

驱动器磁盘未格式化的深度剖析 在日常的数字生活中&#xff0c;驱动器作为数据存储的重要载体&#xff0c;承载着用户无数的珍贵资料。然而&#xff0c;当遇到“驱动器中的磁盘未被格式化”的提示时&#xff0c;这份平静往往会被瞬间打破。这一状况不仅让用户感到困惑和焦虑&a…

精选评测!分享5款AI写论文最好用的软件排名

写作是一项既费时又费力的任务&#xff0c;尤其是对于科研人员来说&#xff0c;撰写论文更是一项必不可少的挑战。幸运的是&#xff0c;现在有多款免费的AI写作工具可以大大简化这一过程。小编精心挑选了5款免费的AI写作工具&#xff0c;旨在帮助大家提高写作效率&#xff0c;让…