基于人工智能的搜索和推荐系统

        互联网上的搜索历史分析和用户活动是个性化推荐的基础,这些推荐已成为电子商务行业和在线业务的强大营销工具。随着人工智能的使用,在线搜索也在改进,因为它会根据用户的视觉偏好提出建议,而不是根据每个客户的需求和偏好量身定制产品描述。

概述

现代搜索引擎帮助我们在几秒钟内在不断增长的互联网数据海洋中找到任何实际问题的答案。这怎么可能呢?如此快速的搜索过程背后是什么?本博客将讨论人工智能 (AI) 搜索技术,这些技术可以快速帮助满足用户的信息需求并提供最合适的建议。

AI 帮助推荐引擎根据每个客户的需求和偏好做出快速、切中要害的推荐。借助 AI,在线搜索变得越来越好,因为它会根据用户的视觉偏好而不是产品规格提供推荐。

利用 AI 的推荐引擎可以成为搜索字段的替代品,因为它们可以帮助用户找到他们可能不会以不同的方式看到的对象或内容。这就是为什么今天,推荐引擎在 Amazon、Facebook、YouTube 等网站中发挥着至关重要的作用。让我们更深入地了解推荐引擎的工作原理,并了解它们如何收集数据和提出建议。

搜索引擎的演变

Archie 是第一个搜索引擎,它搜索 FTP 站点以创建可下载文件的索引。由于篇幅有限,仅提供房源,不包括每个地点的内容。它允许用户环顾 Internet。但它的功能有限,尤其是与当前的搜索引擎相比。第一个搜索引擎是一个 FTP,用户可以在其中提出简单的文件搜索请求,他们必须下载这些文件才能读取文件。

随着 Internet 上文档总数的增加,系统似乎对相关页面进行了排名。对于页面排名,搜索机器会考虑查询中的关键字、这些单词的频率以及它们在文档上下文中的重要性

必要的统计量 TF-IDF 出现了:

  • TF (Term-frequency) — 单词实例数与文档中单词总数的比率,用于评估单个记录中术语的重要性。

  • IDF (Inverse Document Frequency) — 单词在特定文档集合中出现的频率的倒数,这种方法减少了广泛使用的关键字的权重。

Google 搜索引擎于 1998 年出现,具有创新的反向链接排名算法 PageRank[KB(2] )。该工具的本质是,机器会根据与运营商相关的超链接数量来评估页面的重要性。具有最多反向链接的页面被推到最高排名。

2013 年,Google 创建了 Word2Vec,这是语义分析模型的集合。它为 2015 年推出的新型人工智能搜索技术 RankBrain 奠定了基础。这个自学系统可以在单独的单词之间建立联系,提取隐藏的语义联系并理解文本的含义。搜索引擎算法基于神经网络和深度学习工作,可以找到与关键字和目的匹配的页面。与传统算法相比,神经网络的主要优势在于它们经过训练,但未进行编程。从技术上讲,他们可以学习检测输入数据和输出之间的复杂依赖关系并进行简化(就像人脑在神经元之间建立连接一样)。

所有 AI 搜索技术的基本任务是提高对复杂冗长查询的理解,并在输入信息不完整或扭曲时提供正确的结果。

搜索引擎的历史:从索引卡到 AI 聊天机器人

现代搜索引擎非常神奇——复杂的算法使搜索引擎能够获取您的搜索查询并返回通常准确的结果,从而为您提供有价值的信息。

搜索引擎的历史始于 1990 年的 Archie,这是一个托管可下载目录列表索引的 FTP 站点。搜索引擎仍然是原始目录列表,直到搜索引擎发展到对网站进行爬取和索引,最终创建算法来优化相关性。

AI 搜索的工作原理是什么?

搜索时,AI 通常是指机器学习和自然语言处理 (NLP) 模块,这些模块确定搜索查询向用户检索相关信息的意图。

NLP 和 ML

由于人类语言的非结构化性质和多样性,理解和充分响应人类说话的方式对机器来说是一个巨大的挑战。

借助 NLP,计算机可以检测语言模式并识别单词之间的关系,以了解用户的兴趣。NLP 是 Alexa 和 Siri 等语音助手的核心,因此 Google 通过让智能引擎阅读 2,865 部言情小说来训练其 AI 更具对话性。

计算机程序需要机器学习才能根据它们对人类语言的理解自动采取行动,并提供随着时间的推移而改进的回复。机器学习是一门使系统执行操作而无需使用数学公式进行显式编程的科学。机器分析输入系统的数据,并使用算法不断寻找模式和联系,同时执行人类团队需要数周甚至数年才能完成的任务。

语义搜索

搜索 2021 年的“最佳洗手液”,您可以获得对 COVID-19 有效的产品建议,而无需指定任何其他内容,这与您在 2019 年收到的产品相比大不相同。通过查询的上下文含义来理解搜索者的意图,而不是依赖于一个人输入的确切单词,是语义搜索的领域,因为搜索引擎理解查询的含义,人们发现使用它们的便利性,他们的期望会发生变化。使用 NLP 和机器学习的 AI 驱动的语义搜索意味着调查可以独立运行并返回更相关的结果。

热门内容搜索引擎

从成立至今,Google 一直是搜索引擎市场的领导者。

截至 2021 年 6 月,Bing 在全球搜索引擎市场的份额为 5.56%,而市场领导者 Google 的份额为 87.76%。在此期间,雅虎的市场份额为 2.71%。

领先搜索引擎的全球市场份额

 

基于 AI 的推荐系统

对 Internet 上的搜索历史和用户活动的分析是个人推荐的基础,这已成为电子商务行业和在线公司的强大营销工具。

推荐系统不使用特定查询,而是分析用户的偏好来推荐感兴趣的商品或服务。为了预测特定客户的需求,推荐人会考虑以下因素:

·以前查看过的页面

·过去的购买记录

·用户的个人资料(其中标明了年龄、性别、职业、爱好)

·其他用户及其连接的类似个人资料

·地理位置

因此,推荐引擎是一种过滤系统,可防止信息过载,并根据每个客户的需求提取切中要害的内容。

推荐系统有哪些类型?

有各种类型的推荐系统,每种系统都使用多种技术和方法来生成预测。实施在很大程度上取决于用例(即它将如何满足业务需求)、项目的规模以及数据的数量和质量。通常,有基于内容和协作过滤的推荐系统,协作过滤进一步分为基于内存和基于模型的方法。

基于内容的推荐系统使用基于用户喜欢的产品或服务的明确反馈、属性、关键字或描述的过滤器。该算法推荐根据用户当前想要或寻找的内容建立的项目。

使用协同过滤的系统有两个子组,并使用不同的方法:

  • 基于模型 — 利用机器学习 (ML),涉及从信息集中提取信息(例如,评级、反馈、评论等),并使用这些信息来构建 ML 模型

  • 基于内存 — 分析数据集以查找或建立其他用户或项目之间的相关性和相似性,从而获得推荐。

什么是基于内容的筛选?

基于内容的推荐系统通过显式或隐式反馈处理用户提供的数据。随着用户提供更多输入或对初始建议采取更多操作,引擎/系统会变得更加准确。

 

什么是协作筛选?

协作筛选的运行基于以下假设:同意或喜欢过去的用户更有可能在不久后执行相同的操作。如下所示,协作筛选涉及分析数据,这些数据通常以矩阵形式排列,其中包含一组项目和具有相似偏好的用户,这些用户已表明他们的响应。协作过滤中的一个基本概念是利用其他用户的反馈或评级来为特定用户生成预测。这些衡量标准包括详细评分(例如,喜欢或不喜欢、1 到 10 分的评分等)或隐性反馈(例如,查看、添加到愿望清单、在页面上花费的时间等)。

 

用于开发 AI、ML、DL 解决方案的框架

为了有效地创建和部署智能搜索和 AI 技术,开发人员必须选择合适的框架。每个框架都有特定的用途,有其特性和功能。

Microsoft 认知工具包 (CNTK)

CNTK 表示一组用于设计和开发不同类型网络的开源工具。它通过深度学习使处理大量数据变得更加容易,并为语音、图像和手写识别提供实用的训练模型。

TensorFlow

用于语音和图像识别的最佳开源库是文本应用程序。该框架由 Google 开发,用 C++ 和 Python 编写。它非常适合复杂项目,例如,关于创建多层神经网络的项目。

PyTorch 插件

该工具由 Facebook 组成,主要用于快速有效地训练模型。它有几个现成的训练模型和易于组合的模块化部件。最重要的优势是透明和直接的模型创建过程。

MXNet 网络

Apache 创建了一个非常可扩展的深度学习框架,被大公司和全球 Web 服务主要用于语音和手写识别、自然语言处理 (NLP) 和预测。

DL4J 系列

Deeplearning4j 是一个主要用 Java 和 Scala 编写的商业开源平台。该框架适用于图像识别、自然语言处理、漏洞架构和文本分析

IP 布局

主要市场参与者(美国顶级外派人员)

下图显示,谷歌 (3138)、Microsoft (2137) 和 IBM (1418) 是人工智能搜索和推荐系统中专利申请量排名前三的受让人。

 

结论

人工智能和大数据分析已经在我们的日常生活中扎根,产生了重大的变化。在 AI 算法的帮助下,内容搜索和推荐实践变得越来越像人类。

毫无疑问,搜索引擎越来越受欢迎,并在新的数字时代发挥着重要作用。尤其是人工智能,即时推荐更加普遍,既省时又务实。借助人工智能,推荐引擎提高了他们的生产力,并且它们基于客户的视觉偏好而不是项目的描述。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/736.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot starter机制

1、出现的背景 在spring boot之前,想要在spring中集成redis,需要做的事情包括: (1)引入jar包:包括redis的jar包,redis依赖的jar包,相应的版本,与spring版本是否兼容等 …

在 JavaScript 中,`Array.prototype.filter` 方法用于创建一个新数组,该数组包含通过测试的所有元素

文章目录 1、概念在你的代码中的作用示例总结 2、实战3、formattedProducts4、filteredProducts 1、概念 在 JavaScript 中,Array.prototype.filter 方法用于创建一个新数组,该数组包含通过测试的所有元素。具体来说,filter 方法会遍历数组中…

通过源码分析类加载器里面可以加载的类

类列表 每一个ClassLoader里面的类列表,类的数量都是固定的。 对上一节中的dex反编译 使用DexClassLoader类动态加载插件dex   利用jadx对dex进行反编译可以看到有哪些类 源码分析 BaseDexClassLoader 从BaseDexClassLoader类加载器开始分析 在BaseDexClassLoade…

系统架构设计师(软考高级)一站式通关课程

系统架构设计师(软考高级) 一站式通关课程 系统架构设计师(软考高级)教程(三连评论分享链接!) 🎯 课程亮点: 全面覆盖: 从基础概念到高级应用,涵盖…

C++ 优先算法——盛最多水的容器(双指针)

目录 题目:盛最多水的容器 1. 题目解析 2. 算法原理 3. 代码实现 题目:盛最多水的容器 1. 题目解析 题目截图: 如图所示: 水的高度一定是由较低的那条线的高度决定的:例1图中,是由7决定的,然后求出…

SQL-lab靶场less1-4

说明:部分内容来源于网络,如有侵权联系删除 前情提要:搭建sql-lab本地靶场的时候发现一些致命的报错: 这个程序只能在php 5.x上运行,在php 7及更高版本上,函数“mysql_query”和一些相关函数被删除&#xf…

Golang | Leetcode Golang题解之第535题TinyURL的加密与解密

题目: 题解: import "math/rand"type Codec map[int]stringfunc Constructor() Codec {return Codec{} }func (c Codec) encode(longUrl string) string {for {key : rand.Int()if c[key] "" {c[key] longUrlreturn "http:/…

使用 Elasticsearch 进行语义搜索

Elasticsearch 是一款功能强大的开源搜索引擎,可用于全文搜索、分析和数据可视化。传统上,Elasticsearch 以其执行基于关键字/词汇的搜索的能力而闻名,其中文档基于精确或部分关键字匹配进行匹配。然而,Elasticsearch 已经发展到支…

计算机毕业设计Python+大模型新闻自动分类 新闻舆情预测 新闻语料情感分析 新闻推荐系统 朴素贝叶斯分类算法 机器学习 深度学习

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…

【097】基于SpringBoot+Vue实现的个人社区博客管理系统

系统介绍 演示视频 小白博客2.0(SpringbootVue)源码数据库讲解视频设计文档 基于SpringBootVue实现的小白博客2.0系统设计了超级管理员、系统观察者、用户三种角色,超级管理员可对用户授权,具体实现的功能如下 文章采用了比较火的Markdown编…

LM Head weights;ChatGPT-3词汇量:175,000;llama7b 词汇量,词嵌入维度:4096

目录 LM Head weights ChatGPT-3词汇量:175,000 llama7b 词汇量 词汇量:32000 max_position_embeddings: 4096 LM Head weights ChatGPT-3词汇量:175,000 ChatGPT-4 确切的词向量种类数量公开信息。但可以根据一些语言模型的相关知识进行推测分析。 一般来说,语言模…

ArcGIS005:ArcMap常用操作101-150例动图演示

摘要:本文涵盖了GIS软件操作的多方面内容,包括地图文档的新建、打开、保存及版本兼容性处理;错误与警告的查阅及帮助文档的使用技巧;地图打印比例尺的调整与地图信息的完善;图层操作的撤销与恢复,界面元素的…

Chrome和夸克谁更护眼

在当今数字化时代,我们每天长时间面对电脑和手机屏幕,眼睛的健康问题变得越来越重要。浏览器作为我们日常使用频率极高的工具,其护眼功能的优劣直接影响到我们的视觉舒适度。本文将对Chrome和夸克两款主流浏览器进行对比,探讨它们…

WPF+MVVM案例实战(十二)- 3D数字翻牌计时实现

文章目录 1、运行效果2、功能实现1、文件创建2、控件代码实现3、控件引用与菜单实现1.引用用户控件2.按钮菜单3、计时器界面实现4、源代码获取1、运行效果 3D数字翻牌计时 2、功能实现 1、文件创建 打开项目 Wpf_Examples ,在用户控件 UserControlLib 中创建 NumberFoldi…

一、计算机网络概述,《计算机网络(自顶向下方法 第7版,James F.Kurose,Keith W.Ross)》

文章目录 [toc]零、前言一、什么是Internet1.1 从具体构成角度1.2 什么是协议1.3 从服务角度1.4 网络结构 二、网络边缘2.1 通讯模式2.2 采用网络设施的面向连接服务2.3 采用基础设施的无连接服务 三、网络核心3.1 认识网络核心3.2 网络核心:电路交换3.2.1 基本原理…

闯关leetcode——234. Palindrome Linked List

大纲 题目地址内容 解题代码地址 题目 地址 https://leetcode.com/problems/palindrome-linked-list/description/ 内容 Given the head of a singly linked list, return true if it is a palindrome or false otherwise. Example 1: Input: head [1,2,2,1] Output: tru…

K8S自建企业私有云方案 单台起配 NVMe全闪存储性能

作为老牌存储硬件厂商,Infortrend这回开了一把大的。在一套设备系统里,将计算节点、存储与Kubernetes结合,打造出EonStor KS IEC(Infortrend企业云),将硬件与软件、前端与后端、上层与底层统一融合在一套系…

Rust 力扣 - 73. 矩阵置零

文章目录 题目描述题解思路题解代码题目链接 题目描述 题解思路 我们使用两个变量记录矩阵初始状态的第一行与第一列是否存在0 然后我们遍历矩阵(跳过第一行与第一列),如果矩阵中元素为0则将该元素映射到矩阵第一行与矩阵第一列的位置置为0…

6款IntelliJ IDEA插件,让Spring和Java开发如虎添翼

文章目录 1、SonarLint2、JRebel for IntelliJ3、SwaggerHub插件4、Lombok插件5、RestfulTool插件6、 Json2Pojo插件7、结论 对于任何Spring Boot开发者来说,两个首要的目标是最大限度地提高工作效率和确保高质量代码。IntelliJ IDEA 是目前最广泛使用的集成开发环境…

Node.js:ES6 模块化 Promise

Node.js:ES6 模块化 & Promise ES6 模块化默认导入导出按需导入导出 Promise构造状态thencacheallraceasyncawait ES6 模块化 在Node.js中,遵循的是CommonJS的模块化规范,使用require方法导入模块,使用moudule.exports导出模…