机器学习1_机器学习定义——MOOC

一、机器学习定义

定义一

1959年Arthur Samuel提出机器学习的定义:

Machine Learning is Fields of study that gives computers the ability to learn without being explicitly programmed.


译文:机器学习是这样的领域,它赋予计算机学习的能力,(这种学习能力)不是通过显著式的编程获得的。

什么是显著式?

人为的告诉计算机,菊花是黄色的,玫瑰是红色的。

非显著式的编程

如果我们只给计算机一堆菊花和玫瑰的图片,编写程序让计算机自己去总结菊花和玫瑰的区别。

计算机通过大量的图片,从一大堆可能的规律中挑出最能区分菊花和玫瑰的一些规律,从而完成对菊花和玫瑰的识别。

举例

需求:让机器人到教室外面的咖啡机去我们冲一杯咖啡。

显著式的编程

我们必须帮计算机规划所处环境,每一步怎么走都要规划的一清二楚。

非显著式的编程

我们可以规定机器人可以采取一系列的行为,例如向左转,向右转等。

规定在特定的环境下,机器人做这些行为所带来的收益,把这个成为收益函数(Reward Function)。

例如,机器人采取的某个行为撞到了墙上,规定这时候的收益函数值为负。如果机器人采取某个行为取到了咖啡,那么程序就要奖励一下这个行为,规定这时候的收益函数值为正

只要程序编的足够好,计算机是可能找到一个最大化收益函数的行为模式。

结论:非显著式的编程能够让计算机通过数据和经验自动的学习完成我们交给的任务。

定义二

1998年Tom Mitshell在《Machine Learning》中的定义:

A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.


译文:一个计算机程序被称为可以学习,是指它能针对某个任务T和某个性能指标P,从经验E中学习。这种学习的特点是,它在T上的被P所衡量的性能,会随着经验E的增加而提高。

举例

以菊花和玫瑰为例。

任务T:编写程序识别菊花和玫瑰

经验E:一大堆菊花和玫瑰的图片

性能指标P:不同的机器学习算法会有不同

识别率(Recognition Rate):让更多的菊花被识别为菊花,更多的玫瑰被识别为玫瑰

根据Tom Mitshell的定义,机器学习就是针对识别菊花和玫瑰这样的任务构造某种算法。这种算法的特点是,当训练的菊花和玫瑰的图片越来越多的时候,也就是经验E越来越多的时候,识别率越来越高。


二、机器学习的分类

机器学习算法可以分为监督学习和强化学习,但这个划分并不绝对。

监督学习(Supervised Learning)

一些输入计算机训练数据(所有的经验E都是由人工采集并输入进计算机的)同时加上标签的机器学习。

对于监督学习,可以根据数据标签的存在与否分为三类:
  • 传统的监督学习(Traditional Supervised Learning)
每一个训练数据都有对应的标签。

支持向量机(Support Victor Motion)、人工神经网络(Neural Networks)、深度神经网络(Deep Neural Networks)。

  • 非监督学习(Unsupervised Learning)

所有的训练数据都没有对应的标签。

如图,左边的图像,⭕代表一类,❌代表一类。右边的图像总,假设有这些训练的数据,但不知道这些训练数据的标签。所以就需要假设同一类的训练数据在空间中的距离更近。

聚类(Classtery)、EM算法(Expectation-Maximization algorithm)、主成分分析(Principle Component Analysis)

  • 半监督学习(Seme Supervised Learning)

训练数据中一部分有标签,另一部分没标签。

利用少量的标注数据和大量没有标注过的数据一起训练。

如图,左边的图中,如果只有两个标注过的训练样本,我们并不知道如何进行分类。但是如果我们增加一些没有标签的训练样本,如右图所示,那么我们可能设计算法更准确的实现分类。

另一种分类方法是基于标签的固有属性。
  • 分类(Classification)

标签是离散的值。

如识别一张人脸是一堆人脸中的哪一个。

  • 回归(Regression)

标签是连续的值。

如预测房价,预测股票的价格等。

强化学习(Reinforcement Learning)

经验E是由计算机与环境相互的互动获得的。

计算机产生行为同时获得这个行为的结果,程序只需要定义这些行为的收益函数,对行为进行奖励和惩罚。同时需要设计算法,让计算机自动的通过改变自己的行为模式去最大化收益函数,完成学习的过程。


三、机器学习算法的过程

拿到数据之后,构建机器学习算法的第一步是观察数据,总结规律。如果我们总结对数据没有感性的认识,我们就很难设计出好的算法,也很难估计算法可能达到的性能极限。

错误做法:认为只要收集足够多的数据,从网上随便下载一个开源的算法模型,直接将数据丢到算法模型当中去训练,就可能获得很好的结果。

如图,可能被观察到的区别,总结起来包括如下三个方面:

  1. 平均来说,白细胞的面积比红细胞更大。
  2. 平均来说,白细胞没有红细胞那么圆。
  3. 白细胞内部的纹理比红细胞要粗糙一些。

机器学习的第一步

特征提取(Feature Extraction)

特征提取是指通过训练样本获得对机器学习任务有帮助的多个维度的特征数据。

首先特征的提取和特征选择,不同的任务提取特征的方式有不同。基于特征构建算法。不同的算法会对特征空间做不同的划分,获得不同的结果。

例如,支持向量机(Support Victor Motion)

支持向量机有三至内核:线性内核、多项式内核、高斯镜像奇函数核。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/8808.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

充电桩--OCPP 充电通讯协议介绍

一、OCPP协议介绍 OCPP的全称是 Open Charge Point Protocol 即开放充电点协议, 它是免费开放的协议,该协议由位于荷兰的组织 OCA(开放充电联盟)进行制定。Open Charge Point Protocol (OCPP) 开放充电点协议用于充电站(CS)和任何…

如何制作公司小程序

我是【码云数智】平台的黄导,今天分享:如何制作公司小程序 企业小程序怎么制作,企业小程序制作不仅成为了连接消费者与品牌的桥梁,更是企业数字化转型的重要一环。 01、小程序制作流程 02、微信小程序开发多少钱 03、微信小程…

明道云正式发布国际品牌Nocoly

在2024年明道云伙伴大会上,明道云正式发布了其国际品牌Nocoly以及国际版产品Nocoly HAP。这标志着公司正式开启了海外业务。明道云的海外业务由全资拥有的Nocoly.com Limited经营,该公司注册在香港特别行政区。总部位于上海的明道云已经将围绕HAP超级应用…

如何构建一个可扩展的测试自动化框架?

以下为作者观点: 假设你是测试自动化方面的新手,想参与构建一个框架。在这种情况下,重要的是要了解框架所需的组件,以及它们是如何组合的。思考项目的具体需求和目标,以及可能遇到的困难和挑战。 假如你是一个测试架…

C++builder中的人工智能(11):双曲正切激活函数(ANN函数)?

在这篇文章中,我们将探讨双曲正切函数(tanh)是什么,以及如何在C中使用这个函数。让我们来回答这些问题。 在AI中激活函数意味着什么? 激活函数(phi()),也称为转移函数或阈值函数&a…

基于SSM+VUE宠物医院后台管理系统JAVA|VUE|Springboot计算机毕业设计源代码+数据库+LW文档+开题报告+答辩稿+部署教+代码讲解

源代码数据库LW文档(1万字以上)开题报告答辩稿 部署教程代码讲解代码时间修改教程 一、开发工具、运行环境、开发技术 开发工具 1、操作系统:Window操作系统 2、开发工具:IntelliJ IDEA或者Eclipse 3、数据库存储&#xff1a…

二、SSM框架制作CRM系统案例

一、搭建框架 1、首先创建下面的目录结构 2、添加相关依赖&#xff1a; <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-inst…

【GPTs】Email Responder Pro:高效生成专业回复邮件

博客主页&#xff1a; [小ᶻZ࿆] 本文专栏: AIGC | GPTs应用实例 文章目录 &#x1f4af;GPTs指令&#x1f4af;前言&#x1f4af;Email Responder Pro主要功能适用场景优点缺点 &#x1f4af;小结 &#x1f4af;GPTs指令 Email Craft is a specialized assistant for cra…

知识课堂之域名系统中实现动态代理

怎么在域名系统中解析动态ip&#xff0c;这一直是一个需要解决的问题&#xff0c;人们对与网络的稳定连接与灵活运用已经成为生活和工作中不可或缺的一部分&#xff0c;因此这样的问题的解决迫在眉睫。 大家对于动态ip是什么&#xff0c;应该都有所了解了&#xff0c;所谓的动…

【Go语言】| 第1课:Golang安装+环境配置+Goland下载

&#x1f60e; 作者介绍&#xff1a;我是程序员洲洲&#xff0c;一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。 &#x1f913; 同时欢迎大家关注其他专栏&#xff0c;我将分享Web前后端开发、人工智能、机器学习、深…

程序猿要失业了,一行代码没写,1小时嘴搓了一个图片分割插件(好看又好用)

如题&#xff0c;一行代码没写&#xff0c;使用 AI 编程工具实现了一个浏览器图片分割插件的开发&#xff0c;先看效果吧&#xff08; Chrome商店上架审核中~ &#xff09; 支持点击&#xff0c;拖拽&#xff0c;直接粘贴&#xff0c;还支持预览&#xff0c;次数统计&#xff0…

基于SpringBoot+Vue实现新零售商城系统

作者主页&#xff1a;编程千纸鹤 作者简介&#xff1a;Java领域优质创作者、CSDN博客专家 、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验&#xff0c;被多个学校常年聘为校外企业导师&#xff0c;指导学生毕业设计并参…

【湖南】《湖南省省直单位政府投资信息化项目预算编制与财政评审工作指南(试行)》湘财办〔2024〕10号-省市费用标准解读系列06

2024年4月12日&#xff0c;湖南省财政厅发布实施《湖南省省直单位政府投资信息化项目预算编制与财政评审工作指南&#xff08;试行&#xff09;》湘财办〔2024〕10号&#xff08;以下简称“10号文”&#xff09;&#xff0c;该文件旨在指导提高湖南省直单位政府投资信息化项目预…

攻防靶场(28):通过SNMP进行信息收集 JOY

目录 1.侦查 1.1 获取目标网络信息&#xff1a;IP地址 1.2 主动扫描&#xff1a;扫描IP地址块 1.3 收集受害者主机信息&#xff1a;软件 2. 数据窃取 2.1 通过备用协议窃取&#xff1a;通过未加密的非C2协议窃取 2.2 通过备用协议窃取&#xff1a;通过未加密的非C2协议窃取 3. …

DCDC-LLC谐振电路Q值与系统增益变化相反的原因

1.谐振电路的Q值定义 LLC电路的Q值定义: 它表述的是整个电路的能量存储与耗散的关系。损耗越小&#xff0c;Q值越大&#xff0c;损耗越大&#xff0c;Q值越小。 Q的另一种写法是&#xff1a; 这个公式来由&#xff0c;因为谐振频率&#xff1a; 所以&#xff1a; 所以&#…

【JAVA毕业设计】基于Vue和SpringBoot的图书馆管理系统

本文项目编号 T 044 &#xff0c;文末自助获取源码 \color{red}{T044&#xff0c;文末自助获取源码} T044&#xff0c;文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析5.4 用例设计 六、核…

VirtualBox7.0的“网络地址转换(NAT)“ 笔记2400727

VirtualBox7.0的"网络地址转换(NAT)" 每台虚拟机的默认ip都是 10.0.2.15 虚拟机之间不能互通虚拟机能通过主机各ip访问主机(延时高,不稳定), 主机不能直接访问虚拟机, 可以通过端口转发(端口映射)虚拟机能访问宿主机的局域网的其它机器,虚拟机能访问网络, 但不能反过…

PyQt5 详细安装与配置教程及使用

文章目录 Part1&#xff1a;安装 PyQt5Part2&#xff1a;配置 PyQt5 的依赖工具 QtDesigner 和 PyUICPart3&#xff1a;使用QtDesigner设计界面Part4&#xff1a;使用PyUIC将设计好的界面转换为.py文件Part5&#xff1a;通过代码显示ui界面 Part1&#xff1a;安装 PyQt5 需要安…

10.31.2024刷华为OD C题型

文章目录 HJ26HJ27语法知识记录 10.24.2024刷华为OD C题型&#xff08;四) - HJ26 HJ27 def get_dict(str1: str):dic_0 {}for ch in str1:if ch not in dic_0:dic_0[ch] 1else:dic_0[ch] 1return dic_0temp input().split() n int(temp[0]) list [] for i in range(n):l…