统计学习与机器学习概念简记

一、统计学习

1、定义

统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。

统计学习也称为统计机器学习(statistical machine learning)。

2、对象 

统计学习研究的对象是数据(data)

数据是计算机及互联网上的各种数字、文字、图像、视频、音频数据以及它们的组合。

数据的基本假设是同类数据具有一定的统计规律性。

可以用随机变量描述数据中的特征,用概率分布描述数据的统计规律。

在统计学习中,以变量或变量组表示数据。

数据分为由连续变量和离散变量表示的类型。

3、目的

用于对数据(特别是未知数据)进行预测和分析。

4、方法

监督学习

无监督学习

强化学习

部分监督学习

主动学习

5、三要素

统计学习方法包括模型的假设空间、 模型选择的准则以及模型学习的算法。 称其为统计学习方法的三要素, 简称为模型(model)、 策略(strategy)和算法(algorithm)。

给定的、 有限的、 用于学习的训练数据(training data)集合出发, 假设数据是独立同分布产生的,并且假设要学习的模型属于某个函数的集合, 称为假设空间(hypothesis space);

应用某个评价准则(evaluation criterion),从假设空间中选取一个最优模型, 使它对已知的训练数据及未知的测试数据(test data)在给定的评价准则下有最优的预测;

最优模型的选取由算法实现。

6、步骤

(1)得到一个有限的训练数据集合;
(2)确定包含所有可能的模型的假设空间, 即学习模型的集合;
(3)确定模型选择的准则, 即学习的策略;
(4)实现求解最优模型的算法, 即学习的算法;
(5)通过学习方法选择最优模型;
(6)利用学习的最优模型对新数据进行预测或分析

二、机器学习

 1、定义与概念

机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。

机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。

因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论

部分定义:

机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。

机器学习是对能通过经验自动改进的计算机算法的研究”。

机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。

2、机器学习与数据挖掘

机器学习是数据挖掘的重要工具。数据挖掘试图从海量数据中找出有用的知识。

数据挖掘不仅仅要研究、拓展、应用一些机器学习方法,还要通过许多非机器学习技术解决数据仓储、大规模数据、数据噪音等等更为实际的问题。

机器学习不仅仅可以用在数据挖掘上,增强学习与自动控制等等子领域甚至与数据挖掘关系不大。

大体上数据挖掘可以视为机器学习和数据库的交叉,主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据。

3、机器学习与统计学习

一般来说

统计学研究形式化和推导,强调低维空间问题的统计推导

机器学习更容忍一些新方法,强调高维预测问题

而总体而言,统计学习和机器学习内容是高度一致的,大部分时候提及机器学习同样可以指代统计学习,至少在理论部分如此。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/19065.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Flink和Spark的区别是什么?各自的应用场景是什么?

一、Flink是什么? Flink:Flink 是一个分布式流处理框架,其架构基于流计算,将一切都看作是流。它采用了一种基于事件驱动的架构,数据以流的形式源源不断地进入系统,并且能够实时处理这些数据。例如&#xf…

2024.11.18晚Linux复习课笔记

第一章 cat -n显示行号 -b不显示空行号 pwd 打印当前的工作目录 cd ls 打印当前工作的所有文件 -a -A -l:显示当前文件的详细信息 -r:递归显示 passwd:修改密码 ip a 查看ip地址 poweroff shutdown -h 关机 reboot shutdown -r 第二章 man --help …

基于Spring Boot+Unipp的博物馆预约小程序(协同过滤算法、二维码识别)【原创】

🎈系统亮点:协同过滤算法、二维码识别; 一.系统开发工具与环境搭建 1.系统设计开发工具 后端使用Java编程语言的Spring boot框架 项目架构:B/S架构 运行环境:win10/win11、jdk17 前端: 技术:框…

Scaling Law的“终结“还是新起点?——开源实践者的深度思考

作者:宋大宝,与大宝同学因那篇《回顾总结展望「融合RL与LLM思想,探寻世界模型以迈向AGI」》结识于今年春天,虽我们当时某些思想观念有些出入,也碰撞出了很多火花与共鸣,并持续地相互启发的走到了现在。他是…

【qt】控件4

1.Qradiobutton(单选按钮) ui界面有三个按钮,应该文本框,根据不同的按钮来改变不同文本框的内容 根据不同的单选按钮改变不同的文本框。 Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this);ui->radioB…

Day02_AJAX综合案例 (黑马笔记)

Day02_AJAX综合案例 目录 Day02_AJAX综合案例 学习目标 01.案例_图书管理-介绍 目标 讲解 小结 02.Bootstrap 弹框_属性控制 目标 讲解 小结 03.Bootstrap 弹框_JS控制 目标 讲解 小结 04.案例_图书管理_渲染列表 目标 讲解 小结 05.案例_图书管理_新增图书…

六、代码生成,《编译原理》(本科教学版),第2版

文章目录 零、前言0.1 编译器前端到后端 一、代码生成1.1 代码生成的任务1.2 给数据分配计算资源1.3 给代码选择合适的机器指令1.4 栈式计算机1.4.1 栈式计算机Stack的结构1.4.2 栈计算机的指令集1.4.3 变量的内存分配伪指令1.4.4 栈式计算机的代码生成1.4.4.1 递归下降代码生成…

Android集成FCM(Firebace Cloud Messaging )

集成FCM官方文档 Firebace主页面 将 Firebase 添加到您的 Android 应用 1、进入Firebace页面,创建自己的项目 2、点击自己创建好的项目,在右侧选择Cloud Messaging 3、点击Android去创建 google-services.json 4、将下载的 google-services.json 文件…

D2076——一款双通道音频功率放大器【青牛科技】

概述: D2076是一款双通道音频功率放大器,最低工作电压可到1.0V。适用于 便携式小型收音机或立体声耳机作双通道或BTL应用。 主要特点: BTL工作,Po90mW(典型值) 外接元器件少 通过外接PNP三极管作为…

智慧社区平台系统提升物业管理效率与居民生活质量

内容概要 智慧社区平台系统是为应对现代城市管理挑战而诞生的重要工具。随着城市化进程的加快,传统的物业管理方式已经难以满足日益增长的居民需求和管理复杂性。因此,引入智能化管理手段显得尤为重要。这个系统不仅仅是一个简单的软件,它是…

【langchain4j】AIservices能够实现更加灵活的chain

文章目录 AI service介绍如何工作的AiServices提供的能力支持的返回形式 简单的例子:接收用户消息,并按规定返回接收单个变量接收更多动态变量 advanced RAGChaining multiple AI Services:多个AiSerives合并到一起相关教程:[Lang…

JavaScript 中字符串和数组的概念解析与多角度对比区分

文章目录 💯前言💯字符串(String)💯数组(Array)💯字符串与数组的相同点与不同点💯字符串和数组的实际应用场景💯字符串与数组的互转💯字符串和数组…

4K双模MiniLED显示器哪个好

4K双模MiniLED显示器哪个好?现在市面上的4K双模MiniLED显示器太多了,琳琅满目,今天就给大家列举一下7款当下火热到爆炸的品牌,看看4K双模MiniLED显示器哪个好。 4K双模MiniLED显示器哪个好 - HKC G27M7PRO HKC G27M7Pro 是一款性…

每天五分钟深度学习pytorch:批归一化全连接网络完成手写字体识别

本文重点 前面我们学习了普通的全连接神经网络,后面我们学习了带有激活层的全连接神经网络,本文我们继续进一步升级,我们学习带有批归一化的全连接神经网络,批归一化可以加快神经网络的训练速度,减少过拟合,具体它的原理,大家可以看我们的《每天五分钟深度学习》专栏,…

excel打开csv文件乱码的问题

如图所示,在保存csv文件时已指定编码为utf-8,用excel打开后仍然乱码 解决方法: 在保存csv文件时指定编码为utf-8-sig 该编码方式会在文件开头加入一个 BOM(Byte Order Mark),有助于 Excel 正确识别 UTF-8…

QQ音乐 11.3.4 | 魅族定制版,极致简洁,无广告,不限机型

QQ音乐魅族定制版,界面设计极致简洁,没有任何广告干扰,支持听限免歌曲,不限机型使用。用户可以通过微信和QQ直接登录,享受纯净的音乐体验。 大小:94.6M 下载地址: 百度网盘:https:…

使用TensorFlow实现简化版 GoogLeNet 模型进行 MNIST 图像分类

在本文中,我们将使用 TensorFlow 和 Keras 实现一个简化版的 GoogLeNet 模型来进行 MNIST 数据集的手写数字分类任务。GoogLeNet 采用了 Inception 模块,这使得它在处理图像数据时能更高效地提取特征。本教程将详细介绍如何在 MNIST 数据集上训练和测试这…

TON商城与Telegram App:生态融合与去中心化未来的精彩碰撞

随着区块链技术的快速发展,去中心化应用(DApp)逐渐成为了数字生态的重要组成部分。而Telegram作为全球领先的即时通讯应用,不仅仅满足于传统的社交功能,更在区块链领域大胆探索,推出了基于其去中心化网络的…

vulhub之log4j

Apache Log4j Server 反序列化命令执行漏洞(CVE-2017-5645) 漏洞简介 Apache Log4j是一个用于Java的日志记录库,其支持启动远程日志服务器。Apache Log4j 2.8.2之前的2.x版本中存在安全漏洞。攻击者可利用该漏洞执行任意代码。 Apache Log4j 在应用程序中添加日志记录最…

web服务nginx实验4:访问控制

4-1:基于不同用户的访问控制: 安装软件: 创建HTTP基本认证用户密码文件,tom,密码:1,lisa,密码:1: -c:表示创建一个新的密码文件。如果该文件已经…