线性回归与最小二乘法

线性回归是统计学中的概念,以其建模速度快,不需要很复杂的计算并且模型解释性强等优点在机器学习中广泛应用。线性回归模型主要用于数据预测,其模型参数常用最小二乘法获得。

一、模型:

最开始人们得到了很多组带有测量误差的数据,比如身高与体重的关系,但是这些数据之间貌似存在某种联系,于是人们想要找到一种近似的函数关系来对这些变量的联系进行某种描述,进而获得某种解释或者对于给定身高的样本预测体重。对于这种问题的分析,在统计学发展起来之后将其归为回归分析,回归被视为一种“估计量”,并从统计的角度保证了回归模型的可靠性,随着机器学习的火热,回归模型也逐渐受到重视。

线性回归是回归模型中最简单的模型,采用一种线性的函数描述数据之间的联系时称之为线性回归,线性回归通常可用最小二乘法进行有效的求解。我们将通过最小化误差的平方和寻找数据的最佳函数参数称之为最小二乘法,误差服从高斯分布时最小二乘法等价于极大似然估计,极大似然估计将会在接下来的章节中讲解。

假设有N组观测值(x1,y2),(x2,y2)...(xn,yn),希望可以使用一条线性曲线来估计这些观测点,使得点尽量在曲线上。使得所选择的回归模型应该使所有观察值的残差平方和达到最小。

图片

散点为测量得到的数据,直线为要求的函数

假设曲线的函数形式为,以一元一次函数为例:

图片

其中第n次误差为:

图片

观测值的残差平方和为:

图片

让残差平方和对A和B求偏导,偏导为0时取得极值:

图片

两个方程两个未知数,解出AB的值,即可获得函数的表达式。这种方法对于多元的线性函数也适用,所以对于某些可以转化为线性的函数同样适用。

二、模型评估:

SSE(误差平方和):

图片

同样的数据集的情况下,SSE越小说明误差越小,模型的效果也就越好;不同数据集下不可比较。

R-square(决定系数):

图片

决定系数越接近1,表明方程的变量对数据的解释能力越强,这个模型效果也就越好;决定系数越接近0,表明方程的变量对数据的解释能力越差,这个模型效果也就越差。同样的需要在相同数据集下比较。

三、过拟合问题:

在实际的操作时会发现,训练模型和实际使用模型的效果相差很大,及泛化能太差,这主要是过拟合和欠拟合造成的。对于过拟合是把样本中包含不太一般的特性都学进去了,而欠拟合则是学习能力不够造成的。欠拟合可以通过增加数据量、增加训练轮数等方法克服,过拟合相对比较麻烦,主要有以下几种方法。

留出法是将数据集划分为两个互斥的集合,一个用户训练模型,一个用作测试模型,最后用测试模型的误差作为泛化误差估计。

交叉验证法是从数据集中分层抽样得到k个子集,每次将k-1个子集作为训练集,余下的1个子集作为测试集,获得k个测试结果的均值作为泛化误差估计。

自助法采用有放回的采样获取训练集数据,即每次从数据集D中抽取一个放入训练集D’中,抽中的数据仍然放回D,数据足够多的情况下D中将有36.8%的样本未出现在D’中,可作为测试集用以作为泛化能力的评估。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/149894.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

JS中的事件和DOM操作

一、事件[重要] 1、 事件介绍 事件: 就是发生在浏览器(页面)上一件事,键盘事件,鼠标事件,表单事件,加载事件等等 2、 事件绑定方式 事件要想发生,就得将事件和标签先绑定(确定哪个标签发生什么事情,又有什么响应) 一个完整的事件有三部分 事件源(标签),哪里发出的事. 什么事(…

SAM核心代码注释总结

最近看sam2,顺便注释了下代码,方便回顾和分享。 PS: tensor的维度都基于默认参数配置。 SAM _build_sam sam模块包含三个部分,ImageEncoderViT、PromptEncoder和MaskDecoder: def _build_sam(encoder_embed_dim,encoder_depth…

HDMI20协议解析_Audio_Clock_Regeneration

HDMI20协议解析_Audio_Clock_Regeneration 1.版本说明 日期作者版本说明20240918风释雪初始版本 2.概述 当通过HDMI传输音频信号时,Audio Clock Regeneration(ACR)是必须要传输的数据包之一; HDMI传输过程中,音频采样…

大模型推理革新:探索思维图(DoT)框架的逻辑与应用

姚期智院士领衔推出了大模型新推理框架,CoT的“王冠”已难以承载。 提出了思维图(Diagram of Thought,DoT),使大模型的思考方式更接近人类。 团队为这一推理过程提供了数学基础,通过拓扑斯理论&#xff0…

分享6个icon在线生成网站,支持AI生成

在这个数字化的时代,创意和视觉标识在产品推广中可谓是愈发重要。提到图标,我们就不能不聊聊“Icon”这个小家伙。它不仅仅是个简单的视觉元素,简直是品牌信息的超级传递者。因此,图标生成器成了设计界的“万金油”,帮…

教授【优青】团队亲自指导-图解表观遗传学 | 组蛋白修饰!专业实验设计、数据分析、SCI论文辅助等全方位服务。精准高效,为农植物科研保驾护航!

教授【优青】团队亲自指导!提供专业实验设计、数据分析、SCI论文辅助等全方位服务。精准高效,为医学科研保驾护航! 专业实验外包服务,一站式解决您的所有需求; 还在犹豫?别让您的科研和论文停滞不前&#…

什么是前端开发 ?

每当我们访问网页时,为什么会有这么多样的图片、视频、动画、各种各样的元素呢?下面将为你揭晓! 一、 前端世界的基石 一切始于用户在浏览器地址栏输入一串字符,敲下回车。看似简单的动作,却开启了一段奇妙的旅程。 …

OmniPeek 空口抓包软件使用指导

OmniPeek 空口抓包软件使用指导 1 前置条件 PC机一台和TP_LINK(TL-WDN7200H)网卡一个 Omnipeek安装成功,TL-WDN7200H网卡驱动安装并设置成功 网卡插入到PC机的USB口 2 启动Omnipeek 3 打开Omnipeek 启动后打开Capture—Start Capture 注意网卡选择802.11的 4…

9月25日微语报,星期三,农历八月廿三

9月25日微语报,星期三,农历八月廿三,工作愉快,生活喜乐! 一份微语报,众览天下事! 1、多地响应取消普通与非普通住宅标准:降低居民购房成本,支持改善性需求。 2、中国将…

今日早报 每日精选15条新闻简报 每天一分钟 知晓天下事 9月25日,星期三

每天一分钟,知晓天下事! 2024年9月25日 星期三 农历八月廿三 1、 央行宣布:存量房贷利率下调约0.5个百分点,二套房最低首付比例15%。 2、 央行近期将下调存款准备金率0.5个百分点,向金融市场提供长期流动性约1万亿元…

Redis 分布式缓存服务(集群)

作者:程序那点事儿 日期:2023/11/17 13:05 准备6台虚拟机,ip分别是 192.168.10.101 192.168.10.102 192.168.10.103 192.168.10.104 192.168.10.105 192.168.10.106 创建6个节点 mkdir -p /usr/local/cluster/redis-node1 #对应192.168.10.…

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

作者:付宇轩 前言 阿里云函数计算(Function Compute, FC)是一种无服务器(Serverless)计算服务,允许用户在无需管理底层基础设施的情况下,直接运行代码。与传统的计算架构相比,函数…

ffmpeg解封装解码

文章目录 封装和解封装封装解封装 相关接口解封装的流程图关于AVPacket的解释如何区分不同的码流,视频流,音频流?第一种方式av_find_best_stream第二种方式 通过遍历流 代码 封装和解封装 封装 是把音频流 ,视频流,字…

LeetCode题练习与总结:删除链表中的节点--237

一、题目描述 有一个单链表的 head,我们想删除它其中的一个节点 node。 给你一个需要删除的节点 node 。你将 无法访问 第一个节点 head。 链表的所有值都是 唯一的,并且保证给定的节点 node 不是链表中的最后一个节点。 删除给定的节点。注意&…

实例讲解电动汽车驱动扭矩控制策略及Simulink建模方法

电动汽车完成上电后进入Ready状态,此时车辆具备行车条件,处于行车准备状态。驾驶员挂挡(D挡或R挡)后,踩油门踏板即可控制车辆开始行车。对于电动汽车来说,驱动行车控制过程一般为,VCU接收Ready状…

高侧电流检测电路设计

1 简介 此单电源、高侧、低成本、电流检测解决方案可以检测 50mA 和 1A 之间的负载电流,并将其转换为 0.25V至 5V 的输出电压。高侧检测使系统能够识别接地短路,并且不会对负载造成接地干扰。 2 设计目标 2.1 输入 2.2 输出 ​​​ 2.3 电…

轴承介绍以及使用

轴承(Bearing)是在机械传动过程中起固定、旋转和减小载荷摩擦系数的部件。也可以说,当其它机件在轴上彼此产生相对运动时,用来降低运动力传递过程中的摩擦系数和保持转轴中心位置固定的机件。 轴承是当代机械设备中一种举足轻重的…

在java中怎么把对象转换成json,可以使用jackson

简述 在Spring Boot应用中,将Java对象转换为JSON字符串通常有两种主要方法:使用Jackson库或使用Gson库。由于Spring Boot默认集成了Jackson库,所以我们将重点介绍如何使用Jackson来进行对象到JSON的转换。 第1步:Maven添加依赖 …

STM32 Modbus主从站实例程序-FreeRTOS

资料下载地址:STM32 Modbus主从站实例程序-FreeRTOS​​​​​​​ 基本设置 启用Freertos,添加任务 设置中断优先级 设置长生成MDK工程 工程里面添加Modbus库 修改main.c 修改freertos.c 编译下载到单片机,完美运行

深入解析 helpTransfer 方法:多线程协作中的哈希表扩容

文章目录 什么是哈希表哈希表的问题:扩容扩容的挑战扩容的原理helpTransfer 方法检查是否正在扩容生成扩容标记并检查条件判断是否需要更多线程帮助加入搬家工作返回新表或旧表 什么是哈希表 哈希表(HashMap)是一种常用的数据结构&#xff0…