11.18 机器学习-线性回归(重点)-最小二乘法

# 分类对离散型结果的数据进行预测,线性回归对连续性结果的数据

# 连续性数据和离散型的区别

# 标称数据的特点: 离散 不能数学运算

# 1. **无序性**:标称数据的各个类别之间没有固有的顺序关系。例如,“性别”可以分为“男”和“女”,但“男”和“女”之间不存在大小、高低等顺序关系。

# 2. **非数值性**:标称数据不能进行数学运算,因为它们没有数值含义。你不能对“颜色”或“品牌”这样的标称数据进行加减乘除。

# 3. **多样性**:标称数据可以有很多不同的类别,具体取决于研究的主题或数据收集的目的。

# 4. 比如西瓜的颜色,纹理,敲击声响这些数据就属于标称型数据,适用于西瓜分类

# 连续型数据的特点包括: 能数学运算

# 1. **可测量性**:连续型数据通常来源于物理测量,如长度、重量、温度、时间等,这些量是可以精确测量的。

# 2. **无限可分性**:连续型数据的取值范围理论上是无限可分的,可以无限精确地细分。例如,你可以测量一个物体的长度为2.5米,也可以更精确地测量为2.53米,甚至2.5376米,等等。

# 3. **数值运算**:连续型数据可以进行数学运算,如加、减、乘、除以及求平均值、中位数、标准差等统计量。

# 在数据分析中,连续型数据的处理和分析方式非常丰富,常见的有:

# - **描述性统计**:计算均值、中位数、众数、标准差、四分位数等,以了解数据的中心趋势和分布情况。

# - **概率分布**:通过拟合概率分布模型,如正态分布、指数分布、伽玛分布等,来理解数据的随机特性。

# - **图形表示**:使用直方图、密度图、箱线图、散点图等来可视化数据的分布和潜在的模式。

# - **回归分析**:建立连续型变量之间的数学关系,预测一个或多个自变量如何影响因变量。

# - 比如西瓜的甜度,大小,价格这些数据就属于连续型数据,可以用于做回归

# 回归就是求回归方程的回归系数的过程

# 说到回归,一般都是指线性回归(linear regression)。线性回归意味着可以将输入项分别乘以一些常量,再将结果加起来得到输出。

# 线性回归是机器学习中一种**有监督学习**的算法,**回归问题**主要关注的是**因变量**(需要预测的值)和一个或多个数值型的**自变量**(预测变量)之间的关系.

# 损失函数

# 一个坐标系中有一个点集 拟合一条直线 去表示这些点 这条线这么取呢?

# 均方差

# 点到线的竖直方向的距离 的平方和 再平均 最小时 这条线最好 估计值与真实值的差距为误差  每个点的误差加起来为总误差 为了避免-号 给每个点的误差平均平方 再加起来

# 平均误差 就是每个点的  预测值-真实值的平方的和在/n 这个就是损失函数

# 平均误差就是损失函数就是均方差

# 目前先令 拟合的线都经过原点 即 y=wx+b b=0

# 已经知道了 一个数据集 列出他的损失函数

# 带入全部的值得到了一个损失值与w的一元2次方程 求损失函数的导数=0是w的值 w的值再带回去 即y的值最小时w的值

# 多参数回归

# 就是不止wx 可能还有其他的变量 多加了很多个未知数

# 均方差为 求y最小的时候 全w1w2w3....的值

# y=(w1x1+...+wnxn-y真)^2+....+.../n

# 用高斯最小二乘法求

# 矩阵的乘法

# 矩阵的除法 A矩阵*A矩阵的转置 = 一个方阵 方阵可以求逆矩阵  方针乘逆矩阵为 单位矩阵 然后矩阵乘单位矩阵为自己 这样变换代替除法

# 链式求导 复合函数求导

#

# API

# sklearn.linear_model.LinearRegression()

# 功能: 普通最小二乘法线性回归, 权重和偏置是直接算出来的,对于数量大的不适用,因为计算量太大,计算量太大的适合使用递度下降法

# 参数:

# fit_intercept bool, default=True

#   是否计算此模型的截距(偏置)。如果设置为False,则在计算中将不使用截距(即,数据应中心化)。

# 属性:    

# coef_ 回归后的权重系数 即W

# intercept_ 偏置 即b

# print("权重系数为:\n", estimator.coef_)  #权重系数与特征数一定是同样的个数。

# print("偏置为:\n", estimator.intercept_)

from sklearn.linear_model import LinearRegression

import numpy as np

def linear_regression():

    model1=LinearRegression(fit_intercept=False) # fit_intercept 是否计算偏置b 它计算完之后有两个重要的属性 系数coef_ 权重即W  截距intercept_偏置 即b

    data=np.array([[0,14,8,0,5,-2,9,-3,399],

                [-4,10,6,4,-14,-2,-14,8,-144],

                [-1,-6,5,-12,3,-3,2,-2,30],

                [5,-2,3,10,5,11,4,-8,126],

                [-15,-15,-8,-15,7,-4,-12,2,-395],

                [11,-10,-2,4,3,-9,-6,7,-87],

                [-14,0,4,-3,5,10,13,7,422],

                [-3,-7,-2,-8,0,-6,-5,-9,-309]])

    x=data[:,0:8]

    y=data[:,8:]

    model1.fit(x,y)

    x_new=[[11,14,8,10,5,10,8,1]] # 定义一个新的数据拿去预测

    y_pre=model1.predict(x_new)

    print(y_pre)

    # print(model1.intercept_)

if __name__=="__main__":

    linear_regression()

    pass

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/19509.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

学习笔记024——Ubuntu 安装 Redis遇到相关问题

目录 1、更新APT存储库缓存: 2、apt安装Redis: 3、如何查看检查 Redis版本: 4、配置文件相关设置: 5、重启服务,配置生效: 6、查看服务状态: 1、更新APT存储库缓存: sudo apt…

【MySQL系列】深入理解MySQL中的存储、排序字符集

前言 在创建数据库时,我们经常会需要填写数据库的所用字符集、排序规则,字符集和排序规则是两个非常重要的概念,它们决定了数据库如何存储和比较字符串数据。在 MySQL 中,常用的存储字符集有 utf8、utf8mb4,而排序字符…

tcp 超时计时器

在 TCP(传输控制协议)中有以下四种重要的计时器: 重传计时器(Retransmission Timer) 作用:用于处理数据包丢失的情况。当发送方发送一个数据段后,就会启动重传计时器。如果在计时器超时之前没有…

Docker部署ES7.9.3单节点

Elasticsearch(简称ES)是一个分布式、可扩展、实时的搜索与数据分析引擎! Elasticsearch位于Elastic Stack核心,为所有类型的数据提供近乎实时的搜索和分析。无论是结构化或非结构化文本、数字数据还是地理空间数据,El…

ChromeDriver驱动下载地址更新(保持最新最全)

说明: ChromeDriver 是 Selenium WebDriver 用于控制 Chrome 的独立可执行文件。 为了方便下载使用,本文保持ChromeDriver的最新版本更新,并提供115.0.5763.0-133.0.6841.0版本的下载地址: 所有版本和下载地址: &am…

CSS:高级寄巧

精灵图 为什么需要精灵图呢? 一个网页中往往会应用很多小背景图作为修饰,当网页中的图像过多时,服务器就会频繁地接收和发送 请求图片,造成服务器请求压力过大,这将大大降低页面的加载速度。 因此,为了有…

AutosarMCAL开发——基于EB DsAdc驱动

目录 一、旋转变压器与DsAdc原理1.常见电机角度反馈方式2.可变磁阻旋变工作原理3.使用TC3XX EDSADC进行旋变软解码 二、EB配置1.载波输出2.通道配置3.调制器4.滤波链路5.整流6.积分 三、Mcal接口应用1.AUtosar标准API接口2.应用步骤 四、总结 一、旋转变压器与DsAdc原理 1.常见…

web应用安全和信息泄露预防

文章目录 1:spring actuator导致的信息泄露1.1、Endpoint配置启用检测1.2、信息泄露复现1.3、防御 2:服务端口的合理使用3:弱口令(密码)管理4:服务端攻击4.1、短信业务,文件上传等资源型接口1、…

C语言:链表

链表是一种常见的线性数据结构,其中每个元素(称为节点)包含两部分:数据和指向下一个节点的指针。链表的主要优点是插入和删除操作的时间复杂度较低,但随机访问的效率不如数组。 1. 链表的基本概念 节点(N…

webpack配置

4-3vue-loader测试_哔哩哔哩_bilibili 一.新建文件夹vue_todo,vscode打开 二.ctrl打开终端,输入npm init -y,快速生成一个默认的package.json文件 之后左边出现项目初始化文件package.json 三.接下来需要webpack完成打包,所以安装…

字节跳动辞退103人

大家好,我是程序员面试刷题平台的鸭鸭! 在前阵子实习生破坏大模型训练事件之后,字节又上了一次热搜。 鸭鸭吃完瓜,只能说,社会险恶啊同学们! 5 号,字节跳动内部发布了年内第四份《企业纪律与职…

大型语言模型综述 A Survey of Large Language Models

文章源自 2303.18223 (arxiv.org) 如有侵权,请通知下线 这是一篇关于大语言模型(LLMs)的综述论文,主要介绍了 LLMs 的发展历程、技术架构、训练方法、应用领域以及面临的挑战等方面,具体内容如下: 摘要…

服务器作业4

[rootlocalhost day04]# vim 10.sh [rootlocalhost day04]# cat 10.sh #通过shell脚本分析部署nginx网络服务 #1.接收用户部署的服务名称 read -p "服务名称:(nginx)" server if [ $server ! nginx ];then echo "输入的不是nginx,脚本退出" exit 1…

Linux基础(二十)——程序管理与 SELinux 初探

程序管理与 SELinux 初探 1. 程序和进程2.程序调用流程3. 一个bash中的多任务工作管理4.进程管理4.1 查询进程4.2 进程的执行顺序 5.系统资源的观察6. /proc/* 代表的意义7.SELinux 1. 程序和进程 2.程序调用流程 程序与进程之间的关系: 从上图可以看出&#xff0…

vue3 路由写法及传参方式 !超详细

Vue Router 是 Vue.js 官方的路由管理器。它主要用于单页面应用程序(SPA, Single Page Application)中,帮助解决页面导航、组件复用等问题。 基本的使用 1.router配置文件代码 创建一个ts文件,用来写路由器 // 创建一个路由器,并暴露出去 …

MATLAB绘制正四面体、正六面体

MATLAB绘制正四面体、正六面体 clc;close all;clear all;warning off;% clear all rand(seed, 100); randn(seed, 100); format long g;% 正四面体(Tetrahedron) % 顶点坐标(正四面体的顶点位于一个正方体的对角线上,并经过适当缩…

一文了解 inductive bias(归纳偏好)

🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 归纳偏好(Inductive Bias)是机器学习中的一个非常基础但又非常重要的概念。为了更好地理解它,我们先从 “归纳” 和 “偏好” 这两个词开始讲解。 什么是归纳&#x…

leetcode844:比较含退格的字符串

题干 题目分析 两个字符串要进行比较,#代表着回车,也就是删除之前的字符。 若按照遍历的惯例,选择从前到后遍历,但这样没法判断,因为#之前被删除的部分是不需要相同的。 因此考虑到#的含义,我们应该选择从…