局部加权回归

2. 局部加权回归 (Loess / Lowess)

局部加权回归是一种非参数回归方法,可以自适应地拟合数据的弧度。它对每个点应用加权回归,以根据数据的局部趋势产生一条平滑曲线。这种方法特别适合捕捉数据中较小的曲率变化。

  • 优点:能够很好地拟合微小的非线性变化,不需要指定多项式的次数。
  • 缺点:计算量较大,不适合处理特别大的数据集,且局部加权回归的结果缺乏全局方程,因此解释性可能稍弱。

局部加权回归(Lowess 或 Loess)是一种非参数方法,它能够捕捉数据中的局部非线性趋势,适合于观察数据的平滑变化。我们可以使用 statsmodels 库中的 lowess 函数来实现。以下代码示例展示了如何使用 Lowess 对数据进行回归,并绘制回归曲线及其置信区间。

代码示例

import numpy as np
import matplotlib.pyplot as plt
from statsmodels.nonparametric.smoothers_lowess import lowess
from sklearn.utils import resample# 生成一些带有轻微非线性趋势的样本数据
np.random.seed(42)
x = np.linspace(0, 10, 100)
y = np.sin(x) + 0.3 * x + np.random.normal(0, 0.2, size=x.shape)# 使用 Lowess 进行局部加权回归
frac = 0.3  # 平滑参数,决定窗口大小,数值越小平滑度越低
lowess_result = lowess(y, x, frac=frac)# 获取拟合的 y 值
y_pred = lowess_result[:, 1]# 使用 Bootstrap 方法计算置信区间
n_bootstraps = 200
y_pred_bootstrap = []for _ in range(n_bootstraps):# 随机采样并计算 Lowess 拟合x_boot, y_boot = resample(x, y)lowess_boot = lowess(y_boot, x_boot, frac=frac)# 将拟合值插值到原始 x 上y_pred_interpolated = np.interp(x, lowess_boot[:, 0], lowess_boot[:, 1])y_pred_bootstrap.append(y_pred_interpolated)# 将预测结果转换为数组
y_pred_bootstrap = np.array(y_pred_bootstrap)# 计算置信区间
lower_bound = np.percentile(y_pred_bootstrap, 2.5, axis=0)
upper_bound = np.percentile(y_pred_bootstrap, 97.5, axis=0)# 绘制散点图、回归曲线和置信区间
plt.figure(figsize=(10, 6))
plt.scatter(x, y, color='gray', label='Data Points')
plt.plot(x, y_pred, color='blue', label='Lowess Regression')
plt.fill_between(x, lower_bound, upper_bound, color='lightblue', alpha=0.5, label='95% Confidence Interval')
plt.xlabel('x')
plt.ylabel('y')
plt.title('Lowess Regression with 95% Confidence Interval')
plt.legend()
plt.show()

代码说明

  1. 数据生成:生成带有非线性趋势的样本数据 y = sin ⁡ ( x ) + 0.3 × x + noise y = \sin(x) + 0.3 \times x + \text{noise} y=sin(x)+0.3×x+noise
  2. Lowess 拟合:使用 statsmodels.nonparametric.smoothers_lowess.lowess 函数,设置 frac 参数来控制平滑度。较小的 frac 值会产生更局部化的拟合,适合较快变化的非线性数据。
  3. Bootstrap 置信区间:通过引导法 (Bootstrap) 生成 200 组不同的样本集,对每组样本进行 Lowess 回归拟合。然后使用 np.interp 将每组拟合值插值到原始 x 位置,以便计算置信区间。
  4. 置信区间计算:对所有拟合样本的结果,取 2.5 和 97.5 百分位数,得到 95% 的置信区间。
  5. 绘图:绘制数据点、Lowess 回归曲线和置信区间。

输出图形


在这里插入图片描述

执行代码后将生成如下内容:

  • 灰色散点图:展示原始数据点分布。
  • 蓝色的 Lowess 回归曲线:平滑的局部加权回归结果。
  • 淡蓝色置信区间:基于 Bootstrap 生成的 95% 置信区间。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/326.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

湘潭市学生公交卡线上申领流程及一寸照片自拍方法

在湘潭市,学生公交卡的线上申领流程已经非常便捷,同时,为了满足学生公交卡申领时所需的一寸照片要求,本文将详细介绍整个申领流程以及如何使用手机自拍并制作线上申领学生公交卡所需的一寸照片电子版。 一、湘潭市学生公交卡线上申…

STM32HAL-最简单的长、短、多击按键框架(多按键)

概述 本文章使用最简单的写法实现长、短、多击按键框架,非常适合移植各类型单片机,特别是资源少的芯片上。接下来将在stm32单片机上实现,只需占用1个定时器作为时钟扫描按键即可。 一、开发环境 1、硬件平台 STM32F401CEU6 内部Flash : 512Kbytes,SARM …

研究了100个小绿书十万加之后,我们发现2024小绿书独家秘籍就是:在于“先抄后超,持续出摊,量大管饱”!

小绿书作为今年最大的红利,很多人已经吃到了螃蟹。看——: 今天我们总结了100个10万爆款,我们发现要在这个平台上脱颖而出,找到属于自己的方法尤为重要。在这里分享一个主题——小绿书的秘诀就是“先抄后超,持续出摊”…

鸿蒙原生应用开发及部署:首选华为云,开启HarmonyOS NEXT App新纪元

目录 前言 HarmonyOS NEXT:下一代操作系统的愿景 1、核心特性和优势 2、如何推动应用生态的发展 3、对开发者和用户的影响 华为云服务在鸿蒙原生应用开发中的作用 1、华为云ECS C系列实例 (1)全维度性能升级 (2&#xff…

[mysql]数据定义语言DDL和数据操作语言DCL

目录 前文提要 数据定义语言DDL 数据操作语言DML 数据控制语言DCL 基础知识: 标识符(命名规则): 数据定义语言DDL 创建和管理数据库.: 管理数据库 切换数据库 修改数据库 更改数据库字符集 删除数据库 如何创建表 方式1:”白手起家的方式”创建表 方式2:已经有…

redis:基本全局命令-键管理(1)

个人主页 : 个人主页 个人专栏 : 《数据结构》 《C语言》《C》《Linux》《网络》 《redis学习笔记》 文章目录 前言KEYSEXISTSDELEXPIRETTLTYPE 总结 前言 本文是作为基本全局命令-键管理的学习笔记 redis 是按照键值对的方式存储数据的,red…

【工具变量】大数据管理机构改革DID(2007-2023年)

数据简介:数字ZF是指以新一代信息技术为支撑,重塑政务信息化管理架构、业务架构、技术架构的现代化治理模式。随着数字政府的建设,特别是借助大数据等新一代数字技术,极大地提升了政府的治理能力,从而起到辅助监管机构…

自编以e为底的对数函数ln,性能接近标准库函数

算法描述: (1). 先做自变量x的范围检查,不能出现负数和0. 自己使用时,如果能通过其它途径保证自变量为正,那么可以省略这两个判断,提高速度。 (2). 根据IEEE 754浮点数的格式,,则 ln(x)kln(2)ln…

[vulnhub] billu: b0x

https://www.vulnhub.com/entry/billu-b0x,188/ 主机发现端口扫描 使用nmap扫描网段类存活主机 因为靶机是我最后添加的,所以靶机IP是168 nmap -sP 192.168.75.0/24 Starting Nmap 7.94SVN ( https://nmap.org ) at 2024-10-28 18:54 CST Nmap scan report for 192.…

《机器人SLAM导航核心技术与实战》第1季:第10章_其他SLAM系统

视频讲解 【第1季】10.第10章_其他SLAM系统-视频讲解 【第1季】10.1.第10章_其他SLAM系统_RTABMAP算法-视频讲解 【第1季】10.2.第10章_其他SLAM系统_VINS算法-视频讲解 【第1季】10.3.第10章_其他SLAM系统_机器学习与SLAM-视频讲解 第1季:第10章_其他SLAM系统 …

JDK8---Stream流详解

Stream流 一.概述二.数据准备二.Stream流的创建2.1 单列集合创建Stream流.2.2 数组创建Stream流2.3 双列集合创建Stream流 三. 中间操作.3.1 filter(过滤操作)3.2 map(计算或者转换)3.3 distinct(去重操作)3.4 sorted(排序操作)3.5 limit (设置流的长度)3.6 skip(跳过前n个元素…

tcp shutdown, fin_wait1, fin_wait2, close_wait, last_ack, 谢特!

TCP 作为双向传输协议,如果你想只收不发,可以单向关掉发,shutdown(socket.SHUT_WR),但不建议这么做。 看以下代码: #!/Users/zhaoya/myenv/bin/python3 # client import socketclient_socket socket.socket(socket.…

算法详解——线段树

1. 线段树介绍 线段树是一个高度平衡二叉树,它主要用来高效动态地管理一个序列。线段树叶子结点存储序列元素值,分支结点存储一个连续地子区间的某种聚合信息,例如最值、均值等信息。 如图所示: 用这样一个树状结构来管理序列…

XXL-JOB

Github 地址: https://github.com/xuxueli/xxl-job/ 。 官⽅介绍: https://www.xuxueli.com/xxl-job/ 。 XXL-JOB 于 2015 年开源,是⼀款优秀的轻量级分布式任务调度框架,⽀持任务可视化管理、弹性 扩容缩容、任务失败重试和告…

基于 Python 的 Django 框架开发的电影推荐系统

项目简介:本项目是基于 Python 的 Django 框架开发的电影推荐系统,主要功能包括: 电影信息爬取:获取并更新电影数据。数据展示:提供电影数据的列表展示。推荐系统:基于协同过滤算法实现个性化推荐。用户系…

服务器的免密登录和文件传输

在天文学研究中,通常会采用ssh登录服务器,把复杂的计算交给服务器,但是如果你没有进行额外的配置,那么登录服务器,以及和服务器进行文件传输,每次都要输入账号和密码,比较不方便,Win…

interrupt、interrupted、isInterrupted方法详解

interrupt方法的源码: public void interrupt() {if (this ! Thread.currentThread())checkAccess();synchronized (blockerLock) {Interruptible b blocker;if (b ! null) {interrupt0(); //仅仅对当前线程的中断位进行标记b.interrupt();return;}}interrupt0()…

yarn 下载安装、下载依赖、通过 vscode 运行服务(Windows11)

目录 yarn工具前置要求:安装node.js并配置好国内镜像源下载安装下载依赖特别的: 启动服务 yarn 工具 系统:Windows 11 前置要求:安装node.js并配置好国内镜像源 参考:本人写的《node.js下载、安装、设置国内镜像源…

JDK8 Kylin jdk-8u341-linux-x64.tar.gz

JDK8 Kylin jdk-8u341-linux-x64.tar.gz chmod 777 jdk-8u341-linux-x64.tar.gz tar -zxvf jdk-8u341-linux-x64.tar.gz chmod 777 -R jdk1.8.0_341 vi /etc/profile ESC :wq source /etc/profile java -version eclipse JRE tomcat

ssm基于vue框架和elementui组件的手机官网+vue

系统包含:源码论文 所用技术:SpringBootVueSSMMybatisMysql 免费提供给大家参考或者学习,获取源码请私聊我 需要定制请私聊 目 录 目 录 III 1 绪论 1 1.1 研究背景 1 1.2 目的和意义 1 1.3 论文结构安排 2 2 相关技术 3 2.1 SSM框…