数模打怪(七)之回归分析

一、什么是回归分析

1、回归分析的含义

回归分析:通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的。

在绝大多数情况下,我们没有能力去探究严格的因果关系,只能通过回归分析,研究相关关系。

2、回归分析的使命 

拟合:专注于通过直线来描述数据的趋势,不涉及深入的统计分析或解释

回归:建立一个有解释力的模型,并对变量之间的关系进行统计分析

拟合(先承认了变量之间存在相关关系),是回归分析中分析变量相关方向与相关强度的一种方法。 已知线性的情况下,拟合≈回归。

3、回归分析的分类

4、关于数据 

横截面数据:在某一时点收集的不同对象的数据 

时间序列数据:对同一对象不同时间连续观察所取得的数据

面板数据:横截面数据与时间序列数据综合起来的一种数据资源

(比如:2008-2018年,我国各省份GDP的数据)

二、线性回归

1、模型理解(理论)

线性:

经过取对数或平方后,让自变量和因变量之间呈线性关系也是可以的。 

内生性:

误差项u包含与y相关但是没有添加进模型的“不重要”变量,如果这些变量和模型添加的自变量相关,则存在内生性,会导致回归系数估计得不准确。

核心解释变量和控制变量:

解决内生性:新增控制变量,把一些对被解释变量有影响的“不重要” 变量放进回归方程,

然后在实际应用中只要保证核心解释变量与u不相关即可。

四类回归系数: 

取对数: 

 定性变量->设成虚拟变量:

2、实战: 

题目解析:

1、分析评价量(因变量)和其他变量的关系:不需要去除量纲的影响

2、研究影响评价量的重要因素:需要去除量纲的影响使用标准化回归系数,系数绝对值越大说明影响越大只关注显著的回归系数哦

准备工作:

1、excel表格->插入表格,建立超级表进行数据的筛选,或者用数据透视表

(看看数据值的范围) 

2、Stata

清屏:cls(matlab:clc)

清空变量窗口:clear

调上一个命令:pageup(matlab:⬆)

生成新变量:generate 变量名=怎么的到这个变量(price^2)

变量改名字:rename 旧名 新名

(1)导入数据:

文件->导入excel表格(将第一行作为变量名)

也可以代码导入import excel...

(2)保存代码文件:

新Do-file编辑器,把代码粘过去,然后保存文件(.do)

 

(3)处理数据:

统计描述

写sum或tab,然后双击选择右上变量窗口的变量,或者直接拖过来粘贴

复制表格到excel,处理成三线表

引入定性数据后 ,stata会自动查重,引入虚拟变量的个数是分类数-1(为了避免完全多重共线性的影响)

 小技巧:把指标的说明做成一张表

进行回归分析: 

coef:回归系数

p越小(->0),越能推翻H0,越能说明回归系数显著异于0 

关于拟合优度可能出现的一些问题:

  

标准化回归系数: 

标准化:原始数据减去平均数,再除以标准差

注意事项: 

1、数据不能进行归一化处理!

归一化:将数据缩放到[0, 1]的范围,但是这样每个特征对模型的影响权重就相对均衡了

标准化:为了消除量纲的影响

2、要在论文中说明计算出的回归系数和显著性

3、不能轻易在模型中添加高次项,不然系数不好解释

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/146608.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

小米 13 Ultra机型工程固件 资源预览与刷写说明 步骤解析

小米 13 Ultra机型---机型代码为ishtar 。工程固件可以辅助修复格机或者全檫除分区后的基带修复。可以用于修复TEE损坏。以及一些分区的底层修复。此款固件也可以为更换UFS后的底包。 通过博文了解 1💝💝💝-----此机型工程固件的资源分享 下载 刷写注意事项 2💝💝…

加薪非要老总批?——职责链模式

文章目录 加薪非要老总批?——职责链模式加薪代码初步职责链模式职责链的好处加薪代码重构加薪成功 加薪非要老总批?——职责链模式 老板,我要加薪! 时间:7月2日20点  地点:小菜、大鸟住所的客厅  人…

奇安信渗透2面经验分享

《网安面试指南》http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247484339&idx1&sn356300f169de74e7a778b04bfbbbd0ab&chksmc0e47aeff793f3f9a5f7abcfa57695e8944e52bca2de2c7a3eb1aecb3c1e6b9cb6abe509d51f&scene21#wechat_redirect 《Java代码审…

学习笔记——ViT(Vision Transformer)

谷歌团队探索了 Transformer 在图像识别中的直接应用。 Vision Transformer(ViT)是一种基于Transformer架构的深度学习模型,用于图像识别和计算机视觉任务。与传统的卷积神经网络(CNN)不同,ViT直接将图像视…

20240921解决使用PotPlayer在WIN10电脑播放4K分辨率10bit的视频出现偏色的问题

20240921解决使用PotPlayer在WIN10电脑播放4K分辨率10bit的视频出现偏色的问题 2024/9/21 10:40 缘起:常见的问题,你下载视频的时候,4K分辨率的视频播放的时候出现偏色异常,但是1080p分辨率的正常呀! 偏色的识别&…

华为地图服务 - 如何实现地图数据聚合效果? -- HarmonyOS自学20

场景介绍 本章节将向您介绍如何根据地图数据实现聚合效果。 您可以通过比例尺缩放自适应聚合效果,聚合图标可点击。聚合支持功能: 支持按距离聚合ClusterItem。支持绘制聚合Overlay的默认图标。支持绘制聚合Overlay的自定义图标。支持监听聚合Overlay…

祛“魅”霸王茶姬

“奔着员工福利可以每天喝奶茶去的,我在招聘软件上尝试约了霸王茶姬的面试,想着应该也不会太累,推荐去吗?”一位霸王茶姬的重度爱好者在社交平台发帖问。 茶饮界的“网红”“顶流”,年轻人的“新宠”,霸王…

巴蒂克图案识别系统源码分享

巴蒂克图案识别检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer V…

一文掌握 Prompt:万能框架+优化技巧+常用指标

Prompt 万能框架 在编写 Prompt 时,从0到1的编写出第一版 Prompt 往往是最难的,而基于已有 Prompt 利用各种技巧进行优化则相对简单。善于解决 “数理问题” 的我们在面对这样一个偏 “文理问题” 的任务时,就像小时候写作文一样难以提笔。如…

Java程序员在编写代码时,通常会使用哪些工具和框架?

Java程序员在日常编码工作中,通常会使用一系列工具和框架来提高开发效率、保证代码质量以及实现快速迭代。以下是一些常用的工具和框架: 开发环境和IDE IntelliJ IDEA:一个强大的Java集成开发环境,提供了智能代码补全、代码分析…

攻防世界Web新手练习区题目(view_source到simple_php)WP

目录 view_source​ robots​ Training-WWW-Robots PHP2​ get_post​ backup​ cookie​ disabled_button​ simple_js​ xff_referer​ weak_auth​ command_execution​ simple_php​ view_source 获取在线场景后访问题目场景 在右键不管用的情况下&#xff0…

一招教你挑代理IP的秘诀

逛乎,一直刷到这类问题: 本质上,都是在面对市面上那么多代理IP服务提供商,挑得眼花缭乱了,而代理IP直接影响到我们数据采集任务的效率、安全性和成功率,所以我们在挑选服务提供商的时候都会谨慎一些。索性我…

华为OD机试 - 水仙花数Ⅱ - 动态规划(Python/JS/C/C++ 2024 E卷 200分)

华为OD机试 2024E卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试真题(Python/JS/C/C)》。 刷的越多,抽中的概率越大,私信哪吒,备注华为OD,加入华为OD刷题交流群,…

JavaWeb--纯小白笔记03:servlet入门---动态网页的创建

笔记:index.html在tomcat中为默认的名字,html里面的语法不严谨。改配置文件要小心,不然容易删掉其他 Servlet:服务器端小程序,写动态网页需要用Servlet,普通的java类通过继承HttpServlet,可以响…

抖音如何改ip地址到另外城市

在数字化时代,抖音作为广受欢迎的社交媒体平台,不仅连接了亿万用户,也成为了展示个人生活、分享创意内容的重要舞台。然而,有时候出于隐私保护等需求,用户可能希望更改抖音账号显示的IP地址,使其看起来像是…

超过1000篇文献?Mem)oRAG,下一代 RAG 技术,轻松让AI记住这些海量信息?

想象一下,你每天要阅读几十篇文献,整理上千页的笔记,再将这些信息整合到自己的研究中,是不是有点头大?不光是你,很多人都有这样的困扰,尤其是在处理大量信息时。我们总是渴望一种更智能的方式,能帮我们高效地找到、理解并且运用这些知识。而这正是 MemoRAG 的用武之地。…

会声会影2025视频剪辑教学

会声会影2025是一款超级受欢迎的视频播放软件,用于剪辑和编辑各种类型的视频素材。软件具有直观的用户界面,使得即使对于初学者来说也能轻松上手。该软件提供了各种创意工具,可以帮助用户实现他们的创意想法。用户可以裁剪、合并和重新排列视…

基于误差状态的卡尔曼滤波

基于误差状态的卡尔曼滤波ESKF 注意这里的观测方程,是IMU的误差状态和激光定位的差值得到的。

已解决sublime text 3 注册激活

问题:未激活 解决方法: 安装sublime3后,将Patch.exe文件放入sublime 安装文件下 运行Patch.exe,复制粘贴注册码到 preference->enter license;操作如下 点击“Use license”,提示如下图表示激活成功: 重…