Python和C++及R相关系数数学统计学可视化和神经模型及评估指标

🎯要点

  1. 较少统计样本显著性评估和变量关系梳理
  2. 功能磁共振成像一致性分析
  3. 检测非单调关联性结构
  4. 随机变量动力学相关性
  5. 热图和矩阵图基因疫苗非线性变量相关性
    在这里插入图片描述

Python相关矩阵

相关矩阵

n n n 个随机变量 X 1 , … , X n X_1, \ldots, X_n X1,,Xn 的相关矩阵是 n × n n \times n n×n 矩阵 C C C,其 ( i , j ) (i, j) (i,j) 条目为
c i j : = corr ⁡ ( X i , X j ) = cov ⁡ ( X i , X j ) σ X i σ X j , if  σ X i σ X j > 0 c_{i j}:=\operatorname{corr}\left(X_i, X_j\right)=\frac{\operatorname{cov}\left(X_i, X_j\right)}{\sigma_{X_i} \sigma_{X_j}}, \quad \text { if } \sigma_{X_i} \sigma_{X_j}>0 cij:=corr(Xi,Xj)=σXiσXjcov(Xi,Xj), if σXiσXj>0
因此对角线条目都是相同的。如果使用的相关性度量是乘积矩系数,则相关矩阵与标准化随机变量 X i / σ ( X i ) X_i / \sigma\left(X_i\right) Xi/σ(Xi) 的协方差矩阵相同,其中 $i=1, \dots, n $。这既适用于总体相关性矩阵(在这种情况下 σ \sigma σ 是总体标准差),也适用于样本相关性矩阵(在这种情况下 σ \sigma σ 表示样本标准差)。因此,每个矩阵都必然是正半定矩阵。此外,如果没有变量可以将其所有值精确地生成为其他变量值的线性函数,则相关矩阵是严格正定的。

相关矩阵是对称的,因为 X i X_i Xi X j X_j Xj 之间的相关性与 X j X_j Xj X i X_i Xi 之间的相关性相同。例如,相关矩阵出现在多重确定系数的一个公式中,多重确定系数是多重回归中拟合优度的一种度量。

在统计建模中,表示变量之间关系的相关矩阵被分为不同的相关结构,这些结构通过估计它们所需的参数数量等因素来区分。例如,在可交换相关矩阵中,所有变量对都被建模为具有相同的相关性,因此矩阵的所有非对角元素彼此相等。另一方面,当变量表示时间序列时,通常使用自回归矩阵,因为当测量时间更接近时,相关性可能会更大。

相关矩阵市场应用

让我们考虑相关矩阵在识别线性相关的股票中的应用。下面是使用 yfinance Python 库检索几只大型科技股的历史定价数据的一些示例代码。

import yfinance as yf
import pandas as pdtickers = ['msft', 'aapl', 'tsla', 'nvda', 'goog']
df = yf.download(ticker=tickers, period='6mo')['Adj Close']# ResultAAPL         GOOG        MSFT        NVDA        TSLA
Date                                                                   
2021-01-22  138.627029  1901.050049  224.911453  137.046280  846.640015
2021-01-25  142.464767  1899.400024  228.474991  136.454132  880.799988
2021-01-26  142.704010  1917.239990  231.262131  134.275360  883.090027
2021-01-27  141.607513  1830.790039  231.829514  129.103348  864.159973
2021-01-28  136.653336  1863.109985  237.831787  130.435074  835.429993
...                ...          ...         ...         ...         ...
2021-07-15  148.479996  2625.330078  281.029999  189.662506  650.599976
2021-07-16  146.389999  2636.909912  280.750000  181.610001  644.219971
2021-07-19  142.449997  2585.080078  277.010010  187.797501  646.219971
2021-07-20  146.149994  2622.030029  279.320007  186.119995  660.500000
2021-07-21  145.399994  2652.010010  281.399994  194.100006  655.289978

yfinance download() 方法默认提供开盘价-最高价-最低价-收盘价 (OHLC) 数据,包括开盘价、最高价、最低价、收盘价、成交量、调整收盘价。这里我们仅提取了过去 6 个月内每只股票每日调整收盘价数据。

鉴于这些股票都来自同一行业,并且是市场上交易量最大的股票,因此它们的价格很有可能会一起变动。也就是说,当 M S F T MSFT MSFT 的价格上涨时, G O O G GOOG GOOG 的价格很可能也会上涨。不过,这只是猜测,让我们创建一个相关矩阵来验证我们的假设。

>>> data.corr()# ResultAAPL      GOOG      MSFT      NVDA      TSLA
AAPL  1.000000  0.429290  0.708614  0.634802  0.407953
GOOG  0.429290  1.000000  0.894801  0.882468 -0.535120
MSFT  0.708614  0.894801  1.000000  0.911506 -0.218011
NVDA  0.634802  0.882468  0.911506  1.000000 -0.243408
TSLA  0.407953 -0.535120 -0.218011 -0.243408  1.000000

这些结果详细列出了 6 个月期间每只股票调整后收盘价之间的相关系数,可供交叉引用。请注意,1.0 的值从左上角向右下角对角移动。这些值反映了完美的相关性,因为它们引用的是同一只股票。换句话说,$AAPL 和 $AAPL 之间的相关系数为 1.0,因为它们始终完全相同!

矩阵中的相关系数介于 -1 到 1 之间,其中 -1 表示完全负相关,0 表示无相关,1 表示完全正相关。考虑这些值可以让我们识别价格一起变动的不同股票,无论是正向变动还是负向变动。关于如何解释这些结果,存在不同的学派,但一般来说,高于 .7 和低于 -.7 的值被视为可能存在共线性的危险信号。在这种情况下,应进行进一步调查,以确保得到的线性模型具有最小的误差。

上面的表格非常有见地,但在解释大型数据集时,它并不是最友好的格式。相关矩阵在其他应用中很有用,例如对特征工程等应用程序的变量进行快速初步评估。在这些情况下,使用一种更直观的格式,称为热图。

matplotlib 和 seaborn 都提供了生成这些可视化效果的宝贵工具。让我们使用seaborn 生成一个相关矩阵热图来直观地表示我们的定价相关性。

import seaborn as sns
import matplotlib.pyplot as pltcmap = sns.diverging_palette(230, 20, as_cmap=True)sns.heatmap(data=data.corr(),  linewidths=0.3,  square=True,   cmap=cmap,  vmax=1,  vmin=-1, center=0, cbar_kws={"shrink": .75}  )plt.yticks(rotation=0)  
plot.show()

在此热图中,最接近深棕色的值表示更强的正相关性。那些更接近深蓝色的值表示更强的正负相关性。由于相关矩阵中数据组织的性质,存在大量冗余数据。例如,从左上角到右下角对角线上方的每个单元格都是下半部分的重复。我们可以通过在之前的代码中添加掩码来减少这些:

import numpy as npmask = np.triu(np.ones_like(data.corr(), dtype=bool))
np.fill_diagonal(mask, False)  # keeps the diagonal[[False  True  True  True  True][False False  True  True  True][False False False  True  True][False False False False  True][False False False False False]]sns.heatmap(..., mask=mask, ...)

通过从我们的可视化中删除冗余数据,我们创建了一种更高效的技术股相关系数关系表示。从这种映射中获得的见解可以帮助确定在应用程序中应使用哪些特征,例如使用线性回归预测股价或为更复杂的建模设计特征。

从交易者/投资者角度理解相关矩阵

  • 分散化:交易者可以使用相关矩阵来识别弱相关或负相关的股票,从而帮助他们分散投资组合。通过投资不朝同一方向变动的股票,交易者可以潜在地降低其投资组合的整体风险。
  • 风险管理:相关性分析可以通过突出显示倾向于共同波动的股票来帮助交易者识别和管理风险。通过了解这些关系,交易者可以调整头寸并对冲潜在的损失。
  • 市场情绪分析:相关矩阵还可以提供对市场情绪的洞察。例如,如果某个行业或市场中的大多数股票高度相关,则可能表明它们都受到共同因素的影响,例如广泛的市场趋势、经济状况或地缘政治事件。这些信息可以帮助交易者对其投资做出明智的决策。

👉更新:亚图跨际

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/144728.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

视频去噪技术分享

视频去噪是一种视频处理技术,旨在从视频帧中移除噪声和干扰,提高视频质量。噪声可能由多种因素引起,包括低光照条件、高ISO设置、传感器缺陷等。视频去噪对于提升视频内容的可视性和可用性至关重要,特别是在安全监控、医疗成像和视…

迅为3A6000_7A2000开发板龙芯全国产处理器LoongArch架构核心主板

龙芯 3A6000 处理器完全自主设计、性能优异,代表了我国自主桌面 CPU 设计领域的最新里程碑成果。龙芯 3A6000 处理器的推出,说明国产 CPU 在自主可控程度和产品性能上已双双达到新高度,也证明了国内有能力在自研 CPU 架构上做出一流的产品。 …

聊聊AUTOSAR:基于Vector MICROSAR的TC8测试开发方案

技术背景 车载以太网技术作为汽车智能化和网联化的重要组成部分,正逐步成为现代汽车网络架构的核心,已广泛应用于汽车诊断(如OBD)、ECU软件更新、智能座舱系统、高清摄像头环视泊车系统等多个领域。 在这个过程中,ET…

SpringCloud 基于 web 的只会养老平台

摘要 首先,论文一开始便是清楚的论述了系统的研究内容。其次,剖析系统需求分析,弄明白“做什么”,分析包括业务分析和业务流程的分析以及用例分析,更进一步明确系统的需求。然后在明白了系统的需求基础上需要进一步地设计系统,主要包罗软件架构模式、整体功能模块、数据库设计…

Django SQL注入-漏洞分析

1.进入项目界面 图1 项目主界面 2.访问任意不存在的目录路径报错,提示存在demo接口 图2 提示存在接口 3.访问/demo/,提示有一个name参数 图3 发现隐藏参数 4.对接口参数进行fuzz(实战思路),vulfocus已经给出了/demo?…

Cypress安装与启动(开始学习记录)

一 Cypress安装 使用npm安装 1.查看node.js npm的版本,输入 npm --version 和 node --version,node.js没安装的可以去中文网下载最新稳定版安装,npm不建议升级到最新版本,会导致安装Cypress时Error: Cannot find module ansi-st…

一篇文章解决ComfyUI常见的故障报错!

前言 学习和使用ComfyUI最痛苦的是什么?就是这满屏的红色方框和和[报错信息] “报错信息”),处理完一批又一批,很多人玩了一两个流程就搞不下去了,很多初学者因此就放弃了。 有道是:配置流程大半天,跑通出…

C++速通LeetCode中等第9题-合并区间

排序后迭代&#xff0c;遇到符合条件的就删除前一项&#xff0c;合并到后一项。 class Solution { public:vector<vector<int>> merge(vector<vector<int>>& intervals) {int left 0,right 0;sort(intervals.begin(), intervals.end());vector&…

YOLOv5模型部署教程

一、介绍 YOLOv5模型是一种以实时物体检测闻名的计算机视觉模型&#xff0c;由Ultralytics开发&#xff0c;并于2020年年中发布。它是YOLO系列的升级版&#xff0c;继承了YOLO系列以实时物体检测能力而著称的特点。 二、基础环境 系统&#xff1a;Ubuntu系统&#xff0c;显卡…

妙笔生花,扩散模型技术探索与分享

一、引言 扩散模型因其强大的图像生成能力引发了巨大的关注,一度达到取代人类插画师的地步。在这个创意无界、视觉为王的时代,扩散模型正悄然带来一场前所未有的视觉盛宴,受到业界广泛关注。OpenAI轰动一时的“Sora”、淘宝AI制图工具“绘蛙”、京东内容创作平台“京点点”…

ATE自动化测试系统集成:软件与硬件的技术结合

ate测试系统集成通常是指将测试软件、测试硬件(如示波器、数字万用表、矢网等)与通信技术组合起来&#xff0c;从而满足产品的测试需求。ATE测试系统集成已经成为提高电子产品测试效率和精度的必要手段。它将多种测试工具与自动化技术相结合&#xff0c;以满足不断升级的测试标…

坦白了,因为这个我直接爱上了 FreeBuds 6i

上个月&#xff0c;华为发布的 FreeBuds 6i 联名了泡泡玛特真的超级惊艳&#xff0c;不少宝子被这款耳机的颜值所吸引&#xff0c;而它的实力更是不容小觑的。FreeBuds 6i 是一款性能强大的降噪耳机&#xff0c;它一直在强调平均降噪深度&#xff0c;但是应该很多人对这个概念很…

从“治理”到“智理”,看大模型如何赋能智慧政务

一、从治理到智理的飞跃 在智慧城市的建设蓝图中&#xff0c;智慧政务如同一股不可忽视的力量&#xff0c;正悄然改变着城市的治理面貌。传统意义上&#xff0c;“治理”往往意味着对复杂社会现象的被动应对&#xff0c;而“智理”则预示着通过智能化手段主动预见、解决问题的…

notepad++的json查看

json文件查看 因为接触到3dtile模型&#xff0c;所以经常需要和json打交道&#xff0c;但是很多模型是下面这种情况&#xff0c;不好阅读&#xff0c;所以可以使用notepad的插件查看 正常打开是这样的 加载notepad插件 搜索json下载安装就可以了 如果网络抽象&#xff0c;下载…

性价比头戴式无线耳机推荐哪款好?四款宝藏性价比机型测评盘点

当消费者在寻找性价比高的头戴式无线耳机时&#xff0c;他们往往希望找到既经济实惠又具备出色性能的产品&#xff0c;市场上有许多品牌和型号可供选择&#xff0c;它们在音质、舒适度、续航能力以及附加功能等方面各有特色&#xff0c;性价比头戴式无线耳机推荐哪款好&#xf…

厂家解读:全钢pvc防静电架空地板的优缺点

为了防止静电带来的危害&#xff0c;数据中心、监控室、多媒体教室等这些电子设备较多、对静电敏感的场所都会安装防静电地板。其中全钢pvc防静电架空地板颇受欢迎&#xff0c;那么什么是全钢pvc防静电架空地板&#xff1f; 全钢pvc防静电架空地板是由优质合金冷轧钢板经过拉伸…

Java双端队列ArrayDeque

概述 双端队列ArrayDeque是Java集合框架中的一种数据结构&#xff0c;它实现了Deque接口&#xff0c;因此支持在两端进行添加和移除元素。通过名称也能看出&#xff0c;ArrayDeque是基于数组实现的&#xff0c;ArrayDeque内部使用一个可动态调整大小的环形数组来存储元素。当Ar…

印尼有几百种语言,初学者要怎么开始学习?《印尼语翻译通》app或许可以帮助你!印尼语零基础入门学习。

快速翻译&#xff0c;准确高效 采用最新技术&#xff0c;提供精准翻译。翻译结果符合中国人习惯。 体验印尼文化 学习地道印尼语&#xff0c;贴近当地文化。 旅游和工作的好帮手 提供旅游和商务用语&#xff0c;沟通无障碍。 学习印尼语的良师 文本和语音翻译&#xff0c;…

C#使用实体类Entity Framework Core操作mysql入门:从数据库反向生成模型

初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github&#xff1a;codetoys&#xff0c;所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C的&#xff0c;可以在任何平台上使用。 源码指引&#xff1a;github源…

I2C中继器TCA9517A(TI)

一、芯片介绍 本芯片是一款具有电平转换功能的双向缓冲器&#xff0c;适用于I2C和SMBus系统&#xff0c;同时支持各种拓扑结构的扩展使用。芯片支持SCL和SDA缓冲&#xff0c;因此允许两条总线的负载电容达到400pF。 TCA9517A的A和B侧驱动器是不同的&#xff0c;但是均可耐受5…