【数据挖掘】机器学习中相似性度量方法-欧式距离

写在前面:
首先感谢兄弟们的订阅,让我有创作的动力,在创作过程我会尽最大能力,保证作品的质量,如果有问题,可以私信我,让我们携手共进,共创辉煌。

路虽远,行则将至;事虽难,做则必成。只要有愚公移山的志气、滴水穿石的毅力,脚踏实地,埋头苦干,积跬步以至千里,就一定能够把宏伟目标变为美好现实。

最近在做实际项目时,遇到需要计算两个向量的相似性,即需要计算不同数据样本之间的相似度。计算样本之间相似度的方法有很多,也很有学问,直接影响后续的计算结果。

本次将持续更新“相似性度量(similarity measurement)”系列文章,今天先介绍欧式距离

在这里插入图片描述

1、欧式距离

欧式距离(Euclidean Distance)是一种在多维空间中测量两个点之间“直线”距离的方法。在二维和三维空间中,欧氏距离就是两点之间的实际距离,即我们通常所说的“直线距离”。在更高维的空间中,这个概念依然适用,只是我们无法直接可视化这种距离。

2、计算公式

2.1 二维平面

二维平面两个点A( x 1 , y 1 x_ 1, y_ 1 x1,y1)和B( x 2 , y 2 x_ 2, y_ 2 x2,y2)之间的欧式距离:
d ( A , B ) = ( x 1 − x 2 ) 2 + ( y 1 − y 2 ) 2 \ d(A,B) = \sqrt{(x_1 - x_2)^2 + (y_1 - y_2)^2 }  d(A,B)=(x1x2)2+(y1y2)2

2.2 三维空间

三维空间两个点A( x 1 , y 1 , z 1 x_ 1,y_ 1, z_ 1 x1,y1,z1)和B( x 2 , y 2 , z 2 x_ 2,y_ 2, z_ 2 x2,y2,z2)之间的欧式距离:

d ( A , B ) = ( x 1 − y 1 ) 2 + ( x 2 − y 2 ) 2 + ( z 1 − z 2 ) 2 \ d(A,B) = \sqrt{(x_1 - y_1 )^2 + (x_2 - y_2)^2 + (z_1 - z_2)^2}  d(A,B)=(x1y1)2+(x2y2)2+(z1z2)2

2.3 高维空间

两个向量A( x 1 , x 2 , x 3 , . . . , x n x_ 1,x_ 2, x_ 3, ..., x_ n x1,x2,x3,...,xn)和B( y 1 , y 2 , y 3 , . . . , y n y_ 1,y_ 2, y_ 3,..., y_ n y1,y2,y3,...,yn)之间的欧式距离

d ( A , B ) = ( x 1 − y 1 ) 2 + ( x 2 − y 2 ) 2 + … + ( x n − y n ) 2 \ d(A,B) = \sqrt{(x_1 - y_1 )^2 + (x_2 - y_2)^2 + \ldots + (x_n - y_n)^2}  d(A,B)=(x1y1)2+(x2y2)2++(xnyn)2

3、代码实现

编写代码实现欧式距离,在Python中,可以使用numpy库或者scipy来计算两个向量之间的欧式距离:

# -*- coding: utf-8 -*-
"""
Created on Fri Jun 14 22:36:45 2024@author: AIexplore微信公众号
"""import numpy as np  
from scipy.spatial.distance import euclidean  def euclidean_distance_1(vec1, vec2):  """  计算两个向量之间的欧式距离  参数:  vec1 -- 第一个向量,numpy数组  vec2 -- 第二个向量,numpy数组  返回:  dist -- 两个向量之间的欧式距离  """  dist = np.sqrt(np.sum((vec1 - vec2)**2))  return dist  def euclidean_distance_2(vec1, vec2):  dist = euclidean(vec1, vec2)return dist # data
vec1 = np.array([1, 2, 3])  
vec2 = np.array([4, 5, 6])  # 使用numpy计算欧式距离
d1 = euclidean_distance_1(vec1, vec2)
print("欧式距离 1:", d1)# 使用scipy的euclidean函数计算欧式距离  
d2 = euclidean_distance_2(vec1, vec2)  
print("欧式距离 2:", d2)
  • 使用numpy计算欧式距离

euclidean_distance_1函数接受两个numpy数组作为参数,并返回它们之间的欧式距离。函数内部,使用numpy的sqrt函数和sum函数来计算平方差的总和的平方根,从而得到欧式距离。

  • 使用scipy计算欧式距离

首先从scipy.spatial.distance模块中导入了euclidean函数。然后,定义了两个numpy数组vec1和vec2,它们分别代表两个点或向量的坐标。最后,调用euclidean_distance_2函数并传入这两个向量作为参数,得到了它们之间的欧式距离。

参考文章

1、https://mp.weixin.qq.com/s/zBHt9A-4FV4tsnSDRfBy-g
2、https://mp.weixin.qq.com/s/g1-U59Xo7ScjscyrL61Ujw
3、https://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1451930.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

换卡槽=停机?新手机号使用指南!

刚办理的手机号莫名其妙的就被停用了?这到底是怎么回事?这篇文章快来学习一下吧。 ​ 先说一下,你的手机为什么被停机? 现在运营商对于手机卡的使用有着非常严格的要求,尤其是刚办理的新号码,更是“严上加…

用Rust手把手编写一个Proxy(代理), 开始动工

https://shop.kongfz.com/795263/ 代理端和代理服务端之间可用自有格式来实现多路复用以减少连接的建立断开的开销,目前暂未实现代理服务端。 类结构 proxy.rs 负责代理结构的存储,监听类型,监听地址,是否有父级地址,认证账号密码等。 flag.rs 监听类型的二进制结构,…

Java核心(四)反射

这篇内容叫反射也不够准确,其实它更像是java类加载的一个延申。 Java类加载过程 之前解释过一个Java的类的加载过程,现在回顾一下类的加载: 类的加载指的是将类的字节码文件(.class文件)中数据读入到内存中&#xff…

【单片机毕业设计选题24007】-基于STM32和阿里云的家庭健康数据监测系统

系统功能: 本课题设计是基于STM32单片机作为控制主体,通过HX711称重模块,HC-SR04超声波测距模块,红外测温,心率传感器等模块通过I2C或SPI接口与STM32进行通信,并读取传感器输出的身高,体重,心率…

ubuntu的内核离线升级

服务器爆出Linux kernel权限提升漏洞,所以需要升级内核。所以我记录一下升级内核的过程。 因为有权限漏洞,所以升级全程离线断网。 一 下载 先下载内核升级文件,打算升级的目标是6.1.76版本 Index of /mainline/v6.1.76/amd64 下载完毕后传…

如何保护云主机安全

在数字化时代,云服务器已成为企业数据存储、处理和传输的重要工具。然而,随着其应用的广泛和深入,云服务器也面临着越来越多的安全威胁。为了应对这些威胁,白名单技术应运而生,成为保护云服务器安全的重要手段。 首先&…

通信设备的网卡

一、网卡的作用 将计算机或者路由器连接到传输介质上的接口,传输介质可以是有线也可以是无线的。 (1)计算机的网卡 现在的计算机大多有两个网卡,一个是有线网卡一个无线网卡,比如以我们的台式电脑为例 台式电脑千兆网…

SQL Server Management Studio (SSMS) 20.1 - 微软数据库管理工具

SQL Server Management Studio (SSMS) 20.1 - 微软数据库管理工具 请访问原文链接:https://sysin.org/blog/ssms/,查看最新版。原创作品,转载请保留出处。 作者主页:sysin.org 笔者注:SQL Server 2014 及之前版本内置…

【Kafka】Kafka生产者-04

【Kafka】Kafka生产者-04 1. 生产者发送消息流程1.1 发送原理 2. 相关文档 1. 生产者发送消息流程 1.1 发送原理 在消息发送的过程中,涉及到了两个线程——main 线程和 Sender 线程。 在 main 线程中创建了一个双端队列 RecordAccumulator。 main 线程将消息发送给…

canvas学习

Canvas API 提供了一个通过 JavaScript 和 HTML 的 元素来绘制图形的方式。它可以用于动画、游戏画面、数据可视化、图片编辑以及实时视频处理等方面。 Canvas 的基本用法 <canvas> 元素 <canvas id"tutorial" width"150" height"150&quo…

【计算机网络仿真实验-实验2.4、2.5】静态路由、动态路由(RIP)

实验2.4 静态路由 1. 实验拓扑图 注意&#xff1a;有些同学不知道两个路由器之间如何用串行DCE(红线)相接&#xff0c;只需要为路由器分别增加新的HWIC-2T接口卡就好了 不知道如何添加物理接口的&#xff0c;可以查看本人计算机网络专栏中【计算机网络仿真实验——实验准备】…

Java面向对象-抽象类和抽象方法

Java面向对象-抽象类和抽象方法 1、代码案例展示2、抽象类和抽象方法的关系&#xff1a; 1、代码案例展示 1、在一个类中会有一类方法&#xff0c;无需重写&#xff0c;直接使用 2、在一个类中会有一类方法&#xff0c;会对这个方法进行重写 3、一个方法的方法体去掉&#xff…

QT打包(windows linux)封包 完整图文版

目录 简介: 一. for windows 1.首先下载组件 2.开始构建Release版本. 3.然后点击构建 4.在文件夹内直接点击exe文件,会报下面的错误,因为缺少dll连接; 5.需要把这个exe单独复制到一个文件夹内, 6.先cd到单独exe所在的文件夹; cd 文件路径 7.然后运行 windeployqt 文…

Linux安装Tomcat和Nginx

目录 前言一、系统环境二、Tomcat安装步骤Step1 安装JDK环境Step2 安装Tomcat 三、Nginx安装步骤四、测试4.1 测试Tomcat4.2 测试Nginx 总结 前言 本篇文章介绍如何在Linux上安装Tomcat web服务器。 一、系统环境 虚拟机版本&#xff1a;VMware Workstation 15 ProLinux镜像…

【AI基础】第六步:纯天然保姆喂饭级-安装并运行qwen2-7b

整体步骤类似于 【AI基础】第五步&#xff1a;纯天然保姆喂饭级-安装并运行chatglm3-6b-CSDN博客。 此系列文章列表&#xff1a; 【AI基础】概览 【AI基础】第一步&#xff1a;安装python开发环境-windows篇_下载安装ai环境python 【AI基础】第一步&#xff1a;安装python开发环…

观成科技:基于深度学习技术的APT加密流量检测与分类检测方案

一、前言 近年来APT攻击的案例屡见不鲜&#xff0c;给国家、企业以及个人的利益造成极大威胁。随着流量加密技术的不断成熟&#xff0c;许多APT组织倾向于将流量加密后进行传输&#xff0c;从而保护传输内容。由于加密流量的实际载荷已被加密&#xff0c;故采用原始的流量检测…

GO RACE 测试在低版本GCC上报错误 exit status 0xc0000139

windows机器环境&#xff0c;go程序使用race定位时一运行就报错&#xff0c;写了个example如&#xff1a; 能看到加了race之后就不行了&#xff0c; 搜了一下&#xff0c;git上有个issue&#xff1a; runtime: Race detector causes exit status 0xc0000139 on Windows 11 wi…

除了ps我们还可以使用什么方法来处理图片?

照片模糊了怎么办?当照片拍的不好时&#xff0c;容易出现模糊的状况&#xff0c;其实照片模糊了可以通过后期软件加工处理&#xff0c;但是ps操作很复杂&#xff0c;对我们有一定的技术基础要求&#xff0c;那么有没有别的图片处理工具呢&#xff1f; ps它的图片处理功能较为全…

俄罗斯Yandex推广投放如何开户?Yandex广告开户和代运营推广流程详解_俄罗斯_受众_搜索引擎

在俄罗斯进行Yandex广告推广是一种有效的在线营销方式&#xff0c;特别是针对俄罗斯市场。Yandex是俄罗斯最受欢迎的搜索引擎&#xff0c;类似于Google在全球范围内的地位。以下是通过Yandex广告推广的一般步骤&#xff0c;以及如何通过上海上弦进行广告开户和代运营。 1. Yan…

【计算机视觉】人脸算法之图像处理基础知识(一)

图像处理基础知识&#xff08;一&#xff09; 1.图像的构成 图像的构成可以包括以下几方面知识&#xff1a; 1.像素&#xff1a;图像的基本单位&#xff0c;是图像中的一个点。每个像素都有特定的位置和色彩值。在数字图像中&#xff0c;像素的颜色通常由红、绿、蓝&#xf…