Pandas教程之Pandas 简介

Pandas 简介

接下来一段时间,我会持续发布并完成Pandas教程

Pandas 是一个功能强大的开源 Python 库。Pandas 库用于数据操作和分析。Pandas 由数据结构和函数组成,可对数据执行有效的操作。

本免费教程将概述 Pandas,涵盖 Python Pandas 的基础知识。

Python 中的 Pandas 库是什么?

Pandas是一个功能强大且用途广泛的库,可简化Python中的数据操作任务。Pandas 非常适合处理表格数据,例如电子表格SQL 表

Pandas 库是数据分析师、科学家和工程师使用 Python 处理结构化数据的重要工具。

Python Pandas 用于什么?

Pandas 库通常用于数据科学,但你想知道为什么吗?这是因为 Pandas 库与其他用于数据科学的库一起使用。它建立在NumPy 库之上,这意味着 NumPy 的许多结构在 Pandas 中被使用或复制。

Pandas 生成的数据通常用作Matplotlib中的绘图函数、 SciPy中的统计分析和Scikit-learn中的机器学习算法的输入。

你一定想知道,为什么要使用 Pandas 库。Python 的 Pandas 库是分析、清理和操作数据的最佳工具。

以下是我们可以使用 Pandas 做的事情的列表。

  • 数据集清理、合并和连接。
  • 轻松处理浮点和非浮点数据中的缺失数据(表示为 NaN)。
  • 可以从 DataFrame 和高维对象中插入和删除列。
  • 强大的分组功能可对数据集执行拆分-应用-合并操作。
  • 数据可视化。

Pandas 入门

让我们看看如何开始使用 Python Pandas 库:

安装 Pandas

使用 Pandas 的第一步是确保它是否安装在系统中。如果没有,那么我们需要使用pip 命令将其安装在我们的系统上。

请按照以下步骤安装 Pandas:

步骤 1:在搜索框中输入“cmd”并打开。
步骤 2:使用 cd 命令找到安装了python-pip 文件的文件夹。步骤 3:找到后,输入命令:

pip install pandas

导入 Pandas

在系统中安装了Pandas之后,需要导入该库。这个模块一般导入如下:

import pandas as pd

注意:此处,pd 是 Pandas 的别名。但是,使用别名导入库并不是必需的,它只是有助于在每次调用方法或属性时编写更少的代码。 

Pandas 库中的数据结构

Pandas 通常提供两种数据结构来操作数据。它们是:

  • 系列
  • 数据帧

熊猫系列

Pandas Series是一个一维标记数组,能够保存任何类型的数据(整数、字符串、浮点数、Python 对象等)。轴标签统称为索引

Pandas 系列只是 Excel 表中的一列。标签不需要唯一,但必须是可哈希类型。

该对象支持整数和基于标签的索引,并提供了大量执行涉及索引的操作的方法。

Pandas Series

创建一个系列


Pandas Series是通过从现有存储(可以是 SQL 数据库、CSV 文件或 Excel 文件)加载数据集来创建的。

可以从列表、字典、标量值等创建 Pandas 系列。

示例:使用 Pandas 库创建一个系列。

Python
import pandas as pd 
import numpy as np# Creating empty series 
ser = pd.Series() 
print("Pandas Series: ", ser) # simple array 
data = np.array(['g', 'e', 'e', 'k', 's']) ser = pd.Series(data) 
print("Pandas Series:\n", ser)

输出

Pandas Series:Series([], dtype: float64) 
Pandas Series:
0 g 
1 e 
2 e 
3 k 
4 s 
dtype: object

Pandas DataFrame
Pandas DataFrame是带有标记轴(行和列)的二维数据结构。

创建 DataFrame

Pandas DataFrame 是通过从现有存储(可以是 SQL 数据库、CSV 文件或 Excel 文件)加载数据集来创建的。

Pandas DataFrame 可以通过列表、字典、字典列表等创建。

示例:使用 Pandas 库创建 DataFrame

Python
import pandas as pd # Calling DataFrame constructor 
df = pd.DataFrame() 
print(df)# list of strings 
lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # Calling DataFrame constructor on list 
df = pd.DataFrame(lst) 
print(df)

输出:

空 DataFrame
列: []
索引: [] 0 
0 Geeks 
1 For 
2 Geeks 
3 is 
4 portal 
5 for 
6 Geeks

-----------------------------------------------------------------------------------------------------------------

如何在 Python 中运行Pandas程序

Pandas程序可以从任何文本编辑器运行,但建议使用Jupyter Notebook,因为 Jupyter 使您能够在特定单元而不是整个文件中执行代码。

Jupyter 还提供了一种可视化 Pandas DataFrame 和图表的简单方法。

-----------------------------------------------------------------------------------------------------------------

最后

本教程为掌握 Pandas 库提供了坚实的基础,从基本操作到高级技术。我们还通过示例介绍了 Pandas 数据结构(系列和 DataFrame)。

完成本教程后,您将全面了解什么是 Python Pandas。Pandas 有什么用途?以及如何使用 Python Pandas。

当你将这些技能应用到你的项目中时,你会发现 Pandas 如何增强你探索、清理和分析数据的能力,使其成为数据科学家工具包中不可或缺的工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/18257.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【linux】网络基础 ---- 数据链路层

用于两个设备(同一种数据链路节点)之间进行传递 数据链路层解决的问题是:直接相连的主机之间,进行数据交付 1. 认识以太网 "以太网" 不是一种具体的网络, 而是一种技术标准: 既包含了数据链路层的内容, 也包含了一些物理层的内容…

i春秋-FUZZ(python模板注入、base64编码命令执行)

练习平台地址 竞赛中心 题目描述 题目内容 很直接就是要fuzz参数 参数字典 dpaste/eH2Z1 (Plain Text) BP爆破参数 发现存在name参数 尝试sql注入 发现输入啥就回显啥,猜测是模板注入 测试是不是模板注入 虽然9*9没有被执行,但是config执行了&#…

另外一种缓冲式图片组件的用法

文章目录 1. 概念介绍2. 使用方法2.1 基本用法2.2 缓冲原理3. 示例代码4. 内容总结我们在上一章回中介绍了"FadeInImage组件"相关的内容,本章回中将介绍CachedNetworkImage组件.闲话休提,让我们一起Talk Flutter吧。 1. 概念介绍 我们在本章回中介绍的CachedNetwo…

Java中的CAS

目录 一.问题提出 1.1解决思路-锁 1.2解决思路-无锁 二.什么是CAS 三.CAS的特点 四.ABA问题 4.1解决方案-AtomicStampedReference 4.2解决方案-AtomicMarkableReference 一.问题提出 如何保证 withdraw 取款方法的线程安全 public class Cas {public static void mai…

git push时报错! [rejected] master -> master (fetch first)error: ...

错误描述:在我向远程仓库push代码时,即执行 git push origin master命令时发生的错误。直接上错误截图。 错误截图 错误原因: 在网上查了许多资料,是因为Git仓库中已经有一部分代码,它不允许你直接把你的代码覆盖上去…

药房智控:中药实验管理的自动化

6系统测试 6.1概念和意义 测试的定义:程序测试是为了发现错误而执行程序的过程。测试(Testing)的任务与目的可以描述为: 目的:发现程序的错误; 任务:通过在计算机上执行程序,暴露程序中潜在的错误。 另一个…

C语言实现数据结构之二叉树

文章目录 二叉树一. 树概念及结构1. 树的概念2. 树的相关概念3. 树的表示4. 树在实际中的运用(表示文件系统的目录树结构) 二. 二叉树概念及结构1. 概念2. 特殊的二叉树3. 二叉树的性质4. 二叉树的存储结构 三.二叉树链式结构的实现1. 前置说明2. 二叉树…

SpringCloud篇(服务保护 - Sentinel)

目录 一、雪崩问题及解决方案 1. 雪崩问题 2. 解决方案 方案一:超时处理 方案二:仓壁模式 方案三:断路器模式 方案四:限流 3. 总结 二、服务保护技术对比 三、Sentinel介绍与安装 1. 初识Sentinel 2. Sentinel 优势 3…

MCU的时钟体系

stm32F4的时钟体系图 1MHZ 10^6 HZ 系统时钟频率是168MHZ;AHB1、AHB2、AHB3总线上的时钟频率是168MHz;APB1总线上的时钟频率为42MHz;APB2总线上的时钟频率为84MHz; stm32F4的时钟体系图 在system_stm32f4xx.c文件中查看APB1和APB2的预分频值到底是多少…

Redis设计与实现 学习笔记 第十八章 发布与订阅

第18到24章是本书第四部分:独立功能的实现。 Redis的发布与订阅功能由PUBLISH、SUBSCRIBE、PSUBSCRIBE等命令组成。 通过执行SUBSCRIBE命令,客户端可订阅一个或多个频道,从而成为这些频道的订阅者(subscriber)&#…

小程序-基于java+SpringBoot+Vue的驾校预约平台设计与实现

项目运行 1.运行环境:最好是java jdk 1.8,我们在这个平台上运行的。其他版本理论上也可以。 2.IDE环境:IDEA,Eclipse,Myeclipse都可以。推荐IDEA; 3.tomcat环境:Tomcat 7.x,8.x,9.x版本均可 4.硬件环境&#xff1a…

python多版本管理 windows11 pyenv

前言 需要开发多个项目,但各个项目的版本不一致怎么办?python -m venv 只解决了依赖隔离问题,但venv本身并没有办法提供多个python版本。因此我们要引入pyenv来解决。 安装pyenv https://pyenv-win.github.io/pyenv-win/ 安装很简单&…

01.防火墙概述

防火墙概述 防火墙概述1. 防火墙的分类2. Linux 防火墙的基本认识3. netfilter 中五个勾子函数和报文流向 防火墙概述 防火墙( FireWall ):隔离功能,工作在网络或主机边缘,对进出网络或主机的数据包基于一定的 规则检…

Excel表格解析为QTableWidget

解析表格 头文件 #ifndef MAINWINDOW_H #define MAINWINDOW_H#include <QMainWindow> #include <QAxObject> #include <QTableWidget> #include <QTableWidgetItem> #include <QDebug> #include <QSet> #include <QPoint> #include…

华为欧拉系统使用U盘制作引导安装华为欧拉操作系统

今天记录一下通过U盘来安装华为欧拉操作系统 华为欧拉操作系统是国产的一个类似于Centos的Linus系统 具体实现操作步骤&#xff1a; 先在官网下载欧拉系统镜像点击跳转到下载 准备好一个大于16g的U盘 &#xff0c;用于制作U盘启动 下载一个引导程序制作工具&#xff0c;我使用…

魔改log4j2的JsonLayout,支持自定义json格式日志

小伙伴们&#xff0c;你们好&#xff0c;我是老寇&#xff0c;我又回来辣&#xff0c;1个多月不见甚是想念啊&#xff01;&#xff01;&#xff01;跟我一起魔改源码吧 1.自定义json格式【PatternLayout】 大部分教程都是这个&#xff0c;因此&#xff0c;我就简单给个配置&a…

机器学习—学习曲线

学习曲线是帮助理解学习算法如何工作的一种方法&#xff0c;作为它所拥有的经验的函数。 绘制一个符合二阶模型的学习曲线&#xff0c;多项式或二次函数&#xff0c;画出交叉验证错误Jcv&#xff0c;以及Jtrain训练错误&#xff0c;所以在这个曲线中&#xff0c;横轴将是Mtrai…

在MATLAB中实现自适应滤波算法

自适应滤波算法是一种根据信号特性自动调整滤波参数的数字信号处理方法&#xff0c;其可以有效处理噪声干扰和信号畸变问题。在许多实时数据处理系统中&#xff0c;自适应滤波算法得到了广泛应用。在MATLAB中&#xff0c;可以使用多种方法实现自适应滤波算法。本文将介绍自适应…

【系统编程】实验7 消息队列

设计程序 使用消息队列实现两个进程之间的信息互通 snd.c #include <errno.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <sys/msg.h> #include <unistd.h>/*消息发送者 */// 消息结构体如下&#xff1a; …

ETH钱包地址如何获取 如何购买比特币

首先我们要先注册一个交易所 Gate.io&#xff08;推荐&#xff09;: 点我注册 1、注册很简单&#xff0c;通过手机号就可以进行注册了。 2、获取ETH钱包地址 注册好之后&#xff0c;如图所示&#xff0c;点击“统一账户” 3、通过搜索栏搜索ETH&#xff0c;如下图所示 4、点…