Pandas 数据类型

Pandas是Python中一个强大的数据分析库,提供了多种数据类型(dtype)来表示数据集中的数据。以下是一些常见的Pandas数据类型及其样例:

一、数值类型

  1. 整数类型
    • int8、int16、int32、int64:用于存储整数值。
    • 样例:pd.Series([1, 2, 3], dtype=int32),创建一个包含整数的Series,数据类型为int32。
  2. 浮点数类型
    • float32、float64:用于存储带有小数点的数值。
    • 样例:pd.Series([1.1, 2.2, 3.3], dtype=float64),创建一个包含浮点数的Series,数据类型为float64。
import pandas as pd
# 创建一个包含整数的Series,数据类型为int64(默认)
int_series = pd.Series([1, 2, 3, 4, 5], dtype=int64)
print(int_series.dtype)  # 输出:int64# 创建一个包含浮点数的Series,数据类型为float64(默认)
float_series = pd.Series([1.1, 2.2, 3.3, 4.4, 5.5], dtype=float64)
print(float_series.dtype)  # 输出:float64

二、布尔类型

- bool:用于存储True或False值。
- 样例:pd.Series([True, False, True], dtype=bool),创建一个包含布尔值的Series。
# 创建一个包含布尔值的Series
bool_series = pd.Series([True, False, True, False, True], dtype=bool)
print(bool_series.dtype)  # 输出:bool

三、字符串类型

  1. object类型
    • 在Pandas中,object类型通常用于存储字符串数据。当Pandas无法确定数据的确切类型时,也会使用此类型。
    • 样例:pd.Series([“apple”, “banana”, “cherry”], dtype=object),创建一个包含字符串的Series,数据类型为object。
  2. str类型(Python 3中的字符串类型)
    • 虽然Pandas内部使用object类型来存储字符串,但在Python 3中,字符串的实际类型是str。
    • 样例:在Python 3中,s = “hello”,type(s)的结果为str。但在Pandas的DataFrame或Series中,字符串会被存储为object类型。
# 创建一个包含字符串的Series,数据类型为object
str_series = pd.Series(["apple", "banana", "cherry", "date"], dtype=object)
print(str_series.dtype)  # 输出:object

四、日期和时间类型

  1. datetime64[ns]类型
    • 用于存储日期和时间值,具有纳秒级别的精度。
    • 样例:pd.to_datetime([‘2023-01-01’, ‘2023-01-02’, ‘2023-01-03’]),创建一个包含日期时间的Series,数据类型为datetime64[ns]。
# 将字符串转换为日期时间类型,并创建一个Series
date_series = pd.Series(pd.to_datetime(['2023-01-01', '2023-01-02', '2023-01-03']))
print(date_series.dtype)  # 输出:datetime64[ns]
  1. timedelta64[ns]类型
    • 用于存储两个日期或时间之间的差异。
    • 样例:pd.to_timedelta([‘1 day’, ‘2 days’, ‘3 days’]),创建一个包含时间差的Series,数据类型为timedelta64[ns]。
# 创建一个包含时间差的Series,通过两个日期时间相减得到
timedelta_series = pd.Series([pd.to_datetime('2023-01-02') - pd.to_datetime('2023-01-01'),pd.to_datetime('2023-01-03') - pd.to_datetime('2023-01-02')])
print(timedelta_series.dtype)  # 输出:timedelta64[ns]

五、类别类型

- category:用于存储具有重复值的字符串或数值,可以减少内存使用。
- 样例:pd.Series(["apple", "banana", "apple", "cherry"], dtype="category"),创建一个包含类别数据的Series。
# 创建一个包含类别数据的Series
category_series = pd.Series(["apple", "banana", "apple", "cherry"], dtype="category")
print(category_series.dtype)  # 输出:category

六、其他类型

  1. period类型
    • 用于表示时间跨度,通常用于金融数据。
    • 样例:pd.PeriodIndex([‘2023Q1’, ‘2023Q2’, ‘2023Q3’], freq=‘Q’),创建一个包含季度的PeriodIndex。
  2. Interval类型
    • 表示两个端点之间的间隔。
    • 样例:pd.IntervalIndex.from_tuples([(0, 1), (1, 2), (2, 3)]),创建一个包含间隔的IntervalIndex。

数据类型样例:

# 创建一个包含多种数据类型的DataFrame
data = {'int_col': [1, 2, 3, 4, 5],'float_col': [1.1, 2.2, 3.3, 4.4, 5.5],'bool_col': [True, False, True, False, True],'str_col': ["apple", "banana", "cherry", "date", "elderberry"],'date_col': pd.to_datetime(['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04', '2023-01-05']),'category_col': pd.Categorical(["apple", "banana", "apple", "cherry", "elderberry"])
}
df = pd.DataFrame(data)
print(df.dtypes)
# 输出:
# int_col           int64
# float_col       float64
# bool_col           bool
# str_col          object
# date_col   datetime64[ns]
# category_col   category
# dtype: object

注意

  • 在创建Pandas的DataFrame或Series时,Pandas会根据传入数据的内容自动推断数据类型。
  • 可以使用dtype属性来查看DataFrame或Series中某列或某行的数据类型。
  • 可以使用astype()方法来转换数据类型,但需要注意转换的兼容性和数据丢失的风险。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/15915.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

文章解读与仿真程序复现思路——电力系统自动化EI\CSCD\北大核心《基于改进容积卡尔曼滤波的含光伏配电网动态状态估计》

本专栏栏目提供文章与程序复现思路,具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

jenkins使用cli发行uni-app到h5

官网文档HBuilderX 文档 首先确定是否存在环境变量 正常情况cmd中执行cli 如果提示 cli 不是内部或外部命令,也不是可运行的程序或批处理文件。请先配置环境变量 Freestyle Project项目在Build Steps中增加Execute Windows batch command命令如下 d: cd D:\devsof…

FMEA 在新兴技术领域(如量子计算、人工智能芯片等)的应用挑战与机遇

【大家好,我是唐Sun,唐Sun的唐,唐Sun的Sun。】 摘要: 本文深入探讨了 FMEA(失效模式及后果分析)在如量子计算、人工智能芯片等新兴技术领域的应用所面临的挑战与机遇。随着科技的飞速进步,新兴技…

websocket身份验证

websocket身份验证 前言 上一集我们就完成了websocket初始化的任务,那么我们完成这个内容之后就应该完成一个任务,当客户端与服务端连接成功之后,客户端应该主动发起一个身份认证的消息。 身份认证proto 我们看一眼proto文件的内容。 我…

Spire.PDF for .NET【页面设置】演示:复制 PDF 文档中的页面

在某些情况下,我们需要创建 PDF 文档中现有页面的副本,而不是复制整个文件,特别是如果我们必须创建某个页面的数百份副本,那么逐个复制页面可能会很繁琐。本文演示了如何使用 Spire.PDF 复制 PDF 文档中的页面并一次创建多个副本的…

Vue-组件三大组成组件通信

一、学习目标 1.组件的三大组成部分(结构/样式/逻辑) scoped解决样式冲突/data是一个函数 2.组件通信 组件通信语法 父传子 子传父 非父子通信(扩展) 3.综合案例:小黑记事本(组件版) 拆…

2024CVPR点云-1-点云分类CausalPC

文章摘要:深度神经网络在点云分类中表现出了显著的性能。然而,以前的工作表明它们容易受到对抗性扰动的影响,这些扰动可以操纵它们的预测。鉴于点云的独特模态,出现了各种攻击策略,这对现有的防御提出了挑战&#xff0…

ssm114基于SSM框架的网上拍卖系统的设计与实现+vue(论文+源码)_kaic

摘 要 随着科学技术的飞速发展,各行各业都在努力与现代先进技术接轨,通过科技手段提高自身的优势,商品拍卖当然也不能排除在外,随着商品拍卖管理的不断成熟,它彻底改变了过去传统的经营管理方式,不仅使商品…

【Qt聊天室客户端】消息功能--发布程序

1. 获取文件内容 主要目标是实现获取内容二进制数据的接口,主要是为后面的消息功能提供服务 具体实现 客户端发送请求 服务端处理请求,同时支持三种数据类型 客户端处理服务端的响应 2. 发送图片消息 客户端与服务端的通信约定 客户端从服务器中获取图片…

【CSS】opacity 影响 z-index 不生效

准备知识 一般来说,z-index 不生效的原因有: 父元素的 position 属性: z-index 只对 position 属性为 relative、absolute 或 fixed 的元素有效。 其他元素的 z-index: 如果页面中有其他元素也设置了较高的 z-index,…

Elasticsearch基本概念及使用

Elasticsearch 是一个开源的、分布式的全文搜索和分析引擎,基于 Apache Lucene 构建。它提供了快速的搜索能力,支持大规模的数据分析,广泛应用于日志分析、全文搜索、监控系统和商业智能等领域。ES操作指令是基于restAPI构建,也就…

C语言入门到精通(第六版)——第十六章

16、网络套接字编程 16.1、计算机网络基础 计算机网络技术是计算机技术和通信技术相结合的产物,代表计算机的一个重要发展方向。了解计算机的网络结构,有助于用户开发网络应用程序。 16.1.1、IP地址 为了使网络上的计算机能够彼此识别对方,…

Electron教程1-初学入门

玩转Electron Electron 是什么注意事项环境安装安装 vscode安装 git 第一个实例第二个实例第二个实例解读 总结问题解答 Electron 是什么 Electron是一个使用 JavaScript、HTML 和 CSS 构建桌面应用程序的框架。 嵌入 Chromium 和 Node.js 到 二进制的 Electron 允许您保持一个…

柠乐音乐 1.3.87 | 界面优美支持无损音乐下载的音乐播放器

柠乐音乐app提供丰富的音乐资源,涵盖流行、摇滚、古典等多种类型音乐,并且全部免费。支持FLAC无损音质音乐免费高速下载。内置独特推荐算法,可根据用户喜好智能推荐音乐。还包括电台播放资源、歌单同步(支持网易云音乐和QQ音乐&am…

【资料】网络安全风险评估报告,风险管理报告,网络安全风险管理计划,网络安全网络安全能力验证报(Word原件)

一、概述 1.1工作方法 1.2评估依据 1.3评估范围 1.4评估方法 1.5基本信息 二、资产分析 2.1 信息资产识别概述 2.2 信息资产识别 三、评估说明 3.1无线网络安全检查项目评估 3.2无线网络与系统安全评估 3.3 ip管理与补丁管理 3.4防火墙 四、威胁细类分析 4.1威胁…

change buffer:到底应该选择普通索引还是唯一索引

文章目录 引言第一章:普通索引和唯一索引在查询逻辑与效率上的对比1.1 查询逻辑分析1.2 查询效率对比 第二章:普通索引和唯一索引在更新逻辑与效率上的对比2.1 更新逻辑分析2.2 更新效率对比 第三章:底层原理详解 - 普通索引和唯一索引的区别…

软件工程师简历(精选篇)

【#软件工程师简历#】 一份专业而精准的软件工程师简历,不仅能够全面展示技术实力和项目经验,更是赢得理想工作机会的重要敲门砖。那么,如何撰写一份令人印象深刻的软件工程师简历呢?以下是幻主简历整理的软件工程师简历&#xf…

深度学习推荐系统的工程实现

参考自《深度学习推荐系统》——王喆,用于学习和记录。 介绍 之前章节主要从理论和算法层面介绍了推荐系统的关键思想。但算法和模型终究只是“好酒”,还需要用合适的“容器”盛载才能呈现出最好的味道,这里的“容器”指的就是实现推荐系统…

前缀和技巧解析

前缀和技巧解析 前缀和(Prefix Sum)是一种常用的算法技巧,用于高效地处理一系列连续子数组和的问题。通过构建一个额外的数组来存储从数组起始位置到当前位置的累计和,可以在常数时间内快速计算任意区间的和。 前缀和应用的典型…

(undone) MIT6.S081 2023 学习笔记 (Day4: LAB3 page tables)

LAB 网页:https://pdos.csail.mit.edu/6.S081/2023/labs/pgtbl.html 任务1:Speed up system calls 根据网页,操作系统可以通过把部分数据放入用户空间的页表,来使得部分系统调用不用进入内核空间,从而提高速度。我们的…