一周学会Pandas2 Python数据处理与分析-Pandas2数据信息查看操作
锋哥原创的Pandas2 Python数据处理与分析 视频教程:
2025版 Pandas2 Python数据处理与分析 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili
DataFrame的基础信息和统计性信息。在我们拿到一 个数据集,用Pandas载入后,需要做一些初步的验证,比如行名、列名是否一致,数据量是否有缺失,各列的数据类型等,让我们对数据的全貌有所了解。 大多数功能对Series也是适用的。
查看样本信息
加载完的数据可能由于量太大,我们需要查看部分样本数据,
Pandas2提供了三个常用的样式查看方法。
-
df.head():前部数据,默认5条,可指定条数。 可指定参数,查看具体条数;
-
df.tail():尾部数据,默认5条,可指定条数。 可指定参数,查看具体条数;
-
df.sample():一条随机数据,可指定条数。
查看数据形状
执行df.shape会返回一个元组,该元组的第一个元素代表行数,第二个元素代表列数,这就是这个数据的基本形状,也是数据的大小。
查看数据类型信息
df.dtypes会返回每个字段的数据类型及DataFrame整体的类型。如果是Series,需要用s.dtype:
查看行列索引内容
df.axes会返回一个列内容和行内容组成的列表[列索引, 行索引]。
查看其他信息
还有一些比较重要的常用操作方法:
# 导入pandas库,取别名pd
import pandas as pddf = pd.read_excel('student_scores.xlsx') # 读取excel,返回DataFrame数据集对象
print('行索引对象:', df.index)
print('列索引对象:', df.columns)
print('维度:', df.ndim)
print('数据量大小 2维的话 就是行*列:', df.size)
print('判断是否空:', df.empty)
print('列名:', df.keys())xuehao = df.get('学号')
print(xuehao, type(xuehao))
print('列名:', xuehao.name)
print('列数据:', xuehao.array)
print('类型:', xuehao.dtype)
print('是否有空值:', xuehao.hasnans)
运行输出:
行索引对象: RangeIndex(start=0, stop=100, step=1)
列索引对象: Index(['姓名', '学号', '出生日期', '性别', '语文分数', '数学分数', '英语分数'], dtype='object')
维度: 2
数据量大小 2维的话 就是行*列: 700
判断是否空: False
列名: Index(['姓名', '学号', '出生日期', '性别', '语文分数', '数学分数', '英语分数'], dtype='object')
0 S43591
1 S58574
2 S13904
3 S52393
4 S96363...
95 S79434
96 S67323
97 S64118
98 S51652
99 S83394
Name: 学号, Length: 100, dtype: object <class 'pandas.core.series.Series'>
列名: 学号
列数据: <NumpyExtensionArray>
['S43591', 'S58574', 'S13904', 'S52393', 'S96363', 'S87321', 'S38223','S52462', 'S65981', 'S71167', 'S68359', 'S35300', 'S55657', 'S59149','S75750', 'S74263', 'S23252', 'S25195', 'S50704', 'S47635', 'S40379','S13017', 'S52519', 'S16435', 'S28971', 'S85208', 'S27585', 'S62627','S86384', 'S36721', 'S64469', 'S68648', 'S42390', 'S19317', 'S46948','S85356', 'S38109', 'S18044', 'S57329', 'S89262', 'S60195', 'S30985','S91859', 'S70895', 'S49759', 'S86490', 'S77550', 'S13767', 'S23890','S53426', 'S33910', 'S24949', 'S24148', 'S39855', 'S93799', 'S99543','S10237', 'S12998', 'S39744', 'S91052', 'S51794', 'S94066', 'S56298','S47302', 'S45130', 'S64840', 'S41290', 'S11720', 'S14390', 'S13955','S37016', 'S93213', 'S15822', 'S93938', 'S52885', 'S18974', 'S70290','S57408', 'S20641', 'S56667', 'S23756', 'S75070', 'S54227', 'S94451','S89327', 'S92720', 'S64610', 'S20017', 'S84014', 'S62573', 'S47391','S49285', 'S77596', 'S22009', 'S78314', 'S79434', 'S67323', 'S64118','S51652', 'S83394']
Length: 100, dtype: object
类型: object
是否有空值: FalseProcess finished with exit code 0