详解使用python读写csv,以及将csv数据写入数据库

csv文件

csv介绍

CSV,也即Comma-Separated Values,是一种用于存储表格数据的纯文本文件格式,其中每一行代表一条记录,记录中的各个字段由逗号分隔。

姓名,年龄,性别
张三,25,男
李四,28,男
王五,22,男
六六,29,女
子柒,28,女

 对于这样一个纯文本记录,打开以后可能显示就像这样:

姓名年龄性别
张三25
李四28
王五23
六六36
子柒34

切勿自行读写csv

很多人会想,既然csv文件不过就是逗号分隔的纯文本而已,那么,通过循环和split分隔不就好了吗?

csv_text = """姓名,年龄,性别
张三,25,男
李四,28,男
王五,22,男
六六,29,女
子柒,28,女"""for line in csv_text.split("\n")[1::]:item = line.split(",")print("姓名:", item[0])print("年龄:", item[1])print("性别:", item[2])print()

这样做看起来行之有效,而且也非常简单,容易理解,但是,不要这样做。因为,在一些情况下,这样会引入错误。例如,当某个项中有逗号的时候,如一个人的名字叫做xu,kun,按照正确的csv文件格式,会写为"xu,kun",并且是符合要求的选项。但是如果使用简单的split分隔,这个名字也会被拆分开来,从而导致项变多,产生错误。

csv读写

读取csv

在python中存在内置的csv库,因此,使用内置的csv库:

import csvwith open("my_file.csv") as f:csv_reader = csv.reader(f, delimiter=",")for row in csv_reader:print(row)

写入csv

import csvwith open("my_file.csv", "w", newline="") as f:csv_writer = csv.writer(f, delimiter=",")csv_writer.writerow(['姓名', '年龄', '性别'])csv_writer.writerow(['张三', '25', '男'])csv_writer.writerow(['李四', '28', '男'])csv_writer.writerow(['王五', '22', '男'])csv_writer.writerow(['六六', '29', '女'])csv_writer.writerow(['子柒', '28', '女'])

pandas读写csv

读取csv

如果只是为了读写csv,那么直接使用内置的csv库即可。但是,如果为了让pandas使用csv,那么,可以通过pandas直接读写。

import pandas as pdcsv_data = pd.read_csv("my_file.csv")
print(csv_data)

写入csv

如果是DataFrame的类型,那么使用:

import pandas as pd# 如果csv_data已经是DataFrame
csv_data.to_csv("my_file.csv", index=False)

如果是通过列表写入,那么使用:

import pandas as pddata_list = [['姓名', '年龄', '性别'],['张三', '25', '男'],['李四', '28', '男'],['王五', '22', '男'],['六六', '29', '女'],['子柒', '28', '女']
]csv_data = pd.DataFrame(data_list[1::], columns=data_list[0])
csv_data.to_csv("my_file.csv", index=False)

csv与数据库

从csv读取数据添加到mysql

添加数据本身并不困难,问题在于怎么样自动创建数据表。由于自动选择数据类型可能不能选择到最适合的类型,因此最好还是应该自行创建数据表,然后再进行数据的插入。

import pandas as pd
import pymysql
import os
import retry:conn = pymysql.connect(host="数据库地址",user="用户名",password="密码",database="数据库名")cursor = conn.cursor()print("数据库连接成功!")
except pymysql.MySQLError as e:print(f"数据库连接失败:{e}")raisecsv_file_path = "my_csv.csv"
df = pd.read_csv(csv_file_path)
df = df.where(pd.notnull(df), None)table_name = re.sub(r'\W|^(?=\d)', '_', os.path.splitext(os.path.basename(csv_file_path))[0])def create_table(cursor, table_name, df):columns = df.columnstypes = df.dtypessql = f"CREATE TABLE IF NOT EXISTS `{table_name}` (id INT AUTO_INCREMENT PRIMARY KEY, "for col, dtype in zip(columns, types):if "int" in str(dtype):sql += f"`{col}` INT, "elif "float" in str(dtype):sql += f"`{col}` FLOAT, "elif "datetime" in str(dtype):sql += f"`{col}` DATETIME, "else:max_length = df[col].astype(str).map(len).max()sql += f"`{col}` VARCHAR({max_length}), "sql = sql.rstrip(", ") + ") ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;"try:cursor.execute(sql)print(f"表 `{table_name}` 创建成功!")except pymysql.MySQLError as e:print(f"创建表时出错:{e}")cursor.close()conn.close()raisecreate_table(cursor, table_name, df)def insert_data(cursor, table_name, df):cols = "`,`".join([str(i) for i in df.columns.tolist()])placeholders = ','.join(['%s'] * len(df.columns))sql = f"INSERT INTO `{table_name}` (`{cols}`) VALUES ({placeholders})"data = df.values.tolist()try:cursor.executemany(sql, data)conn.commit()print(f"数据成功插入到表 `{table_name}` 中!")except pymysql.MySQLError as e:conn.rollback()print(f"插入数据时出错:{e}")cursor.close()conn.close()raiseinsert_data(cursor, table_name, df)cursor.close()
conn.close()

添加完成以后,即可在mysql数据库中查询到所有结果。

从mysql中读取数据写入csv

import pymysql
import csvsource_conn = pymysql.connect(host="源数据库地址",user="用户名",password="密码",database="源数据库名"
)
source_cursor = source_conn.cursor()source_cursor.execute("SHOW TABLES")
tables = source_cursor.fetchall()for table in tables:table_name = table[0]source_cursor.execute(f"SELECT * FROM {table_name}")rows = source_cursor.fetchall()columns = [desc[0] for desc in source_cursor.description]with open(f"{table_name}.csv", "w", newline="", encoding="utf-8") as file:writer = csv.writer(file)writer.writerow(columns)writer.writerows(rows) source_cursor.close()
source_conn.close()

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/7909.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

OpenMVS OpenMVG 笔记

OpenMVS & OpenMVG 笔记 OpenMVS 和 OpenMVG 都是计算机视觉中用于三维重建的开源库。两者都可以实现从图像集合中计算出相机位姿和三维点云,但它们的重点略有不同。 OpenMVG 主要关注于从输入图像集合中提取稠密的特征匹配,通过这些匹配计算相机的…

Golang--文件操作

1、文件 文件:文件用于保存数据,是数据源的一种 os包下的File结构体封装了对文件的操作(记得包os包) 2、File结构体--打开文件和关闭文件 2.1 打开文件 打开文件,用于读取(函数): 传…

dcdc3节锂电池串联9-12V升压32V 3A/5A 音响供电恒压芯片 SL4010

SL4010:高效能9-12V至32V升压解决方案,为高端音响系统注入澎湃动力 在追求极致音质与持久续航的音频世界里,SL4010 DC-DC升压转换器以其卓越的性能和可靠性,成为高端音响系统的理想供电伙伴。专为3节锂电池串联(9-12V…

onnx-web + yolov8n 在视频流里做推理

顺着我上一篇文章 使用onnxruntime-web 运行yolov8-nano推理 继续说,有朋友在问能不能接入 视频流动,实时去识别物品。 首先使用 getUserMedia 获取摄像头视频流 getUserMedia API 可以访问设备的摄像头和麦克风。你可以使用这个 API 获取视频流&#…

力扣题库——136.只出现一次的数字

代码实现&#xff1a; class Solution { public:int singleNumber(vector<int>& nums) {int result0;for(int num:nums){result^num;}return result;} }; 结果&#xff1a; 思路&#xff1a;这里让0和数组元素不断异或&#xff0c;因为0与一个数异或的结果是它本身…

EasyPOI使用详解

EasyPOI 简介 easypoi功能如同名字easy,主打的功能就是容易,让一个没见接触过poi的人员 就可以方便的写出Excel导出,Excel模板导出,Excel导入,Word模板导出,通过简单的注解和模板 语言(熟悉的表达式语法),完成以前复杂的写法 文档&#xff1a;http://easypoi.mydoc.io/#categor…

JAVA设计模式之【建造者模式】

1 定义 建造者模式&#xff08;Builder Pattern&#xff09;使用多个简单的对象一步一步构建成一个复杂的对象。这种类型的设计模式属于创建型模式&#xff0c;它提供了一种创建对象的最佳方式。 2 类图 产品类&#xff08;Product&#xff09;&#xff1a;表示被创建的复杂…

智能化健身房管理:Spring Boot与Vue的创新解决方案

作者介绍&#xff1a;✌️大厂全栈码农|毕设实战开发&#xff0c;专注于大学生项目实战开发、讲解和毕业答疑辅导。 &#x1f345;获取源码联系方式请查看文末&#x1f345; 推荐订阅精彩专栏 &#x1f447;&#x1f3fb; 避免错过下次更新 Springboot项目精选实战案例 更多项目…

如何修改WordPress经典编辑器的默认高度?

boke112百科有一个使用WordPress搭建的小网站&#xff0c;文章内容就是几个字不到一行&#xff0c;但是每次使用经典编辑器编辑文章时&#xff0c;都觉得编辑器默认高度太高了&#xff0c;影响了我添加文章摘要和其他属性&#xff0c;有没有办法修改WordPress经典编辑器的默认高…

C#属性 Property

属性Property不是变量。 它们是由名为访问器方法来实现的一种方法。 实例属性表示的是实例的某个数据&#xff0c;通过这个数据反映实例当前的状态 静态属性表示的是类型的某个数据&#xff0c;通过这个数据反映类型当前的状态 意义&#xff1a; 防止恶意赋值(通过属性间接访问…

【力扣热题100】[Java版] 刷题笔记-121. 买卖股票的最佳时机

题目&#xff1a;121. 买卖股票的最佳时机 给定一个数组 prices &#xff0c;它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。 你只能选择 某一天 买入这只股票&#xff0c;并选择在 未来的某一个不同的日子 卖出该股票。设计一个算法来计算你所能获取的最大利润。…

Wi-Fi7 puncturing技术增强与应用

原文关注公众号 - 无线技术栈,及时查看网络/Wi-Fi更多知识 “本文图片没有一一列出,感兴趣可以关注公众号 - 无线技术栈” “本文图片没有一一列出,感兴趣可以关注公众号 - 无线技术栈” Puncturing是一种有效的编码技术,广泛应用于无线通信中,用于在保持信号的可靠性的同…

C语言内存函数介绍和模拟实现:(memcpy,memmove,memcmp,memset)

memcpy介绍及模拟实现&#xff1a; memcpy介绍&#xff1a; void* 是指可以接受任何类型的指针。 memcpy是把从 source 指针开始之后的 num 个字节的内存拷贝到 destination 指针之后的空间。 遇到‘\0’不会停止&#xff0c;而且memcpy不可以拷贝重叠空间&#xff0c;就是说…

浏览器指纹修改指南2024 - 修改Geolocation API指纹(十一)

引言 在前几篇文章中&#xff0c;我们已经详细探讨了Geolocation API的定义、作用及其在浏览器指纹中的重要性&#xff0c;并深入分析了Chromium源码中Geolocation API的实现位置和修改方法。通过这些分析&#xff0c;我们为后续的修改工作奠定了坚实的基础。 在本篇文章中&a…

【微信小程序】基本语法

一、导入小程序 选择代码目录 项目配置文件 appid 当前小程序的 AppIDprojectname 当前小程序的项目名称 变更AppID&#xff08;视情况而定&#xff0c;如果没有开发权限时需要变更成个人的 AppID&#xff09; 二、模板语法 在页面中渲染数据时所用到的一系列语法叫做模板…

数据结构:顺序表

顺序表 顺序表的概念与结构静态顺序表动态顺序表 动态顺序表的实现SeqList.h的创建初始化动态顺序表&#xff08;LS_Init&#xff09;动态顺序表的销毁&#xff08;LS_Destry&#xff09;检查动态内存空间是否已满&#xff08;SL_CheckCapacity&#xff09;动态顺序表打印有效数…

MySQL_数据类型建表

复习&#xff1a; 我们昨天学习的知识都忘了嘛&#xff1f;如果忘了也不要担心&#xff0c;我来带大家来复习一遍吧&#xff01;&#xff01;&#xff01; 1.查看所有数据库 show databases;2.创建属于自己的数据库 create database 数据库名; 检查自己创建的数据库是…

PHP不良事件上报系统源码,医院安全不良事件管理系统,基于 vue2+element+ laravel框架开发

不良事件上报系统通过 “事前的人员知识培训管理和制度落地促进”、“事中的事件上报和跟进处理”、 以及 “事后的原因分析和工作持续优化”&#xff0c;结合预存上百套已正在使用的模板&#xff0c;帮助医院从对护理事件、药品事件、医疗器械事件、医院感染事件、输血事件、意…

在 Android 手机上从SD 卡恢复数据的 6 个有效应用程序

如果您有 Android 设备&#xff0c;您可能会将个人和专业的重要文件保存在设备的 SD 卡上。这些文件包括照片、视频、文档和各种其他类型的文件。您绝对不想丢失这些文件&#xff0c;但当您的 SD 卡损坏时&#xff0c;数据丢失是不可避免的。 幸运的是&#xff0c;您不需要这样…

实战:看懂并分析执行计划——Nested Loops (Inner Join)

这是执行计划中 Nested Loops 的详情信息,下面将逐行解释每个字段的含义,并提供优化思路。 Nested Loops 分析 Physical Operation: Nested Loops (Inner Join) 物理操作,表示这是一个嵌套循环连接(Nested Loops),用于执行 INNER JOIN。嵌套循环通常用于小数据集的连接…