百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Python3处理csv文件的数据方法、代码、实例

itomcoil 2025-05-30 15:12 16 浏览

1.CSV

就是(Comma-Separated Values)即逗号分隔值,可以用Excel打开查看。

由于是纯文本,任何编辑器也都可打开。

与Excel文件不同,CSV文件中:

1)值没有类型,所有值都是字符串

2)不能指定字体颜色等样式

3)不能指定单元格的宽高,不能合并单元格

4)没有多个工作表


2.在CSV文件中,以,作为分隔符,分隔两个单元格。

像这样a,,c表示单元格a和单元格c之间有个空白的单元格。依此类推。

不是每个逗号都表示单元格之间的分界。

所以即使CSV是纯文本文件,也坚持使用专门的模块进行处理。

Python内置了csv模块。先看看一个简单的例子。


3.从CSV文件中读取数据

import csv
filename = '/home/xgj/xgjpython/seaborn/seaborn-data-master/test.csv' #举例
with open(filename) as f:
 reader = csv.reader(f)
 print(list(reader))

data不能直接打印,list(data)最外层是list,里层的每一行数据都在一个list中,有点像这样

[['total_bill', 'tip', 'sex', 'smoker', 'day', 'time', 'size'], ['16.99', '1.01', 'Female', 'No', 'Sun', 'Dinner', '2'], ['10.34', '1.66', 'Male', 'No', 'Sun', 'Dinner', '3'], ['21.01', '3.5', 'Male', 'No', 'Sun', 'Dinner', '3'], ['23.68', '3.31', 'Male', 'No', 'Sun', 'Dinner', '2'], ['24.59', '3.61', 'Female', 'No', 'Sun', 'Dinner', '4'], ['25.29', '4.71', 'Male', 'No', 'Sun', 'Dinner', '4'], ['8.77', '2', 'Male', 'No', 'Sun', 'Dinner', '2'], ['26.88', '3.12', 'Male', 'No', 'Sun', 'Dinner', '4'], ['15.04', '1.96', 'Male', 'No', 'Sun', 'Dinner', '2'], ['14.78', '3.23', 'Male', 'No', 'Sun', 'Dinner', '2'], ['10.27', '1.71', 'Male', 'No', 'Sun', 'Dinner', '2'], ['35.26', '5', 'Female', 'No', 'Sun', 'Dinner', '4'], ['15.42', '1.57', 'Male', 'No', 'Sun', 'Dinner', '2'], ['18.43', '3', 'Male', 'No', 'Sun', 'Dinner', '4'], ......]

这样数据打印出来,但是就像摊饼一样,不好看。

4.改一下代码

import csv
filename = '/home/xgj/xgjpython/seaborn/seaborn-data-master/test.csv' #举例
with open(filename) as f:
 reader = csv.reader(f)
 for row in reader:
 # 行号从1开始
 print(reader.line_num, row)

结果:

xgj@xgj-PC:~$ /usr/bin/python3.8 /home/xgj/Desktop/333333.py

1 ['total_bill', 'tip', 'sex', 'smoker', 'day', 'time', 'size']

2 ['16.99', '1.01', 'Female', 'No', 'Sun', 'Dinner', '2']

3 ['10.34', '1.66', 'Male', 'No', 'Sun', 'Dinner', '3']

4 ['21.01', '3.5', 'Male', 'No', 'Sun', 'Dinner', '3']

5 ['23.68', '3.31', 'Male', 'No', 'Sun', 'Dinner', '2']

6 ['24.59', '3.61', 'Female', 'No', 'Sun', 'Dinner', '4']

7 ['25.29', '4.71', 'Male', 'No', 'Sun', 'Dinner', '4']

......

5.写数据到csv文件中

有reader可以读取,当然也有writer可以写入。一次写入一行,一次写入多行都可以。

代码:

import csv
#格式:['25.29', '4.71', 'Male', 'No', 'Sun', 'Dinner', '4']
# 使用数字和字符串的数字都可以
datas = [['28.88','5.21' ,'Male','Yes','Sun','Dinner','5']]
with open('/home/xgj/xgjpython/seaborn/seaborn-data-master/test.csv', 'w', newline='') as f:
 writer = csv.writer(f)
 for row in datas:
 writer.writerow(row)

------

注意覆盖原来数据了,所以如果需要,请注意备份或者这是新建一份数据不是追加数据。

------

也可以一次性增加多行数据。

import csv
datas = [['28.88','5.21' ,'Male','Yes','Sun','Dinner','5'],
 ['29.88','5.21' ,'Male','Yes','Sun','Dinner','6'],
 ['30.88','5.21' ,'Male','Yes','Sun','Dinner','7'],
 ['31.88','5.21' ,'Male','Yes','Sun','Dinner','8']
 ]
with open('/home/xgj/xgjpython/seaborn/seaborn-data-master/test.csv', 'w', newline='') as f:
 writer = csv.writer(f)
 for row in datas:
 #writer.writerow(row) 增加一次数据的 
 writer.writerows(datas) #增加多行数据,数据重复4次

结果,图csv1



图csv2


如果不指定newline='',则每写入一行将有一空行被写入。


6.DictReader和DictWriter对象

使用DictReader可以像操作字典那样获取数据,把表的第一行(一般是标头)作为key。

可访问每一行中那个某个key对应的数据。

假设数据是图csv3



代码如下:

import csv
filename = '/home/xgj/xgjpython/seaborn/seaborn-data-master/test.csv'
with open(filename) as f:
 reader = csv.DictReader(f)
 for row in reader:
 # total_bill是表第一行的某个数据,作为key
 max_temp = row['total_bill']
 print(max_temp)

结果是图csv4



7.使用DictWriter类,可以写入字典形式的数据,同样键也是标头(表格第一行)。

代码如下:

import csv
headers = ['name', 'age']
datas = [{'name':'Bob', 'age':23},
 {'name':'Jerry', 'age':44},
 {'name':'Tom', 'age':15}
 ]
with open('/home/xgj/xgjpython/seaborn/seaborn-data-master/example.csv', 'w', newline='') as f:
 # 标头在这里传入,作为第一行数据
 writer = csv.DictWriter(f, headers)
 writer.writeheader()
 for row in datas:
 writer.writerow(row)

结果图csv5



# 还可以写入多行

#writer.writerows(datas)

相关推荐

selenium(WEB自动化工具)

定义解释Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7,8,9,10,11),MozillaF...

开发利器丨如何使用ELK设计微服务中的日志收集方案?

【摘要】微服务各个组件的相关实践会涉及到工具,本文将会介绍微服务日常开发的一些利器,这些工具帮助我们构建更加健壮的微服务系统,并帮助排查解决微服务系统中的问题与性能瓶颈等。我们将重点介绍微服务架构中...

高并发系统设计:应对每秒数万QPS的架构策略

当面试官问及"如何应对每秒几万QPS(QueriesPerSecond)"时,大概率是想知道你对高并发系统设计的理解有多少。本文将深入探讨从基础设施到应用层面的解决方案。01、理解...

2025 年每个 JavaScript 开发者都应该了解的功能

大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发。1.Iteratorhelpers开发者...

JavaScript Array 对象

Array对象Array对象用于在变量中存储多个值:varcars=["Saab","Volvo","BMW"];第一个数组元素的索引值为0,第二个索引值为1,以此类推。更多有...

Gemini 2.5编程全球霸榜,谷歌重回AI王座,神秘模型曝光,奥特曼迎战

刚刚,Gemini2.5Pro编程登顶,6美元性价比碾压Claude3.7Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。谷歌,彻底打了一场漂亮的翻...

动力节点最新JavaScript教程(高级篇),深入学习JavaScript

JavaScript是一种运行在浏览器中的解释型编程语言,它的解释器被称为JavaScript引擎,是浏览器的一部分,JavaScript广泛用于浏览器客户端编程,通常JavaScript脚本是通过嵌...

一文看懂Kiro,其 Spec工作流秒杀Cursor,可移植至Claude Code

当Cursor的“即兴编程”开始拖累项目质量,AWS新晋IDEKiro以Spec工作流打出“先规范后编码”的系统工程思维:需求-设计-任务三件套一次生成,文档与代码同步落地,复杂项目不...

「晚安·好梦」努力只能及格,拼命才能优秀

欢迎光临,浏览之前点击上面的音乐放松一下心情吧!喜欢的话给小编一个关注呀!Effortscanonlypass,anddesperatelycanbeexcellent.努力只能及格...

JavaScript 中 some 与 every 方法的区别是什么?

大家好,很高兴又见面了,我是姜茶的编程笔记,我们一起学习前端相关领域技术,共同进步,也欢迎大家关注、点赞、收藏、转发,您的支持是我不断创作的动力在JavaScript中,Array.protot...

10个高效的Python爬虫框架,你用过几个?

小型爬虫需求,requests库+bs4库就能解决;大型爬虫数据,尤其涉及异步抓取、内容管理及后续扩展等功能时,就需要用到爬虫框架了。下面介绍了10个爬虫框架,大家可以学习使用!1.Scrapysc...

12个高效的Python爬虫框架,你用过几个?

实现爬虫技术的编程环境有很多种,Java、Python、C++等都可以用来爬虫。但很多人选择Python来写爬虫,为什么呢?因为Python确实很适合做爬虫,丰富的第三方库十分强大,简单几行代码便可实...

pip3 install pyspider报错问题解决

运行如下命令报错:>>>pip3installpyspider观察上面的报错问题,需要安装pycurl。是到这个网址:http://www.lfd.uci.edu/~gohlke...

PySpider框架的使用

PysiderPysider是一个国人用Python编写的、带有强大的WebUI的网络爬虫系统,它支持多种数据库、任务监控、项目管理、结果查看、URL去重等强大的功能。安装pip3inst...

「机器学习」神经网络的激活函数、并通过python实现激活函数

神经网络的激活函数、并通过python实现whatis激活函数感知机的网络结构如下:左图中,偏置b没有被画出来,如果要表示出b,可以像右图那样做。用数学式来表示感知机:上面这个数学式子可以被改写:...