python用pd.read_csv()方法来读取csv文件的实现

csv文件是一种用,和换行符区分数据记录和字段的一种文件结构,可以用excel表格编辑,也可以用记事本编辑,是一种类excel的数据存储文件,也可以看成是一种数据库。pandas提供了pd.read_csv()方法可以读取其中的数据并且转换成DataFrame数据帧。python的强大之处就在于他可以把不同的数据库类型,比如txt/csv/.xls/.sql转换成统一的DataFrame格式然后进行统一的处理。真是做到了标准化。我们可以用以下代码来演示csv文件的读取操作。

import pandas as pddata1 = pd.read_csv('rating.csv')print(data1)print("************取消第一行作为表头*************")data2 = pd.read_csv('rating.csv',header=None)print(data2)print("************为各个字段取名**************")data3 = pd.read_csv('rating.csv',names=['user_id','book_id','rating'])print(data3)print("***********将某一字段设为索引***************")data3 = pd.read_csv('rating.csv',names=['user_id','book_id','rating'],index_col = "user_id")print(data3)print("************用sep参数设置分隔符**************")data4 = pd.read_csv('rating.csv',names=['user_id','book_id','rating'],sep=',')print(data4)print("************自动补全缺失数据为NaN**************")data5 = pd.read_csv('data.csv',header=None)print(data5)

输出的结果如下:
【python用pd.read_csv()方法来读取csv文件的实现】12585
0240814
122605
2292965
3223183
42264
523153
62334
723015
************取消第一行作为表头*************
012
012585
1240814
222605
3292965
4223183
52264
623153
72334
823015
************为各个字段取名**************
user_idbook_idrating
012585
1240814
222605
3292965
4223183
52264
623153
72334
823015
***********将某一字段设为索引***************
book_idrating
user_id
12585
240814
22605
292965
223183
2264
23153
2334
23015
************用sep参数设置分隔符**************
user_idbook_idrating
012585
1240814
222605
3292965
4223183
52264
623153
72334
823015
************自动补全缺失数据为NaN**************
01234
012.034.05
167.08NaN10
211NaN1314.015
[Finished in 4.5s]
对代码的具体解释,可以参考星号隔离bar中的注释。
到此这篇关于python用pd.read_csv()方法来读取csv文件的实现的文章就介绍到这了,更多相关python读取csv文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

    推荐阅读