【Python使用pandas.read_csv()读取csv示例】Python是进行数据分析的一种出色语言, 主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种, 使导入和分析数据更加容易。
导入Pandas:
import pandas as pd
代码1:
read_csv是读取csv文件并对其执行操作的重要Pandas函数。
# Import pandas
import pandas as pd# reading csv file
pd.read_csv( "filename.csv" )
通过此操作轻松打开CSV文件。但是还有许多其他事情可以通过此功能完成, 而只是完全更改返回的对象。例如, 你不仅可以在本地读取csv文件, 还可以通过read_csv从URL读取csv文件, 或者可以选择需要导出的列, 这样我们以后就不必编辑数组了。
这是它们使用的参数列表默认值.
pd.read_csv(filepath_or_buffer, sep=’, ‘, delimiter=None, header=’infer’, names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression=’infer’, thousands=None, decimal=b’.’, lineterminator=None, quotechar=’ ”‘, quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)并非所有功能都非常重要, 但记住这些功能实际上可以节省自己执行相同功能的时间。通过按Jupyter笔记本中的Shift + Tab, 可以看到任何功能的参数。下面列出了有用的用法:
参数 | 使用 |
---|---|
filepath_or_buffer | 文件的URL或目录位置 |
sep | 代表分隔符, 默认值为“ , “ , 如csv(逗号分隔值) |
index_col | 将传递的列设为索引, 而不是0、1、2、3…r |
header | 将传递的行/ s [int / int列表]作为标题 |
use_cols | 仅使用传递的col [string list]制作数据框 |
squeeze | 如果为true, 并且仅传递一列, 则返回pandas系列 |
skiprows | 跳过新数据框中传递的行 |
代码2:
# importing Pandas library
import pandas as pdpd.read_csv(filepath_or_buffer = "pokemon.csv" )# makes the passed rows header
pd.read_csv( "pokemon.csv" , header = [ 1 , 2 ])# make the passed column as index instead of 0, 1, 2, 3....
pd.read_csv( "pokemon.csv" , index_col = 'Type' )# uses passed cols only for data frame
pd.read_csv( "pokemon.csv" , usecols = [ "Type" ])# reutruns pandas series if there is only one colunmn
pd.read_csv( "pokemon.csv" , usecols = [ "Type" ], squeeze = True )# skips the passed rows in new series
pd.read_csv( "pokemon.csv" , skiprows = [ 1 , 2 , 3 , 4 ])
首先, 你的面试准备可通过以下方式增强你的数据结构概念:Python DS课程。
推荐阅读
- Python range()函数用法介绍和示例
- 1debian11基本配置
- 2022年最强大数据面试宝典(全文50000字,建议收藏)
- Zabbix学习笔记(三十六)
- Yarn状态机框架分析
- F5 GTM DNS 知识点和实验 1 -F5设备初识
- F5 GTM DNS 知识点和实验 2 -DNS基础知识
- F5 GTM DNS 知识点和实验 3 -加速dns解析
- MySQL数据库——MHA高可用配置及故障切换