Python使用pandas.read_csv()读取csv示例

【Python使用pandas.read_csv()读取csv示例】Python是进行数据分析的一种出色语言, 主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种, 使导入和分析数据更加容易。
导入Pandas:

import pandas as pd

代码1:
read_csv是读取csv文件并对其执行操作的重要Pandas函数。
# Import pandas import pandas as pd# reading csv file pd.read_csv( "filename.csv" )

通过此操作轻松打开CSV文件。但是还有许多其他事情可以通过此功能完成, 而只是完全更改返回的对象。例如, 你不仅可以在本地读取csv文件, 还可以通过read_csv从URL读取csv文件, 或者可以选择需要导出的列, 这样我们以后就不必编辑数组了。
这是它们使用的参数列表默认值.
pd.read_csv(filepath_or_buffer, sep=’, ‘, delimiter=None, header=’infer’, names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression=’infer’, thousands=None, decimal=b’.’, lineterminator=None, quotechar=’ ”‘, quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)
并非所有功能都非常重要, 但记住这些功能实际上可以节省自己执行相同功能的时间。通过按Jupyter笔记本中的Shift + Tab, 可以看到任何功能的参数。下面列出了有用的用法:
参数 使用
filepath_or_buffer 文件的URL或目录位置
sep 代表分隔符, 默认值为“ , “ , 如csv(逗号分隔值)
index_col 将传递的列设为索引, 而不是0、1、2、3…r
header 将传递的行/ s [int / int列表]作为标题

use_cols 仅使用传递的col [string list]制作数据框
squeeze 如果为true, 并且仅传递一列, 则返回pandas系列
skiprows 跳过新数据框中传递的行
请参阅以下链接使用的数据集这里.
代码2:
# importing Pandas library import pandas as pdpd.read_csv(filepath_or_buffer = "pokemon.csv" )# makes the passed rows header pd.read_csv( "pokemon.csv" , header = [ 1 , 2 ])# make the passed column as index instead of 0, 1, 2, 3.... pd.read_csv( "pokemon.csv" , index_col = 'Type' )# uses passed cols only for data frame pd.read_csv( "pokemon.csv" , usecols = [ "Type" ])# reutruns pandas series if there is only one colunmn pd.read_csv( "pokemon.csv" , usecols = [ "Type" ], squeeze = True )# skips the passed rows in new series pd.read_csv( "pokemon.csv" , skiprows = [ 1 , 2 , 3 , 4 ])

首先, 你的面试准备可通过以下方式增强你的数据结构概念:Python DS课程。

    推荐阅读