如何使用Pandas将Excel文件导入Python()

【如何使用Pandas将Excel文件导入Python()】Pandas如何导入Excel文件?你可以使用Pandas轻松地将 Excel 文件导入 Python 。为了实现这一目标,你需要使用read_excel
在这个简短的Pandas将Excel文件导入Python的指南中,你将看到使用一个简单示例将 Excel 文件导入 Python 的步骤。
但在我们开始之前,这里有一个模板,你可以在 Python 中使用它来导入 Excel 文件:

import pandas as pddf = pd.read_excel (r'Path where the Excel file is stored\File name.xlsx') print (df)

请注意,对于早期版本的 Excel,你可能需要使用“xls”的文件扩展名
如果你有要导入的特定Excel 工作表,如下Pandas导入Excel文件代码示例:
import pandas as pddf = pd.read_excel (r'Path where the Excel file is stored\File name.xlsx', sheet_name='your Excel sheet name') print (df)

现在让我们回顾一个包含要导入 Python 的数据的示例。
Python Pandas导入Excel文件:要导入 Python 的数据假设你将下表存储在 Excel 中(其中 Excel 文件名为“产品列表”):
ProductPrice
Desktop Computer700
Tablet250
Printer120
Laptop1200
那么如何将上述数据导入 Python 中呢?
你可以按照以下步骤将 Excel 文件导入 Python。
使用Pandas将Excel文件导入Python的步骤第 1 步:捕获文件路径
Pandas如何导入Excel文件?首先,你需要捕获 Excel 文件在你的计算机上存储的完整路径。
例如,假设一个 Excel 文件存储在以下路径下:
C:\Users\Ron\Desktop\Product List.xlsx
在下面提供的 Python 代码中,你需要修改路径名以反映 Excel 文件在你的计算机上存储位置。
不要忘记包含文件名(在我们的示例中,它是“产品列表”,以蓝色突出显示)。你还需要包含 Excel 文件扩展名(在我们的例子中,它是“  .xlsx  ”,以绿色突出显示)。
第 2 步:应用 Python 代码
这是为我们的示例量身定制的 Python 代码。代码中包含其他注释以阐明一些使用的组件。
import pandas as pddf = pd.read_excel (r'C:\Users\Ron\Desktop\Product List.xlsx') #place "r" before the path string to address special character, such as '\'. Don't forget to put the file name at the end of the path + '.xlsx' print (df)

第 3 步:运行 Python 代码以导入 Excel 文件
运行 Python 代码(根据你的路径进行调整),你将获得以下数据集:
ProductPrice 0Desktop Computer700 1Tablet250 2Printer120 3Laptop1200

请注意,我们得到的结果与存储在 Excel 文件中的结果相同。
注意:如果在运行代码时出现以下错误,则必须安装额外的包:
导入错误:缺少可选依赖项“xlrd”
然后,你可以使用PIP 安装方法为 .  xlsx文件:
pip install openpyxl

Pandas将Excel文件导入Python可选步骤:选择列子集
现在,如果你想从 Excel 文件中选择一个或多个特定的列怎么办?
例如,如果你只想选择Product列怎么办?如果是这种情况,你可以指定此列名称,如下Pandas导入Excel文件代码示例:
import pandas as pddata = https://www.lsbin.com/pd.read_excel (r'C:\Users\Ron\Desktop\Product List.xlsx') df = pd.DataFrame(data, columns= [ 'Product']) print (df)

运行代码(调整文件路径后),你将只得到 Product 列:
Product 0Desktop Computer 1Tablet 2Printer 3Laptop

你可以通过使用逗号分隔名称来指定其他列,因此如果你想同时包含 Product 和 Price 列,你可以使用以下语法:
import pandas as pddata = https://www.lsbin.com/pd.read_excel (r'C:\Users\Ron\Desktop\Product List.xlsx') df = pd.DataFrame(data, columns= [ 'Product','Price']) print (df)

你需要确保代码中指定的列名与 Excel 文件中的列名完全匹配。否则,你将获得NaN values。
Python Pandas导入Excel文件总结你刚刚看到了如何使用Pandas将Excel文件导入Python。
Pandas如何导入Excel文件?有时,你可能需要将 CSV 文件导入 Python。如果是这种情况,你可能需要查看以下教程,该教程解释了如何使用 Pandas将CSV文件导入 Python。
你还可以查看Pandas 文档  以了解更多关于你可以在 read_excel 中应用的不同选项的信息。

    推荐阅读