如何在Python中获取目录的大小(代码示例)

Python如何获取目录的大小?在 Python 中以字节为单位计算目录的大小,并使用 matplotlib 绘制饼图以查看哪个子目录的大小最大。
你有没有想过如何使用 Python 以字节为单位获取文件夹大小?你可能已经知道,os.path.get_size()函数只返回正确文件的正确大小,而不是文件夹。在本快速教程中,你将学习如何在 Python 中创建一个简单的函数来计算目录的总大小。
让我们开始吧,打开一个新的 Python 文件:

import os

下面的核心函数根据目录的相对或绝对路径计算目录的总大小:
def get_directory_size(directory): """Returns the `directory` size in bytes.""" total = 0 try: # print("[ +] Getting the size of", directory) for entry in os.scandir(directory): if entry.is_file(): # if it's a file, use stat() function total += entry.stat().st_size elif entry.is_dir(): # if it's a directory, recursively call this function total += get_directory_size(entry.path) except NotADirectoryError: # if `directory` isn't a directory, get the file size then return os.path.getsize(directory) except PermissionError: # if for whatever reason we can't open the folder, return 0 return 0 return total

在以上的Python获取目录的大小示例中,请注意,我使用了os.scandir()函数,该函数返回给定目录中条目(文件或目录)的迭代器。
如果给定的路径不是文件夹(文件或链接),os.scandir()会引发NotADirectoryError,这就是我们捕获该异常并仅返回该文件的实际大小的原因。
如果它无法打开文件(例如系统文件),它也会引发PermissionError,在这种情况下,我们将只返回0。
如何在Python中获取目录的大小?上面的函数将返回以字节为单位的大小,这对于大目录当然是不可读的,因此,让我们创建一个函数来将这些字节缩放为 Kilo、Mega、Giga 等:
def get_size_format(b, factor=1024, suffix="B"): """ Scale bytes to its proper byte format e.g: 1253656 => '1.20MB' 1253656678 => '1.17GB' """ for unit in [ "", "K", "M", "G", "T", "P", "E", "Z"]: if b < factor: return f"{b:.2f}{unit}{suffix}" b /= factor return f"{b:.2f}Y{suffix}"

好的,我要在我的 C 盘上测试这个(我知道它很大):
get_size_format(get_directory_size("C:\\"))

这花了大约一分钟并返回以下内容:
'100.91GB'

Python获取目录的大小示例 - 现在,如果我想知道哪些子目录占用了大部分空间怎么办?好吧,下面的代码不只是计算每个子目录的大小,而是使用matplotlib库(你可以在其中安装使用pip3 install matplotlib)绘制一个饼图,显示每个子目录的大小:
import matplotlib.pyplot as pltdef plot_pie(sizes, names): """Plots a pie where `sizes` is the wedge sizes and `names` """ plt.pie(sizes, labels=names, autopct=lambda pct: f"{pct:.2f}%") plt.title("Different Sub-directory sizes in bytes") plt.show()if __name__ == "__main__": import sys folder_path = sys.argv[ 1]directory_sizes = [ ] names = [ ] # iterate over all the directories inside this path for directory in os.listdir(folder_path): directory = os.path.join(folder_path, directory) # get the size of this directory (folder) directory_size = get_directory_size(directory) if directory_size == 0: continue directory_sizes.append(directory_size) names.append(os.path.basename(directory) + ": " + get_size_format(directory_size))print("[ +] Total directory size:", get_size_format(sum(directory_sizes))) plot_pie(directory_sizes, names)

现在,这将目录作为命令行中的参数:
python get_directory_size.py C:\

Python如何获取目录的大小?下面是结果,这将显示一个漂亮的馅饼,看起来像这样:
如何在Python中获取目录的大小(代码示例)

文章图片
现在看到这个图表后,我知道用户和Windows文件夹占用了我的大部分C驱动器!
【如何在Python中获取目录的大小(代码示例)】如何在Python中获取目录的大小?好的,这是本教程的内容,如果你想了解有关在 Python 中处理文件和目录的更多信息,请查看本教程。

    推荐阅读