LoginSignup
1
1

More than 5 years have passed since last update.

Pythonでディレクトリごとのディスク使用容量を一覧化する

Posted at

はじめに

年末なので、ハードディスクの整理でもしようと思い、フリーソフトをインストールしようとしたらセキュリティソフトに阻まれたので自分で作ってみました。

思ったよりも面倒でした。

作る

環境

Windows専用です。

  • Windows7
  • Python3.7

サブフォルダ一覧を取得

前はos.listdirを使うのが一般的でしたが、最近のPythonではscandirを使うのが良さそうです。os.DirEntryオブジェクトでファイルのメタ情報も合わせて取得できます。

with os.scandir(drive_path) as it:
    for entry in it:
        print(entry.name)

ディスクの使用量を取得する

ディスク全体はshutilで取得できます。

shutil.disk_usage

しかし、フォルダ単位では取得できず、結局全ファイルを探索しています。

コード全体

指定したドライブの指定の階層までのフォルダ一覧をサイズと共に出力します。
結果はtsv形式としています。

# -*- coding: utf-8 -*-
"""
    disk_info.py

    ディスクの使用容量を一覧化するスクリプトです。

"""
import shutil
import os
import logging
logger = logging.getLogger(__name__)
fmt = "%(asctime)s [%(levelname)s] %(message)s"
logging.basicConfig(format=fmt, level=logging.DEBUG)

# フォルダをリスト化最大の深さ
MAX_DEPTH = 3

# リスト化対象のドライブレター
DRIVE_LETTER = 'DE'

# 出力ファイル
OUTPUT_FILE = './output.tsv'


def main():
    """
    メイン

    :return:
    """

    folder_tree = {}
    for drive in list(DRIVE_LETTER):
        # --------------------------------------
        # ドライブ単位の処理
        # --------------------------------------
        drive_path = drive + '://'
        with os.scandir(drive_path) as it:
            folder_tree[drive] = {'folders': []}
            for entry in it:
                if exclude_file(entry.name):
                    continue
                elif entry.is_file():
                    pass
                elif entry.is_dir():
                    folder_tree[drive]['folders'].append(folder_info(entry.path))
        # ドライブの使用量は別に取得する
        usage = shutil.disk_usage(drive_path)
        folder_tree[drive]['total'] = usage[0]
        folder_tree[drive]['used'] = usage[1]
        folder_tree[drive]['free'] = usage[2]

    # ファイル書き込み
    write_string = []
    logger.debug(folder_tree)
    for root in folder_tree:
        tabs = ''
        for i in range(0, MAX_DEPTH):
            tabs += '\t'
        write_string.append(root + tabs + format_size(folder_tree[root]['used']) + '\t' + format_size(folder_tree[root]['free']) + '\n')
        for folder in folder_tree[root]['folders']:
            write_string.extend(rec_format_folder(folder, 1))

    with open(OUTPUT_FILE, mode='w') as f:
        f.writelines(write_string)


def folder_info(path):
    """
    1フォルダの情報を取得する

    :param path:
    :return:
    """

    folders = {'path': path, 'size': 0, 'folders': []}
    try:
        with os.scandir(path) as it:
            for entry in it:
                # 除外ファイルのスキップ
                if exclude_file(entry.name):
                    continue
                # ファイルの場合はサイズを加算する
                elif entry.is_file(follow_symlinks=False):
                    folders['size'] += entry.stat(follow_symlinks =False).st_size
                # ディレクトリは再帰で取得する
                elif entry.is_dir():
                    folders['folders'].append(folder_info(entry.path))
                else:
                    logging.warning('-- ' + entry.path)
    except:
        logging.warning("read error. " + path)

    return folders


def rec_format_folder(folder, depth):
    """
    フォルダ単位の出力制御

    :param folder:
    :param depth:
    :return:
    """
    result = []

    format_str = ''
    for i in range(0, depth):
        format_str += '\t'
    format_str += folder['path']
    for i in range(0, MAX_DEPTH - depth):
        format_str += '\t'
    format_str += format_size(folder['size'])
    result.append(format_str + '\n')

    # チェック
    depth += 1
    if depth >= MAX_DEPTH or 'folders' not in folder:
        return result

    # 次の階層
    for folder in folder['folders']:
        result.extend(rec_format_folder(folder, depth))

    return result


def format_size(size):
    """
    使用量の表示

    :param size:
    :return:
    """
    # 単位はGByteとする
    f_size = size / 1024 / 1024 / 1024
    f_size = round(f_size, 3)
    return str(f_size)


def exclude_file(name):
    """
    除外する条件

    :param name:
    :return:
    """
    if 'System Volume Information' in name:
        return True
    if '$RECYCLE.BIN' in name:
        return True

    return False


if __name__ == "__main__":
    logger.info('start -----------')
    main()
    logger.info('end -----------')

githubにも登録しました。

tools/disk_info.py at master · estaro/tools

おわりに

そこそこ重いです。

参考

16.1. os — 雑多なオペレーティングシステムインタフェース — Python 3.6.5 ドキュメント

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1