0
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Pythonのglob・osを用いた拡張子ごとのフォルダ振り分け

Last updated at Posted at 2023-08-25

目次

はじめに
作成した経緯
実行環境
正規表現を用いてフォルダにアクセスする方法
拡張子ありのファイル名の取得方法
ファイル名から拡張子を取得する方法
プログラムデータと結果・素材データの識別方法
フォルダの作成方法
フォルダごとにデータを振り分ける方法
ソースコード
結果
まとめ

はじめに

今回は、前回の記事で振り分けたフォルダの中のデータを拡張子から「結果・素材」フォルダと「ソースコード」フォルダにデータを振り分けるプログラムを紹介したいと思います。


よろしければこちらもどうぞ!!

マイページについて

主にPythonについての記事を投稿してます!!

マイページはこちら


X(Twitter)について

Qiitaの新着記事の通知おススメの理工学書の紹介をツイートしてます!!

X(Twitter)はこちら


Zennについて

主に自分の書いたQiitaの記事の転載Pythonを使っていて遭遇したエラーの対処法のような記事を投稿していく予定です!!

Zennはこちら


作成した経緯

前回の記事では大雑把に日付ごとで振り分けていたのですが、これだとフォルダの中のデータが多いとプログラムデータと結果・素材データが分かりにくいという問題が発生しました。
また、GitHubのディレクトリの構造上、プログラムデータと結果・素材データを振り分けることでローカルにあるデータをGitHub上に送りやすくできるようにしました。

実行環境

実行環境は次の通りです。

実行環境
  • 環境
    • Windows 10
    • Python 3.10.5

os glob 標準ライブラリなので特に気にしなくても大丈夫です!!

処理内容モジュール・ライブラリの対応を分かりやすく表にすると次の通りです。

説明
処理内容 モジュール・ライブラリ
ファイル名の取得
ファイルの拡張子名の取得
フォルダの作成
ファイルの移動
os
正規表現を用いてフォルダに
アクセス
glob

正規表現を用いてフォルダにアクセスする方法

こちらのソース

を見ると、Python glob というモジュールを使うことでワイルドカードを使ってフォルダを指定できるそうです。

このモジュールを使ってフォルダの中にアクセスしました。

拡張子ありのファイル名の取得方法

正規表現を用いてフォルダにアクセスする方法でフォルダの中にアクセスできたので、次に拡張子ありのファイル名をこちらのソース

にある os.path.basename() を使って取得しました。

ファイル名から拡張子を取得する方法

拡張子ありのファイル名の取得方法で拡張子付きのファイル名を取得できたので次にファイル名から拡張子のみを取り出す方法を調べました。

こちらのソース

にある os.path.splitext() で拡張子を取得できることが分かりました。
このメソッドを使って、拡張子付きのファイル名から拡張子のみを取り出しました。

プログラムデータと結果・素材データの識別方法

ファイル名から拡張子を取得する方法でファイルから拡張子を取得できました。
現状、使っているプログラミング言語Python のみなのでPythonのプログラムの拡張子である.pyがファイルの拡張子かどうかプログラムデータとそうではないデータの識別条件としました。
また、フォルダを見ると拡張子が .JPG.jpg.png.mp4のデータが結果・素材データだったのでこれらの拡張子がファイルの拡張子かどうか結果・素材データとそうではないデータの識別条件としました。

フォルダの作成方法

前回の記事の最終更新月日のフォルダの作成方法をもとに「結果・素材」フォルダと「ソースコード」フォルダを作成しました。

フォルダごとにデータを振り分ける方法

前回の記事の最終更新月日ごとでフォルダに振り分ける方法をもとにプログラムデータと結果・素材データの識別方法から識別したデータをフォルダの作成方法で作成したフォルダに移動させました。

ソースコード

下にソースコードを示します。おそらく実行環境で示した環境では動くはず。

ソースコード
data_separate(ext).py
import glob                                                                                 #正規表現を用いてフォルダにアクセスするためにインポート
import os                                                                                   #ファイル名の取得・ファイルの拡張子名の取得・フォルダの作成・ファイルの移動のためにインポート

path_list=glob.glob('./python/*_*/*')                                                       #正規表現を用いて各フォルダにアクセス(「文字の真ん中に_がある」フォルダにアクセス)

for i in path_list:                                                                         #それぞれの「文字の真ん中に_がある」フォルダについて処理を実行
	file = os.path.basename(i)                                                              #フォルダ内の拡張子ありのファイル名を取得
	name = os.path.splitext(file)                                                           #ファイル名の.について文字を分割(これで拡張子を取得)

	if name[1] == ".JPG" or name[1] == ".jpg" or name[1] == ".png" or name[1]==".mp4":      #拡張子が「.JPG」、「.jpg」、「.png」、「.mp4」の場合に処理を実行
	                                                                                        #(画像ファイルか動画ファイルの場合)
		os.makedirs(os.path.dirname(i)+"/結果・素材",exist_ok=True)                         #拡張子が「.JPG」、「.jpg」、「.png」、「.mp4」であるファイルがあるフォルダ内に
		                                                                                    #「結果・素材」フォルダを(ない場合に)作成
		if(os.path.isfile(i)):                                                              #「文字の真ん中に_がある」フォルダの直下に拡張子が「.JPG」、「.jpg」、「.png」、「.mp4」
	                                                                                        #であるファイルがある場合に処理を実行
			os.rename(i,os.path.dirname(i)+"/結果・素材/"+file)                             #「文字の真ん中に_がある」フォルダの直下にある拡張子が「.JPG」、「.jpg」、「.png」、「.mp4」
			                                                                                #であるファイルを「結果・素材」フォルダ内に移動

	if name[1] == ".py":                                                                    #拡張子が「.py」の場合に処理を実行
		os.makedirs(os.path.dirname(i)+"/ソースコード",exist_ok=True)                       #拡張子が「.py」であるファイルがあるフォルダ内に「ソースコード」フォルダを(ない場合に)作成
		if(os.path.isfile(i)):                                                              #「文字の真ん中に_がある」フォルダの直下に拡張子が「.py」であるファイルがある場合に処理を実行
			os.rename(i,os.path.dirname(i)+"/ソースコード/"+file)                           #「文字の真ん中に_がある」フォルダの直下にある拡張子が「.py」であるファイルを「ソースコード」
			                                                                                #フォルダ内に移動

結果

下に結果を示します。

元のフォルダ内

元のフォルダ内.JPG


元のフォルダ内はプログラムデータと素材・結果データが混在していて分かりにくくなっています。

こちらが処理実行後の同フォルダ内です。

処理実行後のフォルダ内

処理実行後のフォルダ内.JPG


きちんと「ソースコード」フォルダと「結果・素材」フォルダで振り分けられています。

それぞれのフォルダ内は次の通りです。

「ソースコード」フォルダ内

「ソースコード」フォルダ内.JPG


「結果・素材」フォルダ内

変換後_フォルダ_3.JPG


きちんと拡張子ごとに振り分けられています。

まとめ

今回は、前回の記事のデータを拡張子ごとに振り分けることを行いました。
この記事が実際に役に立つかどうかは分かりませんが、誰かの役に立ってくれると嬉しいです。
記事を執筆する余力があれば、次回も記事を投稿する予定です。
次回の予定としては、Twitter(X)のアンケートでトップだった動画像処理から画像の画素ごとの補色で色変換を行いその結果とネガポジ反転から得られた結果とオリジナル画像を並べて表示させ補色による色変換とネガポジ反転の画素値によるヒストグラムを表示させるプログラムを作成できたのでそれに関する記事を投稿予定です。

0
2
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?