0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

note-zip-2-sqlite.py: noteのエクスポートzipファイルを一括でSQLiteに保存するスクリプトを書きました

Last updated at Posted at 2025-08-10

これは何?

noteのエクスポート機能で出力されたZIPファイルのXMLを一括でSQLiteに保存するスクリプトです

なぜ作った?

2020年4月から画像含めて14ZIPファイルだったので、一括処理したかったから。

また、他の方の手間も減らせると考えたから。

出来ること

user@Ubuntu-Pc$ ls
[noteの長いファイル名]_1.zip   [noteの長いファイル名]_2.zip  [noteの長いファイル名]_8.zip
[noteの長いファイル名]_10.zip  [noteの長いファイル名]_3.zip  [noteの長いファイル名]_9.zip
[noteの長いファイル名]_11.zip  [noteの長いファイル名]_4.zip  note-zip-2-sqlite.py  
[noteの長いファイル名]_12.zip  [noteの長いファイル名]_5.zip  noteXMLstrucuure-analyzer.py
[noteの長いファイル名]_13.zip  [noteの長いファイル名]_6.zip  note_articles.db ## この.dbを作る仕組みです
[noteの長いファイル名]_14.zip  [noteの長いファイル名]_7.zip

カレントディレクトリにあるnoteのZIPファイルをまとめてSQLiteに保存します。

sqlite3 note_articles.db "SELECT strftime('%Y', post_date) AS year, post_date AS 日付, title AS タイトル, article_url AS URL FROM articles WHERE is_published = 1 AND post_date >= '2020-01-01' ORDER BY year, post_date;"

SQLiteを操作すれば、例えばサイトマップの下書きも作成しやすいです。

ターミナルでの動作例

$ nano note-zip-2-sqlite.py
$ chmod +x note-zip-2-sqlite.py
$ ./note-zip-2-sqlite.py
🚀 note エクスポートデータ一括処理システム
============================================================
zipファイルのディレクトリパス (デフォルト: .): 
データベース名 (デフォルト: note_articles.db): 
🔍 zipファイルスキャン中: .
📦 見つかったzipファイル: 14個
   検証中: [                                                              ]_1.zip... ✅ 有効なnote XMLファイル (記事数: 599)
   検証中: [                                                              ]_10.zip... ✅ 有効なnote XMLファイル (記事数: 17)
   検証中: [                                                              ]_11.zip... ✅ 有効なnote XMLファイル (記事数: 27)
   検証中: [                                                              ]_12.zip... ✅ 有効なnote XMLファイル (記事数: 29)
   検証中: [                                                              ]_13.zip... ✅ 有効なnote XMLファイル (記事数: 124)
   検証中: [                                                              ]_14.zip... ✅ 有効なnote XMLファイル (記事数: 338)
   検証中: [                                                              ]_2.zip... ✅ 有効なnote XMLファイル (記事数: 716)
   検証中: [                                                              ]_3.zip... ✅ 有効なnote XMLファイル (記事数: 140)
   検証中: [                                                              ]_4.zip... ✅ 有効なnote XMLファイル (記事数: 88)
   検証中: [                                                              ]_5.zip... ✅ 有効なnote XMLファイル (記事数: 751)
   検証中: [                                                              ]_6.zip... ✅ 有効なnote XMLファイル (記事数: 290)
   検証中: [                                                              ]_7.zip... ✅ 有効なnote XMLファイル (記事数: 10)
   検証中: [                                                              ]_8.zip... ✅ 有効なnote XMLファイル (記事数: 40)
   検証中: [                                                              ]_9.zip... ✅ 有効なnote XMLファイル (記事数: 9)

📊 スキャン結果:
   ✅ 有効なzipファイル: 14個
   ❌ 無効なzipファイル: 0個

🗂️  処理対象zipファイル: 14個
   📦 [                                                              ]_1.zip
   📦 [                                                              ]_10.zip
   📦 [                                                              ]_11.zip
   📦 [                                                              ]_12.zip
   📦 [                                                              ]_13.zip
   📦 [                                                              ]_14.zip
   📦 [                                                              ]_2.zip
   📦 [                                                              ]_3.zip
   📦 [                                                              ]_4.zip
   📦 [                                                              ]_5.zip
   📦 [                                                              ]_6.zip
   📦 [                                                              ]_7.zip
   📦 [                                                              ]_8.zip
   📦 [                                                              ]_9.zip

💾 データベース: note_articles.db

処理を開始しますか? (y/N): y
📁 データベース作成: note_articles.db
✅ データベース準備完了

🔄 zipファイル処理開始 (14個)
============================================================

[1/14] 
📦 処理中: [                                                              ]_1.zip
   📄 XML: note-karasu_toragara-1.xml
   📊 記事数: 599
/note-zip-2-sqlite.py:280: DeprecationWarning: The default datetime adapter is deprecated as of Python 3.12; see the sqlite3 documentation for suggested replacement recipes
  cursor.execute('''
   ⏳ 進捗: 10/599 (1.7%)
   ⏳ 進捗: 20/599 (3.3%)
   ⏳ 進捗: 30/599 (5.0%)
   ⏳ 進捗: 40/599 (6.7%)
   ⏳ 進捗: 50/599 (8.3%)
   ⏳ 進捗: 60/599 (10.0%)
   ⏳ 進捗: 70/599 (11.7%)
   ⏳ 進捗: 80/599 (13.4%)
   ⏳ 進捗: 90/599 (15.0%)
   ⏳ 進捗: 100/599 (16.7%)
   ⏳ 進捗: 110/599 (18.4%)
   ⏳ 進捗: 120/599 (20.0%)
   ⏳ 進捗: 130/599 (21.7%)
   ⏳ 進捗: 140/599 (23.4%)
   ⏳ 進捗: 150/599 (25.0%)
   ⏳ 進捗: 160/599 (26.7%)
   ⏳ 進捗: 170/599 (28.4%)
   ⏳ 進捗: 180/599 (30.1%)
   ⏳ 進捗: 190/599 (31.7%)
   ⏳ 進捗: 200/599 (33.4%)
   ⏳ 進捗: 210/599 (35.1%)
   ⏳ 進捗: 220/599 (36.7%)
   ⏳ 進捗: 230/599 (38.4%)
   ⏳ 進捗: 240/599 (40.1%)
   ⏳ 進捗: 250/599 (41.7%)
   ⏳ 進捗: 260/599 (43.4%)
   ⏳ 進捗: 270/599 (45.1%)
   ⏳ 進捗: 280/599 (46.7%)
   ⏳ 進捗: 290/599 (48.4%)
   ⏳ 進捗: 300/599 (50.1%)
   ⏳ 進捗: 310/599 (51.8%)
   ⏳ 進捗: 320/599 (53.4%)
   ⏳ 進捗: 330/599 (55.1%)
   ⏳ 進捗: 340/599 (56.8%)
   ⏳ 進捗: 350/599 (58.4%)
   ⏳ 進捗: 360/599 (60.1%)
   ⏳ 進捗: 370/599 (61.8%)
   ⏳ 進捗: 380/599 (63.4%)
   ⏳ 進捗: 390/599 (65.1%)
   ⏳ 進捗: 400/599 (66.8%)
   ⏳ 進捗: 410/599 (68.4%)
   ⏳ 進捗: 420/599 (70.1%)
   ⏳ 進捗: 430/599 (71.8%)
   ⏳ 進捗: 440/599 (73.5%)
   ⏳ 進捗: 450/599 (75.1%)
   ⏳ 進捗: 460/599 (76.8%)
   ⏳ 進捗: 470/599 (78.5%)
   ⏳ 進捗: 480/599 (80.1%)
   ⏳ 進捗: 490/599 (81.8%)
   ⏳ 進捗: 500/599 (83.5%)
   ⏳ 進捗: 510/599 (85.1%)
   ⏳ 進捗: 520/599 (86.8%)
   ⏳ 進捗: 530/599 (88.5%)
   ⏳ 進捗: 540/599 (90.2%)
   ⏳ 進捗: 550/599 (91.8%)
   ⏳ 進捗: 560/599 (93.5%)
   ⏳ 進捗: 570/599 (95.2%)
   ⏳ 進捗: 580/599 (96.8%)
   ⏳ 進捗: 590/599 (98.5%)
   ⏳ 進捗: 599/599 (100.0%)
   ✅ 完了: 追加569件, 重複0件, エラー30件

[2/14] 
📦 処理中: [                                                              ]_10.zip
   📄 XML: note-karasu_toragara-10.xml
   📊 記事数: 17
   ⏳ 進捗: 10/17 (58.8%)
   ⏳ 進捗: 17/17 (100.0%)
   ✅ 完了: 追加17件, 重複0件, エラー0件

[3/14] 
📦 処理中: [                                                              ]_11.zip
   📄 XML: note-karasu_toragara-11.xml
   📊 記事数: 27
   ⏳ 進捗: 10/27 (37.0%)
   ⏳ 進捗: 20/27 (74.1%)
   ⏳ 進捗: 27/27 (100.0%)
   ✅ 完了: 追加27件, 重複0件, エラー0件

[4/14] 
📦 処理中: [                                                              ]_12.zip
   📄 XML: note-karasu_toragara-12.xml
   📊 記事数: 29
   ⏳ 進捗: 10/29 (34.5%)
   ⏳ 進捗: 20/29 (69.0%)
   ⏳ 進捗: 29/29 (100.0%)
   ✅ 完了: 追加29件, 重複0件, エラー0件

[5/14] 
📦 処理中: [                                                              ]_13.zip
   📄 XML: note-karasu_toragara-13.xml
   📊 記事数: 124
   ⏳ 進捗: 10/124 (8.1%)
   ⏳ 進捗: 20/124 (16.1%)
   ⏳ 進捗: 30/124 (24.2%)
   ⏳ 進捗: 40/124 (32.3%)
   ⏳ 進捗: 50/124 (40.3%)
   ⏳ 進捗: 60/124 (48.4%)
   ⏳ 進捗: 70/124 (56.5%)
   ⏳ 進捗: 80/124 (64.5%)
   ⏳ 進捗: 90/124 (72.6%)
   ⏳ 進捗: 100/124 (80.6%)
   ⏳ 進捗: 110/124 (88.7%)
   ⏳ 進捗: 120/124 (96.8%)
   ⏳ 進捗: 124/124 (100.0%)
   ✅ 完了: 追加124件, 重複0件, エラー0件

[6/14] 
📦 処理中: [                                                              ]_14.zip
   📄 XML: note-karasu_toragara-14.xml
   📊 記事数: 338
   ⏳ 進捗: 10/338 (3.0%)
   ⏳ 進捗: 20/338 (5.9%)
   ⏳ 進捗: 30/338 (8.9%)
   ⏳ 進捗: 40/338 (11.8%)
   ⏳ 進捗: 50/338 (14.8%)
   ⏳ 進捗: 60/338 (17.8%)
   ⏳ 進捗: 70/338 (20.7%)
   ⏳ 進捗: 80/338 (23.7%)
   ⏳ 進捗: 90/338 (26.6%)
   ⏳ 進捗: 100/338 (29.6%)
   ⏳ 進捗: 110/338 (32.5%)
   ⏳ 進捗: 120/338 (35.5%)
   ⏳ 進捗: 130/338 (38.5%)
   ⏳ 進捗: 140/338 (41.4%)
   ⏳ 進捗: 150/338 (44.4%)
   ⏳ 進捗: 160/338 (47.3%)
   ⏳ 進捗: 170/338 (50.3%)
   ⏳ 進捗: 180/338 (53.3%)
   ⏳ 進捗: 190/338 (56.2%)
   ⏳ 進捗: 200/338 (59.2%)
   ⏳ 進捗: 210/338 (62.1%)
   ⏳ 進捗: 220/338 (65.1%)
   ⏳ 進捗: 230/338 (68.0%)
   ⏳ 進捗: 240/338 (71.0%)
   ⏳ 進捗: 250/338 (74.0%)
   ⏳ 進捗: 260/338 (76.9%)
   ⏳ 進捗: 270/338 (79.9%)
   ⏳ 進捗: 280/338 (82.8%)
   ⏳ 進捗: 290/338 (85.8%)
   ⏳ 進捗: 300/338 (88.8%)
   ⏳ 進捗: 310/338 (91.7%)
   ⏳ 進捗: 320/338 (94.7%)
   ⏳ 進捗: 330/338 (97.6%)
   ⏳ 進捗: 338/338 (100.0%)
   ✅ 完了: 追加338件, 重複0件, エラー0件

[7/14] 
📦 処理中: [                                                              ]_2.zip
   📄 XML: note-karasu_toragara-2.xml
   📊 記事数: 716
   ⏳ 進捗: 10/716 (1.4%)
   ⏳ 進捗: 20/716 (2.8%)
   ⏳ 進捗: 30/716 (4.2%)
   ⏳ 進捗: 40/716 (5.6%)
   ⏳ 進捗: 50/716 (7.0%)
   ⏳ 進捗: 60/716 (8.4%)
   ⏳ 進捗: 70/716 (9.8%)
   ⏳ 進捗: 80/716 (11.2%)
   ⏳ 進捗: 90/716 (12.6%)
   ⏳ 進捗: 100/716 (14.0%)
   ⏳ 進捗: 110/716 (15.4%)
   ⏳ 進捗: 120/716 (16.8%)
   ⏳ 進捗: 130/716 (18.2%)
   ⏳ 進捗: 140/716 (19.6%)
   ⏳ 進捗: 150/716 (20.9%)
   ⏳ 進捗: 160/716 (22.3%)
   ⏳ 進捗: 170/716 (23.7%)
   ⏳ 進捗: 180/716 (25.1%)
   ⏳ 進捗: 190/716 (26.5%)
   ⏳ 進捗: 200/716 (27.9%)
   ⏳ 進捗: 210/716 (29.3%)
   ⏳ 進捗: 220/716 (30.7%)
   ⏳ 進捗: 230/716 (32.1%)
   ⏳ 進捗: 240/716 (33.5%)
   ⏳ 進捗: 250/716 (34.9%)
   ⏳ 進捗: 260/716 (36.3%)
   ⏳ 進捗: 270/716 (37.7%)
   ⏳ 進捗: 280/716 (39.1%)
   ⏳ 進捗: 290/716 (40.5%)
   ⏳ 進捗: 300/716 (41.9%)
   ⏳ 進捗: 310/716 (43.3%)
   ⏳ 進捗: 320/716 (44.7%)
   ⏳ 進捗: 330/716 (46.1%)
   ⏳ 進捗: 340/716 (47.5%)
   ⏳ 進捗: 350/716 (48.9%)
   ⏳ 進捗: 360/716 (50.3%)
   ⏳ 進捗: 370/716 (51.7%)
   ⏳ 進捗: 380/716 (53.1%)
   ⏳ 進捗: 390/716 (54.5%)
   ⏳ 進捗: 400/716 (55.9%)
   ⏳ 進捗: 410/716 (57.3%)
   ⏳ 進捗: 420/716 (58.7%)
   ⏳ 進捗: 430/716 (60.1%)
   ⏳ 進捗: 440/716 (61.5%)
   ⏳ 進捗: 450/716 (62.8%)
   ⏳ 進捗: 460/716 (64.2%)
   ⏳ 進捗: 470/716 (65.6%)
   ⏳ 進捗: 480/716 (67.0%)
   ⏳ 進捗: 490/716 (68.4%)
   ⏳ 進捗: 500/716 (69.8%)
   ⏳ 進捗: 510/716 (71.2%)
   ⏳ 進捗: 520/716 (72.6%)
   ⏳ 進捗: 530/716 (74.0%)
   ⏳ 進捗: 540/716 (75.4%)
   ⏳ 進捗: 550/716 (76.8%)
   ⏳ 進捗: 560/716 (78.2%)
   ⏳ 進捗: 570/716 (79.6%)
   ⏳ 進捗: 580/716 (81.0%)
   ⏳ 進捗: 590/716 (82.4%)
   ⏳ 進捗: 600/716 (83.8%)
   ⏳ 進捗: 610/716 (85.2%)
   ⏳ 進捗: 620/716 (86.6%)
   ⏳ 進捗: 630/716 (88.0%)
   ⏳ 進捗: 640/716 (89.4%)
   ⏳ 進捗: 650/716 (90.8%)
   ⏳ 進捗: 660/716 (92.2%)
   ⏳ 進捗: 670/716 (93.6%)
   ⏳ 進捗: 680/716 (95.0%)
   ⏳ 進捗: 690/716 (96.4%)
   ⏳ 進捗: 700/716 (97.8%)
   ⏳ 進捗: 710/716 (99.2%)
   ⏳ 進捗: 716/716 (100.0%)
   ✅ 完了: 追加716件, 重複0件, エラー0件

[8/14] 
📦 処理中: [                                                              ]_3.zip
   📄 XML: note-karasu_toragara-3.xml
   📊 記事数: 140
   ⏳ 進捗: 10/140 (7.1%)
   ⏳ 進捗: 20/140 (14.3%)
   ⏳ 進捗: 30/140 (21.4%)
   ⏳ 進捗: 40/140 (28.6%)
   ⏳ 進捗: 50/140 (35.7%)
   ⏳ 進捗: 60/140 (42.9%)
   ⏳ 進捗: 70/140 (50.0%)
   ⏳ 進捗: 80/140 (57.1%)
   ⏳ 進捗: 90/140 (64.3%)
   ⏳ 進捗: 100/140 (71.4%)
   ⏳ 進捗: 110/140 (78.6%)
   ⏳ 進捗: 120/140 (85.7%)
   ⏳ 進捗: 130/140 (92.9%)
   ⏳ 進捗: 140/140 (100.0%)
   ✅ 完了: 追加140件, 重複0件, エラー0件

[9/14] 
📦 処理中: [                                                              ]_4.zip
   📄 XML: note-karasu_toragara-4.xml
   📊 記事数: 88
   ⏳ 進捗: 10/88 (11.4%)
   ⏳ 進捗: 20/88 (22.7%)
   ⏳ 進捗: 30/88 (34.1%)
   ⏳ 進捗: 40/88 (45.5%)
   ⏳ 進捗: 50/88 (56.8%)
   ⏳ 進捗: 60/88 (68.2%)
   ⏳ 進捗: 70/88 (79.5%)
   ⏳ 進捗: 80/88 (90.9%)
   ⏳ 進捗: 88/88 (100.0%)
   ✅ 完了: 追加88件, 重複0件, エラー0件

[10/14] 
📦 処理中: [                                                              ]_5.zip
   📄 XML: note-karasu_toragara-5.xml
   📊 記事数: 751
   ⏳ 進捗: 10/751 (1.3%)
   ⏳ 進捗: 20/751 (2.7%)
   ⏳ 進捗: 30/751 (4.0%)
   ⏳ 進捗: 40/751 (5.3%)
   ⏳ 進捗: 50/751 (6.7%)
   ⏳ 進捗: 60/751 (8.0%)
   ⏳ 進捗: 70/751 (9.3%)
   ⏳ 進捗: 80/751 (10.7%)
   ⏳ 進捗: 90/751 (12.0%)
   ⏳ 進捗: 100/751 (13.3%)
   ⏳ 進捗: 110/751 (14.6%)
   ⏳ 進捗: 120/751 (16.0%)
   ⏳ 進捗: 130/751 (17.3%)
   ⏳ 進捗: 140/751 (18.6%)
   ⏳ 進捗: 150/751 (20.0%)
   ⏳ 進捗: 160/751 (21.3%)
   ⏳ 進捗: 170/751 (22.6%)
   ⏳ 進捗: 180/751 (24.0%)
   ⏳ 進捗: 190/751 (25.3%)
   ⏳ 進捗: 200/751 (26.6%)
   ⏳ 進捗: 210/751 (28.0%)
   ⏳ 進捗: 220/751 (29.3%)
   ⏳ 進捗: 230/751 (30.6%)
   ⏳ 進捗: 240/751 (32.0%)
   ⏳ 進捗: 250/751 (33.3%)
   ⏳ 進捗: 260/751 (34.6%)
   ⏳ 進捗: 270/751 (36.0%)
   ⏳ 進捗: 280/751 (37.3%)
   ⏳ 進捗: 290/751 (38.6%)
   ⏳ 進捗: 300/751 (39.9%)
   ⏳ 進捗: 310/751 (41.3%)
   ⏳ 進捗: 320/751 (42.6%)
   ⏳ 進捗: 330/751 (43.9%)
   ⏳ 進捗: 340/751 (45.3%)
   ⏳ 進捗: 350/751 (46.6%)
   ⏳ 進捗: 360/751 (47.9%)
   ⏳ 進捗: 370/751 (49.3%)
   ⏳ 進捗: 380/751 (50.6%)
   ⏳ 進捗: 390/751 (51.9%)
   ⏳ 進捗: 400/751 (53.3%)
   ⏳ 進捗: 410/751 (54.6%)
   ⏳ 進捗: 420/751 (55.9%)
   ⏳ 進捗: 430/751 (57.3%)
   ⏳ 進捗: 440/751 (58.6%)
   ⏳ 進捗: 450/751 (59.9%)
   ⏳ 進捗: 460/751 (61.3%)
   ⏳ 進捗: 470/751 (62.6%)
   ⏳ 進捗: 480/751 (63.9%)
   ⏳ 進捗: 490/751 (65.2%)
   ⏳ 進捗: 500/751 (66.6%)
   ⏳ 進捗: 510/751 (67.9%)
   ⏳ 進捗: 520/751 (69.2%)
   ⏳ 進捗: 530/751 (70.6%)
   ⏳ 進捗: 540/751 (71.9%)
   ⏳ 進捗: 550/751 (73.2%)
   ⏳ 進捗: 560/751 (74.6%)
   ⏳ 進捗: 570/751 (75.9%)
   ⏳ 進捗: 580/751 (77.2%)
   ⏳ 進捗: 590/751 (78.6%)
   ⏳ 進捗: 600/751 (79.9%)
   ⏳ 進捗: 610/751 (81.2%)
   ⏳ 進捗: 620/751 (82.6%)
   ⏳ 進捗: 630/751 (83.9%)
   ⏳ 進捗: 640/751 (85.2%)
   ⏳ 進捗: 650/751 (86.6%)
   ⏳ 進捗: 660/751 (87.9%)
   ⏳ 進捗: 670/751 (89.2%)
   ⏳ 進捗: 680/751 (90.5%)
   ⏳ 進捗: 690/751 (91.9%)
   ⏳ 進捗: 700/751 (93.2%)
   ⏳ 進捗: 710/751 (94.5%)
   ⏳ 進捗: 720/751 (95.9%)
   ⏳ 進捗: 730/751 (97.2%)
   ⏳ 進捗: 740/751 (98.5%)
   ⏳ 進捗: 750/751 (99.9%)
   ⏳ 進捗: 751/751 (100.0%)
   ✅ 完了: 追加751件, 重複0件, エラー0件

[11/14] 
📦 処理中: [                                                              ]_6.zip
   📄 XML: note-karasu_toragara-6.xml
   📊 記事数: 290
   ⏳ 進捗: 10/290 (3.4%)
   ⏳ 進捗: 20/290 (6.9%)
   ⏳ 進捗: 30/290 (10.3%)
   ⏳ 進捗: 40/290 (13.8%)
   ⏳ 進捗: 50/290 (17.2%)
   ⏳ 進捗: 60/290 (20.7%)
   ⏳ 進捗: 70/290 (24.1%)
   ⏳ 進捗: 80/290 (27.6%)
   ⏳ 進捗: 90/290 (31.0%)
   ⏳ 進捗: 100/290 (34.5%)
   ⏳ 進捗: 110/290 (37.9%)
   ⏳ 進捗: 120/290 (41.4%)
   ⏳ 進捗: 130/290 (44.8%)
   ⏳ 進捗: 140/290 (48.3%)
   ⏳ 進捗: 150/290 (51.7%)
   ⏳ 進捗: 160/290 (55.2%)
   ⏳ 進捗: 170/290 (58.6%)
   ⏳ 進捗: 180/290 (62.1%)
   ⏳ 進捗: 190/290 (65.5%)
   ⏳ 進捗: 200/290 (69.0%)
   ⏳ 進捗: 210/290 (72.4%)
   ⏳ 進捗: 220/290 (75.9%)
   ⏳ 進捗: 230/290 (79.3%)
   ⏳ 進捗: 240/290 (82.8%)
   ⏳ 進捗: 250/290 (86.2%)
   ⏳ 進捗: 260/290 (89.7%)
   ⏳ 進捗: 270/290 (93.1%)
   ⏳ 進捗: 280/290 (96.6%)
   ⏳ 進捗: 290/290 (100.0%)
   ✅ 完了: 追加290件, 重複0件, エラー0件

[12/14] 
📦 処理中: [                                                              ]_7.zip
   📄 XML: note-karasu_toragara-7.xml
   📊 記事数: 10
   ⏳ 進捗: 10/10 (100.0%)
   ✅ 完了: 追加10件, 重複0件, エラー0件

[13/14] 
📦 処理中: [                                                              ]_8.zip
   📄 XML: note-karasu_toragara-8.xml
   📊 記事数: 40
   ⏳ 進捗: 10/40 (25.0%)
   ⏳ 進捗: 20/40 (50.0%)
   ⏳ 進捗: 30/40 (75.0%)
   ⏳ 進捗: 40/40 (100.0%)
   ✅ 完了: 追加40件, 重複0件, エラー0件

[14/14] 
📦 処理中: [                                                              ]_9.zip
   📄 XML: note-karasu_toragara-9.xml
   📊 記事数: 9
   ⏳ 進捗: 9/9 (100.0%)
   ✅ 完了: 追加9件, 重複0件, エラー0件

🎉 全処理完了!
⏱️  処理時間: 0.8秒
📝 総処理記事数: 3,148件

📊 処理結果統計
==================================================
総記事数: 3,148件
未公開: 620件 (19.7%)
公開済み: 2,528件 (80.3%)

zipファイル別:
  [                                                              ]_1.zip: 569件
  [                                                              ]_10.zip: 17件
  [                                                              ]_11.zip: 27件
  [                                                              ]_12.zip: 29件
  [                                                              ]_13.zip: 124件
  [                                                              ]_14.zip: 338件
  [                                                              ]_2.zip: 716件
  [                                                              ]_3.zip: 140件
  [                                                              ]_4.zip: 88件
  [                                                              ]_5.zip: 751件
  [                                                              ]_6.zip: 290件
  [                                                              ]_7.zip: 10件
  [                                                              ]_8.zip: 40件
  [                                                              ]_9.zip: 9件

投稿期間: 2020-04-14 ~ 2025-08-10

年別記事数:
  2020年: 153件
  2021年: 497件
  2023年: 482件
  2024年: 1,597件
  2025年: 419件

💾 データベースファイル: note_articles.db
   SQLiteクライアント、Pythonなどで自由にクエリ実行可能
$ sqlite3 note_articles.db
SQLite version 3.45.1 2024-01-30 16:01:20
Enter ".help" for usage hints.
sqlite> .schema
CREATE TABLE articles (
            id INTEGER PRIMARY KEY AUTOINCREMENT,
            note_id TEXT UNIQUE NOT NULL,
            title TEXT NOT NULL,
            content TEXT,
            article_url TEXT,
            post_date DATETIME NOT NULL,
            is_published BOOLEAN NOT NULL,
            source_zip TEXT NOT NULL,
            created_at DATETIME DEFAULT CURRENT_TIMESTAMP
        );
CREATE TABLE sqlite_sequence(name,seq);
CREATE INDEX idx_post_date ON articles (post_date);
CREATE INDEX idx_is_published ON articles (is_published);
CREATE INDEX idx_source_zip ON articles (source_zip);
sqlite> .quit
$ 

SQLiteからの出力サンプル

note-zip-2-sqlite.pyスクリプト

ライセンス

MITライセンス


最後までお読み下さりありがとうございます。
どうぞご利用下さい。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?