事の起こり
先日ネットサーフィンをしていた所、偶然以下のX(旧Twitter)への投稿を見掛けました。
国立国会図書館が、高精度OCRアプリケーションであるNDLOCR-Liteを公開したことを告知する投稿でした。しかも、GitHub上にOSSとして公開されており、Macでも利用可能な様です。
使い方マニュアルが公開されています。しかし、そこは多数派のWindowsでの使い方マニュアルでした。そこで、Mac対応版をダウンロードしてインストールして、実際に利用出来るかの検証すれば、検証ネタで記事投稿が出来ると算段しました。
今回はまずは導入編。Macにインストールして起動するか試してみます。
NDLOCR-Liteとは
NDL(Natinal Diet Library: 国立国会図書館)が公開している高精度OCRアプリケーションの様です。実際にマニュアルでは実行例として芥川龍之介の蜘蛛の糸でOCRの検証を行っています。無料で利用でき、GitHub上でソースコードも公開されています。加えて、非常に軽量かつ高速に動作し、ラップトップ(ノートパソコン)のCPUでも動作するとのことです。アプリケーションはPythonで実装されている様です。
Macにインストール
実際にMacにインストールしてNDLOCR-Liteを導入してみます。
環境情報
実際にMacにインストールしてみます。今回の検証では以下の環境を用います。
- MacBook Pro 14inch(2021)
- OS: macOS 26.3 Tahoe
- CPU: Apple M1 Pro
- DRAM: 16GB
インストーラーのダウンロード
GitHubのReleasesからインストーラーをダウンロードします。筆者の環境はApple SiliconのCPUなので対応するバージョンをダウンロードしました。Intel CPU(x86)を搭載したMacを利用されている方は、対応バージョンをダウンロードして下さい。どうやらUniversal Binaryにはなっていない様です。
圧縮ファイルの解凍
ダウンロードした「ndlocr_lite_v1.1.0_macos_apple_silicon.tar.gz」をダブルクリックします。すると「macos」というディレクトリが展開されます。展開されたディレクトリをダブルクリックして開きます。
インストール
macosディレクトリ内に「ndlocr-lite-gui.app」というファイルが格納されています。そのファイルをドラッグ&ドロップでアプリケーションディレクトに格納します。
NDLOCR-Liteを起動
NDLOCR-Liteを起動します。macOSのセキュリティ機能が署名を検証出来ないという警告メッセージを出します。ここで、条件反射で「ゴミ箱に入れる」をクリックしてはいけません。「完了」をクリックします。
システム設定を起動し、プライバシーとセキュリティを選択します。ndlocr-lite-gui.appがブロックされている旨が表示されます。このまま開くをクリックします。
更に警告が表示されます。このまま開くをクリックします。
Touch IDまたはパスワードを入力します。
無事起動!!と喜んだのも束の間。。。以下のエラーとなりました。
![]()
原因はウイルスバスターがDocumentsディレクトリへの変更を不正な操作と検知して停止してしまっていることが原因でした。例外設定を実施すると無事起動しました!
さて、お次はOCR性能の検証、実行時間の測定と言いたいところですが、手持ちの丁度良い原稿が無いのでOCR性能の検証や実行時間の測定は次回の記事で投稿しようと思います。
まとめ
国立国会図書館がOSSで公開しているNDLOCR-LiteのGUIアプリケーション版をMacにインストールしてみました。最後の仕上げの段階でウイルスバスターに一度は起動を阻まれましたが、それ以外は特に大きなトラブルもなく、インストールが出来ました。次回の記事では実際にOCRの性能や現実的な時間で実行出来るのか?軽快に動作するか?などを検証したいと思います。推奨のMacの環境がM4となっていましたが、M1 Proでも動作する事を願いつつ、筆を置こうと思います。








