意外と知られていない「Googleドライブ」OCR機能で文字起こし検証→かなり使えそうでしたのでご紹介
https://webkikaku.co.jp/blog/webservices/googledrive-ocr/
を拝見し、
計算物理学
https://qiita.com/kaizen_nagoya/items/af924f5ac71ff5cc8c89
の英語のBibliograpy一覧のURLなどを確認するためOCRを利用しようとした。
機材
macOS 10.12.6, メモリ 16GB
#PDFでは駄目
PDFファイルをUPすると、アプリで開くでは「Googleドキュメント」は出なかった。
PDFの制限による。
PNGでは駄目
Bibliographyの10ページをそれぞれpngファイルを作成した。
pngファイルは、アプリで開くでは「Googleドキュメント」は出なかった。
PDF出力保存
プレビューでpngファイルを書き出すでpdfファイルとして保存した。
駄目だった。アプリで開くでは「Googleドキュメント」は出なかった。
#PDFとして書き出す。
プレビューでファイルを「PDFとして書き出す」を選んでgoogle driveに保存すると、
アプリで開くで「Googleドキュメント」が出た。
出力例
1頁目
[Abar 93] ABARBANEL, H. D. I., M. I. RABINOVICH, AND M. M. SUSHCHIK (1993),
Introduction to Nonlinear Dynamics for Physicists, World Scientific, Singapore. 283
[A&S 72] ABRAMOWITZ, M., AND I. A. STEGUN (1972), Handbook of Mathematical
Functions, 10th Ed. U.S. Govt. Printing Office, Washington. 122 [Add 02] ADDISON, P. S. (2002). The Illustrated Wavelet Transform Handbook, Institute of
Physics Publishing, Bristol and Philadelphia. 239, 244, 247 [ALCMD] MORRIS, J., D. TURNER, AND K.-M. HO AL_CMD, Ames Laboratory Classi
cal Molecular Dynamics. http://codeblue. umich.edu/hoomd-blue/.
[A&T 87] ALLAN, M. P. AND J. P. TILDESLEY (1987), Computer Simulations of Liquids,
Oxford Science Publications, Oxford, UK. 374
[Amd 67] AMDAHL, G., Validity of the Single-Processor Approach to Achieving Large-Scale
Computing Capabilities, Proc. AFIPS., 483 (1967). 374
L
1
[Anc 02] ANCONA, M. G. (2002), Computational Methods for Applied Science & Engineer
ing, Rinton Press, Princeton, NJ. 323
[A&W 01] ARFKEN, G. B.. AND H. J. WEBER (2001). Mathematical Methods for Physi
cists, Harcourt/Academic Press, San Diego. 410
[Argy 91] ARGYRIS, J., M. HAASE, AND J. C. HEINRICH (1991), Comput. Meth. Appl.
Mech. Eng., 86. 1. 240, 386 [Arm 91] ARMIN, B., AND H. SHLOMO, EDS. (1991), Fractals and Disordered Systems,
Springer-Verlag, Berlin. [Ask 77] ASKAR, A., AND A. S. CAKMAK (1977), J. Chem. Phys. 68, 2794. 290 [Bai 05] BAILEY, M. OSU Chroma Depth Scientific Visualization Gallery,
web.engr.oregonstate.edu/"mjb/chromadepth/. 430, 433 [Bana 99] BANACLOCHE, J. G., (1999), A Quantum Bouncing Ball, Am. J. Phys. 67, 776
782. 65 [Bars 93] BARNSLEY, M. E. AND L. P. HURD, (1993), Fractal Image Compression, A. K.
Peters, UK. 370 [Becker 54] BECKER, R. A., (1954), Introduction to Theoretical Mechanics, McGraw-Hill,
New York. 294, 305 [Berry] BERRYMAN, A. A., Predator-Prey Dynamics, classes.entom.wsu.edu/543/. 427
校正
- 改行していない。
- 不必要な改行が入ってる。
- URLに間に空白が入ってる。
- 塵?
1頁目では「L 1」という文字がそれぞれ1行づつで入ってた。理由不明。
3頁目では「HIN」という文字の行が入っていた。理由不明。
5頁目では「F」という文字の行が入っていた。理由不明。
8頁目では「IN」という文字が最終行に入っていた。理由不明。 - urlで文字としてhttp://が省略されていてURLにならない。
6)文字化け
~が"に文字化け。(URLだったので気がついた)
[が(に文字化け。
[jが[に文字化け。jが消えた。
] が)に文字化け。
] が 1に文字化け。
jが)に文字化け。
-が空白に文字化け。
上記を手作業で訂正した。ここには1頁目だけ。全体は計算物理学の記事で。
校正後 1頁目
[Abar 93] ABARBANEL, H. D. I., M. I. RABINOVICH, AND M. M. SUSHCHIK (1993), Introduction to Nonlinear Dynamics for Physicists, World Scientific, Singapore. 283
[A&S 72] ABRAMOWITZ, M., AND I. A. STEGUN (1972), Handbook of Mathematical Functions, 10th Ed. U.S. Govt. Printing Office, Washington. 122
[Add 02] ADDISON, P. S. (2002). The Illustrated Wavelet Transform Handbook, Institute of Physics Publishing, Bristol and Philadelphia. 239, 244, 247
[ALCMD] MORRIS, J., D. TURNER, AND K.-M. HO AL_CMD, Ames Laboratory Classical Molecular Dynamics. http://codeblue.umich.edu/hoomd-blue/.
[A&T 87] ALLAN, M. P. AND J. P. TILDESLEY (1987), Computer Simulations of Liquids, Oxford Science Publications, Oxford, UK. 374
[Amd 67] AMDAHL, G., Validity of the Single-Processor Approach to Achieving Large-Scale Computing Capabilities, Proc. AFIPS., 483 (1967). 374
[Anc 02] ANCONA, M. G. (2002), Computational Methods for Applied Science & Engineer ing, Rinton Press, Princeton, NJ. 323
[A&W 01] ARFKEN, G. B.. AND H. J. WEBER (2001). Mathematical Methods for Physicists, Harcourt/Academic Press, San Diego. 410
[Argy 91] ARGYRIS, J., M. HAASE, AND J. C. HEINRICH (1991), Comput. Meth. Appl. Mech. Eng., 86. 1. 240, 386
[Arm 91] ARMIN, B., AND H. SHLOMO, EDS. (1991), Fractals and Disordered Systems, Springer-Verlag, Berlin.
[Ask 77] ASKAR, A., AND A. S. CAKMAK (1977), J. Chem. Phys. 68, 2794. 290
[Bai 05] BAILEY, M. OSU Chroma Depth Scientific Visualization Gallery,
http://web.engr.oregonstate.edu/~mjb/chromadepth/. 430, 433
[Bana 99] BANACLOCHE, J. G., (1999), A Quantum Bouncing Ball, Am. J. Phys. 67, 776 782. 65
[Bars 93] BARNSLEY, M. E. AND L. P. HURD, (1993), Fractal Image Compression, A. K. Peters, UK. 370
[Becker 54] BECKER, R. A., (1954), Introduction to Theoretical Mechanics, McGraw-Hill, New York. 294, 305
[Berry] BERRYMAN, A. A., Predator-Prey Dynamics, http://classes.entom.wsu.edu/543/. 427
日本語ファイル
日本語ファイル
https://support.google.com/drive/answer/176692?co=GENIE.Platform%3DDesktop&hl=ja&oco=1
ファイルを準備する
次のヒントを参考にするとファイルを最適な状態で準備できます。
形式: .JPEG、.PNG、GIF、PDF(複数ページのドキュメント)の各ファイル。
ファイルサイズ: ファイルは 2 MB 以下にします。
解像度: テキストの高さは 10 ピクセル以上にします。
向き: ドキュメントは正しい向きにします。画像の向きが間違っている場合は、回転させてから Google ドライブにアップロードします。
言語: Google ドライブではドキュメントの言語は検出されません。
フォントと文字セット: 最適な結果を得るには、Arial や Times New Roman のような一般的なフォントを使用します。
画質: 明るさが均一でコントラストがはっきりしたシャープな画像が最適です。
画像ファイルを変換する
パソコンで drive.google.com を開きます。
目的のファイルを右クリックします。
[アプリで開く] 次に [Google ドキュメント] をクリックします。
画像ファイルは Google ドキュメントに変換されますが、形式によっては移行できないこともあります。
太字、斜体、フォントサイズ、フォントタイプ、改行は通常保持されます。
リスト、表、列、脚注、巻末の注などは、検出されない可能性があります。
ファイル
文字
T皇室
しのぶかな をさなくて見し世の春をおもふかなふるき都の花のさかり に *
30
62086207
いそのかみふりしみやこの花かげにあそびし春を思ひいでつつ
四〇
をち かた
酬 遠方の山にむかひてふるさとのみやこのけしきおもひうかべぬ
OE
海路
白波のかへる波ぢのふねの上にいつかみゆらむふるさとの山
四〇
ふるさとのみなとにふねの入りし日は家にかへりしここちこそすれ四o
故郷
編 おもひいづることのみおほきふるさとにのこれる人はまれになりにき四O
...
.
.
.
.
編 さまざまの昔がたりをきくたびにおもひいづるはふるさとにして
OF
T春秋の花にもみぢにこひしきは昔すみにしみやこなりけり *
四〇
林さかえながらにふるさとは 風のひびきぞさびしかりける
四O
ふるさとの道にかかればむちうたぬ駒のあゆみもはやくなりけり
四〇
6651_6650
古池の水さへかれてをしどりをかひならしたるあととしもなし
OF
6652
おひたちしさとのかきねの松みればかげにあそびし昔をぞおもふ
四〇
6653
ふるさとの松は昔にかはらねど庭もる人は老いにけるかな
四〇
古井
の蛙すむところとなりてふるさとのか どの岩井の水さびにけり
90
龜
ふるさとの池にうかべるみどりがめ昔はなちしそれかあらぬか四o
六、古 京セ
関連資料(related materials)
参考文献一覧作成 ファイルの存在とPDFからの変換
https://qiita.com/kaizen_nagoya/items/8edaf4ca410ef2ccdbc7
無料オンラインOCRサービス
https://www.onlineocr.net/ja/
OCR WEB
https://lightpdf.com/jp/ocr
i2ocr
http://www.i2ocr.com/free-online-english-ocr
Self Reference
無線網(Wi-Fi)空中線(antenna)(0) 記事一覧(118/300目標)
https://qiita.com/kaizen_nagoya/items/5e5464ac2b24bd4cd001
Ethernet 記事一覧 Ethernet(0)
https://qiita.com/kaizen_nagoya/items/88d35e99f74aefc98794
Wireshark 一覧 wireshark(0)、Ethernet(48) https://qiita.com/kaizen_nagoya/items/fbed841f61875c4731d0
仮説(0)一覧(目標100現在40)
https://qiita.com/kaizen_nagoya/items/f000506fe1837b3590df
安全(0)安全工学シンポジウムに向けて: 21
https://qiita.com/kaizen_nagoya/items/c5d78f3def8195cb2409
Qiita(0)Qiita関連記事一覧(自分)
https://qiita.com/kaizen_nagoya/items/58db5fbf036b28e9dfa6
鉄道(0)鉄道のシステム考察はてっちゃんがてつだってくれる
https://qiita.com/kaizen_nagoya/items/26bda595f341a27901a0
日本語(0)一欄
https://qiita.com/kaizen_nagoya/items/7498dcfa3a9ba7fd1e68
英語(0) 一覧
https://qiita.com/kaizen_nagoya/items/680e3f5cbf9430486c7d
転職(0)一覧
https://qiita.com/kaizen_nagoya/items/f77520d378d33451d6fe
数学関連記事100
https://qiita.com/kaizen_nagoya/items/d8dadb49a6397e854c6d
物理記事 上位100
https://qiita.com/kaizen_nagoya/items/66e90fe31fbe3facc6ff
自動車 記事 100
https://qiita.com/kaizen_nagoya/items/f7f0b9ab36569ad409c5
言語・文学記事 100
https://qiita.com/kaizen_nagoya/items/42d58d5ef7fb53c407d6
医工連携関連記事 100
https://qiita.com/kaizen_nagoya/items/6ab51c12ba51bc260a82
通信記事100
https://qiita.com/kaizen_nagoya/items/1d67de5e1cd207b05ef7
OSEK OS設計の基礎 OSEK(100)
https://qiita.com/kaizen_nagoya/items/7528a22a14242d2d58a3
一覧:携帯計画者日記(0)
https://qiita.com/kaizen_nagoya/items/005d38c6f55c85570e74
AUTOSAR R22-11 Qiita記事一覧 20230421(1)
https://qiita.com/kaizen_nagoya/items/81a35774f1aa3d64d3f6
ボッシュ自動車handbook(英語)11版(0) 課題と記事一覧
https://qiita.com/kaizen_nagoya/items/dfa35aa6f669e5df983e
R3(0) on "What are the most important statistical ideas of the past 50 years? " Andrew Gelman, Aki Vehtari
https://qiita.com/kaizen_nagoya/items/a8eac9afbf16d2188901
官公庁・学校・公的団体(NPOを含む)システムの課題、官(0)
https://qiita.com/kaizen_nagoya/items/04ee6eaf7ec13d3af4c3
一覧の一覧( The directory of directories of mine.) Qiita(100)
https://qiita.com/kaizen_nagoya/items/7eb0e006543886138f39
プログラマが知っていると良い「公序良俗」
https://qiita.com/kaizen_nagoya/items/9fe7c0dfac2fbd77a945
LaTeX(0) 一覧
https://qiita.com/kaizen_nagoya/items/e3f7dafacab58c499792
自動制御、制御工学一覧(0)
https://qiita.com/kaizen_nagoya/items/7767a4e19a6ae1479e6b
Rust(0) 一覧
https://qiita.com/kaizen_nagoya/items/5e8bb080ba6ca0281927
小川清最終講義、最終講義(再)計画, Ethernet(100) 英語(100) 安全(100)
https://qiita.com/kaizen_nagoya/items/e2df642e3951e35e6a53
<この記事は個人の過去の経験に基づく個人の感想です。現在所属する組織、業務とは関係がありません。>
This article is an individual impression based on the individual's experience. It has nothing to do with the organization or business to which I currently belong.
文書履歴(document history)
ver. 0.01 初稿 20190807
ver. 0.02 英語、機材等補足 20190808
ver. 0.03 日本語 20200224
ver. 0.04 他のサービス追記 20211031
最後までおよみいただきありがとうございました。
いいね 💚、フォローをお願いします。
Thank you very much for reading to the last sentence.
Please press the like icon 💚 and follow me for your happy life.