0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

日本語(4)機械学習で手書き漢字をどれくらい読み取れるか

Last updated at Posted at 2019-01-30

かなづかいについて勉強中。

51+d9yO2GjL.SX350_BO1,204,203,200.jpg
NHK俳句-俳句づくりに役立つ!-旧かな入門-NHK俳句-山西-雅子
https://www.amazon.co.jp//dp/4140162643/

参考文献。

和字正濫鈔 契沖 1739[元文4]年刊 日本語史研究資料 [国立国語研究所蔵]
https://dglb01.ninjal.ac.jp/ninjaldl/bunken.php?title=wajisyoransyo

字音仮字用格 本居宣長 1799[寛政11]年刊 日本語史研究資料 [国立国語研究所蔵]
https://dglb01.ninjal.ac.jp/ninjaldl/bunken.php?title=zionkana

手書き漢字認識

どちらのPDFも、手書き文字のままである。

これらの資料を、
文字鏡研究会配布版の文字鏡フォント最終版(Mojikyo Character MAP ver. 4.00付き
https://archive.org/details/MojikyoCmap400ALL49TTF.7z

を利用して、機械学習により電子ファイルに変換することを検討中である。

課題としては、まず、裏の写っている文字を消す。
レ点などを消す(後で別に電子化)
漢字認識

という三段階を経るのがよさそう。

応用研究

契沖が、仮名遣いについて検討した内容を、多くの古典文献を電子化してゆくことによって、機械学習で過去の学説の確率論的検証と妥当性確認ができるかもしれない。

協力者緩募

大学の卒業研究、大学院の修論、博論にされる方、当方が無償協力します。

p.s.

文字鏡フォントの作成過程において、諸橋轍次編『大漢和辞典』の文字の重複などの指摘をしている。

日本語文学研究において、社会科学的な方法により、正しいとか誤りとかという議論ではなく、
どれくらいの確率で妥当だという科学的議論が電子化によりできるようになるかもしれない。

参考資料(reference)

現代仮名遣い
http://www.mext.go.jp/b_menu/hakusho/nc/k19860701001/k19860701001.html

諸橋大漢和
https://www.taishukan.co.jp/daikanwa_digital/

平成 22 年度 コンテンツ配信型・ハイブリッドビジネスモデル実証事業 (デジタル・ネットワーク社会における出版物の 利活用推進のための外字・異体字利用環境整備調査) 報告書 平成 23 年 3 月 凸版印刷株式会社
http://www.meti.go.jp/meti_lib/report/2011fy/E001484.pdf

ポスト文字コード時代の文書処理技術に関する展望 守岡 知彦
http://www.chise.org/papers/dc2002.pdf

64bitCPUへの道 and/or 64歳の決意(0):101件
https://qiita.com/kaizen_nagoya/items/cfb5ffa24ded23ab3f60

連休中の記事数は目標達成した。質向上のために集計。平均が無意味なことを再確認:57件
https://qiita.com/kaizen_nagoya/items/138c543c5e74e380d31d

「量子アニーリングの基礎」への記事一覧<作成中> 27件
https://qiita.com/kaizen_nagoya/items/2f9b56d7dea41e3f18dd

無線網(Wi-Fi)空中線(antenna)(0) 記事一覧(118/300目標)
https://qiita.com/kaizen_nagoya/items/5e5464ac2b24bd4cd001

仮説(0)一覧(目標100現在40)
https://qiita.com/kaizen_nagoya/items/f000506fe1837b3590df

安全(0)安全工学シンポジウムに向けて: 21
https://qiita.com/kaizen_nagoya/items/c5d78f3def8195cb2409

Qiita(0)Qiita関連記事一覧(自分)
https://qiita.com/kaizen_nagoya/items/58db5fbf036b28e9dfa6

鉄道(0)鉄道のシステム考察はてっちゃんがてつだってくれる
https://qiita.com/kaizen_nagoya/items/26bda595f341a27901a0

日本語(0)一欄
https://qiita.com/kaizen_nagoya/items/7498dcfa3a9ba7fd1e68

英語(0) 一覧
https://qiita.com/kaizen_nagoya/items/680e3f5cbf9430486c7d

転職(0)一覧
https://qiita.com/kaizen_nagoya/items/f77520d378d33451d6fe

Ethernet 記事一覧 Ethernet(0)
https://qiita.com/kaizen_nagoya/items/88d35e99f74aefc98794

数学関連記事100 
https://qiita.com/kaizen_nagoya/items/d8dadb49a6397e854c6d

物理記事 上位100
https://qiita.com/kaizen_nagoya/items/66e90fe31fbe3facc6ff

自動車 記事 100
https://qiita.com/kaizen_nagoya/items/f7f0b9ab36569ad409c5

言語・文学記事 100
https://qiita.com/kaizen_nagoya/items/42d58d5ef7fb53c407d6

医工連携関連記事 100
https://qiita.com/kaizen_nagoya/items/6ab51c12ba51bc260a82

通信記事100
https://qiita.com/kaizen_nagoya/items/1d67de5e1cd207b05ef7

OSEK OS設計の基礎 OSEK(100)
https://qiita.com/kaizen_nagoya/items/7528a22a14242d2d58a3

views 20,000越え自己記事一覧
https://qiita.com/kaizen_nagoya/items/58e8bd6450957cdecd81

Views1万越え、もうすぐ1万記事一覧 最近いいねをいただいた216記事
https://qiita.com/kaizen_nagoya/items/d2b805717a92459ce853

2023 Countdown Calendar 主催・参加一覧
https://qiita.com/kaizen_nagoya/items/c4c2f08ac97f38d08543

一覧:携帯計画者日記(0)
https://qiita.com/kaizen_nagoya/items/005d38c6f55c85570e74

文書履歴(document history)

ver. 0.01 初稿 20190130
ver. 0.02 旧かな入門追記 20190131 午前
ver. 0.03 みだし整理 20190131 午後
ver. 0.04 協力者緩募 20190131 夕

最後までおよみいただきありがとうございました。

いいね 💚、フォローをお願いします。

Thank you very much for reading to the last sentence.

Please press the like icon 💚 and follow me for your happy life.

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?