どうも@scrpgilです
AAが好きでAAをエンジニアリングしたいAAエンジニアです。
もう2018年が終わりそうですね。私は2019年にはAAを機械学習を使って分類したいという目標があるのですが、アスキーアート関連の論文をほとんど読んだことないです。
そこで、本記事はGoogle ScholarやCinii、Google検索でアスキーアート関連の論文を探してみたのでいくつか紹介したいと思います。
アスキーアート自動抽出法の提案(2010)
KDDO研究所による電子掲示板などテキストとアスキーアートの両方が含まれている文章からアスキーアートを抽出する研究。
行ごとにAAが含まれるか検出する→AAが含まれる行はその前後もAAである可能性が高い。という特徴から文章中からAAを抽出する技法とのこと。実験結果は抽出率97〜98%ほどと高い。
リンク(PDFあり)
アスキーアート分類手法の比較検討(2018)
アスキーアートを文字集合として扱うか、画像として扱うか、どちらの方が分類機の特徴量として適しているか比較した研究。画像はCNNと文字画像ベクトルをFFNNで学習する手法、文字特徴量をFFNNと文字重要度で学習する手法が行われいてる。実験の結果は、文字画像ベクトルが全体的に高い成功率。画像特徴量でCNNが作品単位で最高の成功率となった。ただ、文字画像ベクトルを用いた手法は同じキャラを違う文字で作成している場合に不利だそう。
AAからどのように特徴量を抽出するか考える時に参考にしたい。
リンク(PDFあり)
テキスト圧縮を用いた言語に依存しないテキストアート抽出法(2009)
なんと、テキストを圧縮しアスキーアートを抽出する手法。同じ文字が2回現れる回数、行数、テキストのバイト数というのが特徴量として扱われるらしい。なるほど。
リンク(PDFあり)
アスキーアート検索エンジンの実験的実装(2008)
類似アスキーアートを探す検索エンジンを実装した論文。方法としては縦方向、横方向、出現回数wお元にインデックスを生成しているらしい?
リンク(PDFあり)
形態素解析に基づくSVMを用いたアスキーアートの識別(2005)
SVMを使って文章中からAAを抽出する実験らしい。PDFがなかったので国立国会図書館とかで資料請求しないと読めない。残念。
リンク
画像特徴量を用いた大型アスキーアートの分類手法の提案(2017)
AAを画像化してHOG特徴量を使って分類する実験。
リンク(PDFあり)
アスキーアートへの挑戦 ─画像特徴量によるアプローチ─(2017)
気になるタイトルだけど有料のため読めないし内容わからなかった。
リンク
ASCII Art Synthesis with Convolutional Networks(2017)
CNNを使ってAsciiArtを生成する研究。Qiitaの記事も話題になったやつです。
リンク(PDFあり)
ASCII Art Classification based on Deep Neural Networks Using Image Feature of Characters(2018)
上にあるアスキーアート分類手法の比較検討(2018)の英語版でした。
リンク(PDFあり)
ASCII Art Classification - CUHK CSE
SIGGRAPHで発表された内容らしい。扱っているのは等幅フォントのAA。
(注意)ppsファイルのリンク
Structure-based ASCII Art
上の論文の作者の別の論文。等幅フォントだけどもAA生成に関する論文。
PDF
まとめ
以上、結構たくさんありますね。AAから特徴抽出するならやはり画像化するのが良いんですかね?
しかし、文字列のままうまいこと分類できればメモリにもやさしいような気がするしその方面を探ってみたい気もあります。
それでは。