kota0718
@kota0718

Are you sure you want to delete the question?

Leaving a resolved question undeleted may help others!

Vit 

Q&A

Closed

解決したいこと

vitstrを使ってあることをしたくて、試しにクラストークンを一つ追加してみたのですが、他をどのように変更すればいいか、困ってしまったのでこちらに投稿しました。
https://github.com/roatienza/deep-text-recognition-benchmark/blob/master/utils.py
utils.pyの160行目に仮にself.ASS = '[ASS]'を追加した場合
163行目の self.list_token = [self.GO, self.SPACE ,self.ASS]追記
175行目の txt = [self.GO] + list(t) + [self.SPACE] + [self.ASS]

上のこととはあまり関係ないのですが、こういうgithubにおいてあるプログラムを理解するのにコツとかあったりするのでしょうか。リンクのやつを今勉強しているのですが、どのプログラムから見ればいいのかとか、どこのファイルとつながっているのかでだいぶ苦労したのであったら教えてほしいです。なければ、自分ならどうしてるみたいの聞きたいです。

0

1Answer

文字列をトークン列に置き換えてるのがTokenLabelConverterのようなので、修正箇所は書かれてる通りで概ね問題ない気がします。
動作環境があるならば一回動かしみて、発生するエラーから他の箇所を特定する方が楽かと。

175行目の修正の仕方は新たに追加した特殊トークンで何をしたいかに依ります。
提示されてる内容だと'[ASS]'トークンは'[s]'トークンの後ろに存在する何か、として定義されてますね。

上のこととはあまり関係ないのですが、こういうgithubにおいてあるプログラムを理解するのにコツとかあったりするのでしょうか。

あくまで自分の場合ですが、
深層学習系のコードを読む場合は先に論文で処理の流れを把握しといて、学習用のコード(大抵train.pyかmain.pyかmodel.pyのどれか)内の処理と対応付けをすることが多いです。
後は詳細を知りたい部分を読みながら、意味不明なワードが出てきたらフォルダ内検索とかエディターの機能を駆使して探していく感じですかね。
深層学習系は可読性が低いコードが割と多いので苦労しますが…

1Like

Comments

  1. @kota0718

    Questioner

    解答ありがとうございます.発生するエラーから他の箇所を特定する方法参考にさせていただきます。今回はありがとうございました。

Your answer might help someone💌