どういう記事?
- VOICEVOXのような読み上げソフトは便利ですが、英語をアルファベットのまま読んでしまうので聞き取りづらい場合があります。
- よく挙げられる対策は辞書ベースなので専門性が高い論文などに効果がありません。
- なのでZero-shot性能の高いChatGPTに英語をカタカナにしてもらおうという記事です。
プロンプト
以下がプロンプトになります。
あなたは優秀なアシスタントです。
以下の疑似スクリプトを実行して結果を出力してください。
疑似スクリプト:
for word in ['英単語1', '英単語2', ...]:
word = カタカナにする(word)
print(word)
出力:
プログラムで使用しやすいように出力のフォーマットが一定になりやすいようにしました。
入出力例
入力1:
あなたは優秀なアシスタントです。
以下の疑似スクリプトを実行して結果を出力してください。
疑似スクリプト:
for word in ['Xavier', 'ImageNet', 'CHARACTERIZING']:
word = カタカナにする(word)
print(word)
出力:
出力1:
ザビエル
イメージネット
チャラクタライジング
入力2:
あなたは優秀なアシスタントです。
以下の疑似スクリプトを実行して結果を出力してください。
疑似スクリプト:
for word in ['ARCHITECTURAL', 'SpectralNorm', 'orthogonal', 'GAN', 'BigGAN', 'Wang']:
word = カタカナにする(word)
print(word)
出力:
出力2:
アーキテクチャル
スペクトラルノルム
オーソゴナル
ジーエーエヌ
ビッグジーエーエヌ
ワン
入力3:
あなたは優秀なアシスタントです。
以下の疑似スクリプトを実行して結果を出力してください。
疑似スクリプト:
for word in ['RepVGG', 'ConvNeXt', 'ConvNet', 'Lion', 'SwinV2']:
word = カタカナにする(word)
print(word)
出力:
出力3:
レプブイジージー
コンブネクスト
コンブネット
ライオン
スウィンブイツー
総評
固有名詞を含め良くカタカナ化できていると思います。こういうときに便利ですねChatGPT
この出力形式ならデータが利用しやすいのもグッド!
追記
APIのRate Limitが大丈夫なら、1単語ごとに以下のプロンプトでカタカナ化する方が経済的っぽいです。
English: <word>
Japanese Katakana Only: