日本語版ModernBERT、ゼロショットのマスク穴埋めで選択肢問題を解く
日本語版 ModernBERT (310M) ファインチューニングなしのマスク穴埋めで JCommonsenseQA を解く実験をしてみました。より大きい LLM (Sarashina2.2(0...
7 search resultsShowing 1~7 results
You need to log-in
日本語版 ModernBERT (310M) ファインチューニングなしのマスク穴埋めで JCommonsenseQA を解く実験をしてみました。より大きい LLM (Sarashina2.2(0...
UniDic の matrix.def のサイズが間違っていたので修正しました: 59GB → 5.9GB kuromoji.js (日本語形態素解析器 Kuromoji の JavaScrip...
UniDic の matrix.def のサイズが間違っていたので修正しました: 59G → 5.9G kuromoji.js (日本語形態素解析器 Kuromoji の JavaScript実...
kuromoji.js (日本語形態素解析器 Kuromoji の JavaScript実装)と React で簡単なブラウザアプリを作ってみました。形態素解析器は MeCab や JUMAN、...
計量国語学屋さんが使うという『現代日本語書き言葉均衡コーパス』(BCCWJ)を、言語学初心者のぼくも使ってみようと思ってやってみました。 書き言葉を集めたデータベースである BCCWJ を使って...
*このプロジェクトは取り組み中です。 計量言語学を勉強し始めて、「データで学ぶ日本語入門」(計量国語学会編、朝倉書店)を読んでいる。 先日、計量国語学会の特別講義で第1章から第5章までの解説を聞...
自分用メモ。 環境 MeCab 0.996 と UniDic(ver. 2.1.2) をインストールした。 MeCabの設定ファイルを編集して、UniDicを使えるようにした。 参考 MeCa...
7 search resultsShowing 1~7 results
Qiita is a knowledge sharing service for engineers.