huggingface/TRLのSFTTrainerクラスを使えばLLMのInstruction Tuningのコードがスッキリ書けてとても便利です
はじめに huggingfaceにはTRL(Transformer Reinforcement Learning)というライブラリがあります。これは、LLMをチューニングする際の、Instruc...
56 search resultsShowing 1~20 results
You need to log-in
はじめに huggingfaceにはTRL(Transformer Reinforcement Learning)というライブラリがあります。これは、LLMをチューニングする際の、Instruc...
はじめに LangGraphの勉強の備忘録として、タイトルの通り最新のトレンドを考慮した広告文生成をやってみます。 といっても内容は非常に薄く、LangChainやLangGraphのチュートリ...
はじめに ※本記事で「現時点」という言葉は2023/6/1を指すこととします。 先日(2023年5月17日)、サイバーエージェントが日本語に特化したLLM(Large Language Mode...
はじめに 最近Vision and Language、とくにImage to Textに興味がでてきたので、いくつか重要そうな研究の情報収集をしました。 本記事で紹介する内容はあくまでImage...
はじめに huggingfaceのTrainerクラスはhuggingfaceで提供されるモデルの事前学習のときに使うものだと思ってて、下流タスクを学習させるとき(Fine Tuning)は普通...
はじめに 学習スクリプトを実行しているときにGPUにメモリが乗り切らなくてCUDA out of memoryで処理が落ちてしまい、学習スクリプトを最初から実行し直すハメになることがよくあります...
ぱっとググって、直接的な記事が見当たらなかったので、念の為備忘録的に残しておきます。 誰かの助けになれば幸いです。 poetryでpythonの環境構築をしようとして、poetry initとか...
はじめに ほぼ備忘録的なものですが、他に困ってる方がいるかもしれないので、一応残しておきます。 当方の手元の環境のtweepyのバージョンは4.8.0です。 !pip list | grep t...
はじめに Deep Learningのモデルを軽量化する手法に、知識の蒸留(Knowledge Distillation) という考え方があります。 知識の蒸留の考え方については、以下の記事が非...
はじめに 記事にするようなことでもないかもしれませんが、huggingfaceを使った実装に不慣れな場合、DatasetやDataLoaderの実装の仕方って場合によっては混乱するかなーと思いま...
目次 本記事はPyTorchを使って自然言語処理 $\times$ DeepLearningをとりあえず実装してみたい、という方向けの入門講座になっております。以下の順番で読み進めていただくとP...
はじめに 自然言語処理における敵対的攻撃(Adversarial Attack)の手法とか全然知らなかったので、ちょこっと勉強してみました。なんとなく雰囲気はつかめたので、自分が勉強した内容をす...
はじめに TLM(Task-drive language Modeling)という手法を提唱する論文を読んで、内容が面白そうだったので、実際に実装してみて、TLMの効果を検証してみました。 実装...
割当問題とは? 割当問題という問題をご存知でしょうか? $n$ 人に $n$ 個の仕事を割り当てるとき、最も効率の良い割り当て方は何かを考える問題を「割当問題」といいます。 行列で考えるとわかり...
はじめに huggingfaceのtransformersを使って、久しぶりに日本語BERTを動かそうと思ったら、昔書いたソースコードでは、あれよあれよとエラーが出るようになってしまっていました...
はじめに FORTNITEもシーズン6に入り、弓などの新しい武器が追加されたり、クラフトの要素が追加されたりと雰囲気がガラッと変わりましたね。どんな対戦ゲームでもそうですが、環境がガラッと変わっ...
はじめに huggingfaceを使ったEncoder-Decoderモデルの練習の一貫として、BERT2BERTによる文章生成をやってみました。 BERT2BERTはEncoder-Decod...
はじめに huggingface / transformersを使えば簡単に画像分類系で(今のところ)最先端なVision Transformer(以降ViTと略します)が使えるようなので、手元...
はじめに AIの説明性とか判断根拠に関するトピックに興味があって、画像系のデータであれば、Grad-CAMとか自然言語ならAttentionとか、いろんな手法が研究されてると思います。 そこで今...
はじめに Adversarial Attackをご存知でしょうか?日本語で敵対的攻撃ですかね。 以下のパンダがテナガザルに誤判定される例は有名かと思います。人間には分からない微小なノイズを画像に...
56 search resultsShowing 1~20 results
Qiita is a knowledge sharing service for engineers.