数が多すぎて混乱してきたので OpenAI の LLM たちをまとめてみた
はじめに こんにちは、ひよこです。先日 o3 と o4-mini 系列が発表された ChatGPT ですが、最近、OpenAI から発表される LLM(大規模言語モデル)の種類が増えすぎて、「ど...
38 search resultsShowing 1~20 results
You need to log-in
はじめに こんにちは、ひよこです。先日 o3 と o4-mini 系列が発表された ChatGPT ですが、最近、OpenAI から発表される LLM(大規模言語モデル)の種類が増えすぎて、「ど...
はじめに こんにちは、ひよこです。新年度開始でバタバタしていましたが、ゴールデンウィーク前になにか一つくらいと思ってこの記事を書いています。今回は今更感もありますが、OpenAI が昨年公開した...
はじめに こんにちは、ひよこです! 今回は、ローカル環境で大規模言語モデル(LLM)を動作させるためのツール ollama の最新情報をまとめました。ollama は最新の LLM 群(Llam...
はじめに こんにちは、春が恋しいひよこです。 先日とある大学の入試数学の問題でミスが発生しました。問題を作る方々も大変なのでしょうが、受験生の立場からすればこの手のミスはどうやっても誰かにとって...
はじめに こんにちは、ひよこです。今日はバレンタインデーなので、いろいろな LLM にハート型の関数を描かせてみました。果たして、どの LLM が最も美しいハートを描けるのでしょうか? 使った ...
はじめに 今回は、Retrieval-Augmented Generation (RAG) に代わる新しいアプローチ「Cache-Augmented Generation (CAG)」を提案する...
はじめに あけましておめでとうございます。ひよこです。 新年最初の記事では、Google の Gemini と Google Colab を使って、RAG (Retrieval-Augmente...
はじめに こんにちは、ひよこです!昨日 NHK の 笑わない数学 の微分積分回を見ていたら、懐かしの $ \sigma - \varepsilon$ 論法が出てきたのでちょっとまとめてみました。...
はじめに こんにちは、ひよこです。 今回は、前回紹介した「Discovering Preference Optimization Algorithms with and for Large La...
はじめに 今回は、「Discovering Preference Optimization Algorithms with and for Large Language Models」というタイ...
はじめに ひよこです。生成 AI や LLM などで大活躍している深層学習ですが、では、深層学習の本質とは何でしょうか? これはなかなか難しい問いですが、私なら「深層学習の本質は損失関数の最適化...
はじめに 先日、OpenAI が新しい AI モデル o3 を発表しました。このモデルは、従来の o1 に続く次世代モデルで、現在テスト段階にあるそうです。同時に Google も Gemini...
はじめに 今回は、LLM 分野のブレイクスルーとなった Transformer に関する論文 "Attention Is All You Need" を紹介します。このモデルは、 Attenti...
はじめに 大規模言語モデル(LLM)は近年、自然言語の理解や生成の分野で大きな進展を遂げています。しかし、これらのモデルは個別の能力に限界があり、モデルサイズやトレーニングデータの増加には高コス...
はじめに 今回は Sparse Autoencoder (SAE) の特徴構造について論じた論文 "The Geometry of Concepts: Sparse Autoencoder Fe...
はじめに 今回は High-Resolution Image Synthesis with Latent Diffusion Models という論文を紹介します。 この論文では、高解像度画像生...
はじめに こんにちは、ひよこです。今回は、OpenAI による論文 CLIP: Learning Transferable Visual Models from Natural Language...
はじめに ひよこです。この前帰宅途中に空を見上げたら、もうオリオン座の季節になっていました。寒いわけです。そんなときふと、昔習ったケプラーが頭をよぎりました。というわけで、今回は「ヨハネス・ケプ...
はじめに こんにちは、ひよこです。 先日、論文紹介: Direct Preference Optimization: Your Language Model is Secretly a Rewa...
はじめに 今回は、Sakan-AI の So Kuroki らによる「AGENT SKILL ACQUISITION FOR LARGE LANGUAGE MODELS VIA CYCLEQD」...
38 search resultsShowing 1~20 results
Qiita is a knowledge sharing service for engineers.