AIが経理を代行!? Nanonets-OCR2-3Bに請求書を読ませてみた結果…
はじめに 「請求書の金額や登録番号を、AIが自動で読める時代が来たら便利だな」 そんな思いから、今回は Hugging Faceの Nanonets-OCR2-3Bを使って、 請求書画像から金額...
534 search resultsShowing 1~20 results
You need to log-in
はじめに 「請求書の金額や登録番号を、AIが自動で読める時代が来たら便利だな」 そんな思いから、今回は Hugging Faceの Nanonets-OCR2-3Bを使って、 請求書画像から金額...
はじめに 「猫と犬が降っている」「七転び八起き」「Les carottes sont cuites」── 言葉の裏には、文化の香りがある。 今回使ったのは、TildeAI が開発した多言語基盤モ...
はじめに 近ごろ注目されている「小型なのに高性能」な言語モデルシリーズ——Ling-mini-2.0。このモデルは、わずか1.4Bの“活性化パラメータ”で7Bクラスの賢さを持つと噂されています。...
はじめに Hugging Faceで公開されている WEBGEN-4B-Preview は、テキスト指示からHTML+Tailwind構成のWebページを丸ごと生成できる「Webデザイン特化型L...
はじめに 今回は AI21-Jamba-Reasoning-3B-GGUFを使って、「一度答えたあとに、自分でその理由を点検して再回答する」 ――つまり 自己修正型の推論(self-correc...
はじめに 決算発表の要旨には、数値データだけでなく、企業の“トーン”──つまり経営陣がどの程度強気・慎重なのか──が表れます。 本記事では、金融特化言語モデル ProsusAI/FinBERT ...
はじめに オープンソースLLM Apertus-8B-2509は、Swiss-AIチームが開発した「完全オープン」「多言語対応」「長文推論対応」のモデルです。 最大 65,536トークン の長文...
はじめに 夜のColab画面に、ふと思いました。 「JSONファイルのキーをアルファベット順に並べ替えたい。 でも、いちいちコードを書くのは面倒だな。」 そんな軽い気持ちで、AIにお願いしてみた...
はじめに:Granite-4.0-H-Smallとは? Granite-4.0-H-Smallは IBM が公開した最新の多言語LLM。 英語・日本語・フランス語・中国語など十数言語に対応し、F...
はじめに Baidu が公開している ERNIE-4.5-21B-A3B-Thinkingは、長文読解や複雑な推論に強いとされる大規模言語モデルです。 今回はその性能を試すために、「嘘つきと真実...
はじめに 創作系LLM「Gemma-The-Writer-N-Restless-Quill-10B-Uncensored-GGUF」を使って、同じシーンを文体ごとに変えて生成させる遊びをしてみま...
はじめに 最近のAIは「文章をつくる」だけじゃなくて、「分析する」ことまで得意らしい。ならば…と思い立ち、Datarus-R1-14B-previewに「売上データの分析」をお願いしてみました。...
はじめに 昼のカフェはたくさんある。けれど「夜のカフェ」って、どこか特別な響きがありませんか? キャンドルの灯り、ヴィンテージジャズ、ふっと落ち着く深夜の一杯。 今回は、Hugging Face...
はじめに Stable Diffusion XL と IP-Adapterを組み合わせると、1枚のロゴ画像をベースに「質感」を差し替える遊びができます。 今回は、同じシンプルな家マークのロゴを使...
はじめに 株式投資でよく登場する「チャートパターン」。 Wボトム、ヘッド&ショルダー、トライアングル…人間なら「おっ、この形はアヤシイ」と気付くものの、機械はどうでしょう? 今回は Huggin...
はじめに AI でキャラクターを生成するときの楽しみのひとつは、まったく異なる世界観のビジュアルを並べて比較できることです。 今回は「魔法少女」と「サイバーパンク戦士」という両極端なテーマを設...
動画を理解するAI プロンプト: このサッカーの試合で一番活躍した選手は誰ですか? AIの答え: 紺色のシャツと黒いショーツのプレイヤーがこのサッカーの試合で一番活躍しています。 プロンプト:こ...
カラーテレビが家に来たような colabは我が家のブラウザでかんたんにAIをうごかせる実験環境ですが、40GBしかVRAMがなく、重量級のLLMモデルは動かないのが通例でした。 LLMの実験をし...
はじめに Hugging Face で公開されている silly-v0.2 は、Mistral-Nemo-Base をベースにしたロールプレイ(RP)特化モデルです。 特徴は、キャラクターになり...
はじめに Hugging Face で公開されている WEBGEN-4B-Preview-GGUFは、HTML+Tailwind CSS のシンプルなWebサイトをプロンプトだけで生成してくれる...
534 search resultsShowing 1~20 results
Qiita is a knowledge sharing service for engineers.