結構知ってました
僕が初めてHugging Faceにアクセスしたのは半年前、2024年の初めに、生成AIのプラットフォームについて調べ始めた頃です。
画像生成AIの雄であるStable Diffusionのベンチマーク設定で、nai.ckpt というモデルファイルを入手するために検索した際に、Hugging Faceのサイトが出てきました。
当時は全く知識が無かったので、なんか海外のやばいサイトかなと思ったのと、拡張子がckptのモデルファイルは、マルウェアを仕込むことも可能なので、safetensorを使うように、という情報を得たので、それをダウンロードして使うことはしませんでした。
このロゴ、なんか怪しくないですか?
生成AIをいろいろと使っていくと、このHugging Faceは2016年からと若いながらも、機械学習の主要なプラットフォームの一つだということを知り、それから主に新しいLLMの情報収集のために、時々見るようになりました。
いや、ロゴちょっと考えろよ。
学習対象として選択した理由
今回、学習の対象としてあえてHugging Faceを選んだのは、自分以外の人がどのようにこのプラットフォームを見ているのか、ということを知りたかったからです。
あと、Hugging FaceのAPIを使う、ということが出来るのかと思ったからです。
自分の認識
私はこのサイトを、単に生成AIモデルの集積場所として捉えていました。新しいモデルが出たらここで発表されて、ローカルに実行環境を作り、モデルをダウンロードしてからサンプルコードを実行する、といったことが出来るようになります。
LLMはローカルで動かすには規模の大きいものが多く、やってみて動きません、ということが多々ありました。
他の方の利用状況
Hugging Faceの解説動画を見ました。これを利用して生成AIをこのように使えば、こんなことが出来ます、というものでした。
それは一年ぐらい前に撮影されたものでしたが、Spacesを使って画像生成したり、画像からテキストを生成したり、アートなQRコードを生成したりといった、自分の知らなかった生成AIがありました。そのころによく遊ばれていたものだったようです。
ただ、デモのレベルに留まっているものになるので、もう少し個々のモデルを深堀したものが知りたかったです。
Line BOTとの連携
利用例として、Line BOTとの連携の事例がありましたが、これはHugging Faceではなく、OpenAIのAPIを使っているので、生成AIとの連携の紹介としての内容になっているかな、と思いました。当時はまだまだ生成AIの活用は珍しかったと思いますので、こういった形での紹介になったのだろうと思います。
サイトの紹介
Hugging Faceのトップページから
3列になっていて、一番左から1列目はログインした人の情報になります。自分が生成AIを作ったり、改良したりした場合に、このサイトで共有ができます。GitHubみたいなものだと考えてください。
2列目は、自分がフォローしている人の書き込みが出ています。僕は、MaziyarPanahiという人をフォローしているので、この人のアップデートの状況が出てきます。
3列目が、Trendingというもので、最新情報になります。トレンドなので、最近ダウンロードが急激に多くなったものなどがピックアップされます。
これを見ると、上位は画像生成になっていますね。
一番上の行にメニューがあります。Hugging Faceのロゴ、検索エリア、続いて ModelsとかDatasetsというのは情報の区分で、その横のSpacesをクリックすると、このサイトから実行できる生成AIが紹介されます。
これが、今週よく利用されたデモで、例えば、右上の Video Transcription and Smart Summary というのは、動画から会話をテキストとして抽出して、さらにそのサマリを作成するというものです。
この機能はここから使えます。
Spacesで公開されていても、Modelsには存在せず、デモとしては使えるが、詳しく内容が知りたくても情報が無いものも多数あります。今紹介したVideo Transcription and Smart Summary もそういうものの一つです。
学習してみて
久々にアクセスして、色々と見てみましたが、秒進分歩で色々なものが登場しています。
昔からあるものも、バージョンをどんどん上げており、性能も上がっていて面白いと思いました。
Hugging FaceのAPIで生成AIを動かすことができるのか、という点については、特に何も説明は無かったので、今後それは調べようと思います。
しかし、いずれにしても活用するにはちょっとハードルが高いと思います。基本的には、やはりローカルで動かすことが前提になっているものが多くありますし、そもそもどうやって使うのかから、明確な解説はどこにもありません。一つ一つそれらを読み解いていく必要があって、自動翻訳しても専門用語は解説してくれません。
ただ、Spacesは割と簡単に使えますので、ぜひアクセスして、アカウントを取得して、色々な生成AIに触れてみましょう。
以上