1. はじめに
こんにちは。
私は情報システムやサービスの運用の研究開発業務を担当するグループに所属している初級エンジニアです。
今回は初級エンジニアでも簡単に生成AIアプリケーションを開発できるツールである、「Dify」について実際に触ってみました。
環境については、前回記事(OpenLIT紹介)に引き続き、AWSサービスである「EC2」のインスタンス上で構築しました。
また、同じくAWSサービスの生成AIプラットフォームである「Bedrock」も活用してみました!
本記事は初級エンジニアの私が、生成AIアプリケーション開発ツールであるDifyを導入し、アプリ作成までの工程をまとめたものになります。
今回は例として、生成AIアプリ『Qiita記事レビューさん』を作成してみました。このアプリは、添付されたQiita記事を採点してくれます。
まずはDifyについて説明した後に、導入方法について説明します。
2. Difyってなに?
Difyはノーコードで生成AIアプリを作成できるOSSです。
近年、「生成AI」はビジネスや日常生活のさまざまな場面で利用されており、最も勢いのある技術といっても過言ではありません。
しかし、その生成AIを用いて何かアプリケーションを作りたい!となったとしても、実用的なアプリケーションを作成できるまでに至るには、学習のコストがかかってしまいます。
「Dify」はプログラミング知識なし(ノーコード)で、いくつものLLMモデルを用いた生成AIアプリケーションを開発することができるツールです。
以下に主な特徴についてまとめます。
Difyには「Webアプリ版」と「ローカル版」が存在しますが、今回はローカル版の導入をしていきます。
本記事の情報は2025年4月時点、v1.1.3
の情報です。
主な特徴
特徴1:多様な生成AIアプリケーションを作成できる
Difyでは、あらかじめ設定されたアプリケーションの種類から選択する方式を採用しています。ユーザーは、自分が作成したいアプリケーションに最も適した種類を選択することができます。
以下にアプリの種類を示します。
アプリの種類
- チャットボット:簡単なLLMベースのチャットボット
- エージェント:推論と自律的なツールの使用を備えたインテリジェントエージェント
- テキスト ジェネレーター:テキスト生成タスクのためのAIアシスタント
- チャットフロー(Beta):メモリを使用した複雑なマルチターン対話のワークフロー
- ワークフロー(Beta):シングルターンの自動化タスクのオーケストレーション
また、テキストファイル(TXT、PDF、DOCXなど)をアップロードすることで、RAGシステムを構築することも可能です。
さらに、いくつもの外部ツールに対応しており、APIキーなどの情報を入力するだけで自由自在にLLMと外部ツールを結合できます!
特徴2:ノーコードで簡単に開発できる
通常、アプリケーションを作成するためにはPythonやTypeScriptなどの言語を用いてソースコードを書く必要があります。
しかし、DifyではGUIを操作するだけで簡単に生成AIアプリケーションを作成することができます。
コーディングなしで生成AIアプリ開発ができるため、まだプログラミングに馴染みのない方やIT知識のない方にもおすすめです!
特徴3:多くのLLMモデルプロバイダーに対応している
有名なLLMモデルプラットフォームであるOpenAIやAnthropicはもちろん、最近話題となっているDeepSeekなど、多くのモデルに対応しています。
引用元:DifyのGitHubリポジトリ
API等の初期設定を行うだけで、いくつものモデルを1つの画面上で選択して使用できるため、それぞれのモデルの特徴を活かして役割を分担させたアプリケーションを作成したい方にとてもおすすめです!
60種類ものLLMモデルプロバイダーに対応
参考情報:List of Model Providers
特徴4:簡単にデプロイできる
わずか数ステップで生成AIアプリケーションの開発ができるようになります。
詳細は本記事の3章で説明します。
3. 前提環境の構築
Difyを動作させるための環境を構築します。
前提環境については、前回のOpenLITの記事の3章とほとんど同様であるため詳細は以下を参照してください!
利用サービス
- 開発環境:AWSのEC2インスタンス
- LLMモデルサービス:Amazon Bedrock
AWSマネジメントコンソール上の準備
Amazon Bedrock上でモデルの有効化
Amazon Bedrockのモデルを使用するために、モデルを有効化する必要があります。
過去に有効化を実施した場合、この手順は不要です。
リージョンによって使用できるモデル数が大きく異なりますが、今回は動作確認程度ですので、東京リージョン(ap-northeast-1
)でモデルを有効にしてください。
今回はClaude 3.5 Sonnet
を使用します。
さらに多くのモデルを使用したい場合はバージニア北部(us-east1
)もしくはオレゴン(us-west2
)を選択しましょう。
EC2インスタンスの立ち上げ
EC2インスタンスを以下の設定で立ち上げます。
インスタンスの設定
- 名前とタグ:任意(今回は
dify-server
) - AMI(OS):Amazon Linux 2023
- インスタンスタイプ:CPU ≧ 2Core, RAM ≧ 4 GB(今回は
t3.medium
) - キーペア:任意
- ネットワーク:セキュリティグループを作成(詳細は後述)
- ストレージ:任意(今回は16 GB)
AMIに関して、他の候補でも問題ありませんが、この後のCLI上の操作に影響を与える可能性があります。
インスタンスタイプやストレージに関して、基本任意ですが、スペックが低すぎるとDifyが動作しない可能性があります。そのため、今回は「t3.medium」および「16 GB」としました。
セキュリティグループの設定
セキュリティグループを以下の設定で編集します。
インバウンドルールの設定
- タイプ:カスタムTCP
- プロトコル:TCP
- ポート範囲:80
- ソース:マイIP(他のPCから受け付けたい場合は、範囲を広くする必要があります)
- 説明:任意
EC2インスタンスにIAMロールをアタッチ
以下の設定でIAMロールを作成し、インスタンスにアタッチします。
IAMロールの設定
- 信頼されたエンティティタイプ:AWSのサービス
- ユースケース:EC2
- 許可ポリシー:
AmazonBedrockFullAccess
- ロールの詳細:任意(今回はロール名を
AmazonBedrockFullAccess
)
これでAWSマネジメントコンソール上での準備は完了です!
インスタンスに接続できましたら、次はインスタンス上の準備です。
EC2インスタンス上での準備
Amazon Linux 2023
の環境に前提となるツールやライブラリを導入していきます。
こちらに関しては、以下記事の3章と全く同じ内容となっています。
導入ツールは次の6つです。
- Docker
- Docker compose
- Python
- pip
- Boto3
- Git
# パッケージをアップデート
$ sudo dnf update
# dockerインストール
$ sudo dnf install -y docker
# dockerデーモン起動
$ sudo systemctl start docker
# ユーザーグループの追加
$ sudo gpasswd -a $(whoami) docker
# dockerに書き込み権限の付与
$ sudo chgrp docker /var/run/docker.sock
# dockerデーモンの再起動
$ sudo service docker restart
# dockerデーモンの自動起動
$ sudo systemctl enable docker
# docker composeのインストール
$ sudo curl -L "https://github.com/docker/compose/releases/latest/download/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
# 実行権限の付与
sudo chmod +x /usr/local/bin/docker-compose
バージョンを確認して、正しくバージョンが確認できれば成功です!
$ docker -v
Docker version 25.0.5, build 5dc9bcc
$ docker-compose -v
Docker Compose version v2.32.1
これでDifyを導入する準備が全て整いました!
4. Difyの導入とモデル設定
ここからはDifyの導入に入ります。
以下の公式ページを参考に導入します。
導入手順
Difyの導入
$ git clone https://github.com/langgenius/dify.git
Difyの起動
# ディレクトリを移動
$ cd dify/docker
# 環境は位置ファイルをコピー
$ cp .env.example .env
# dockerコンテナを起動
$ sudo docker-compose up -d
これでDifyの導入が完了し、生成AIアプリケーションを作成する準備がととのいました!
次は、Difyに接続して実際にアプリケーションを作成してみます。
Difyに接続
http://[インスタンスのパブリック IPv4 アドレス]:80
を確認すると、アカウント作成画面が表示されます。
ご自身のメールアドレスと名前、パスワードを入力し、アカウントを作成します。
すると、ログイン画面が表示されますので、先ほどのメールアドレスとパスワードを入力してサインインします。
サインインに成功すると、アプリケーション作成画面が表示されます。
LLMモデルプロバイダーの設定
このままアプリの作成に入りたいところですが、使用するLLMモデルを設定する必要があります。
右上の名前アイコンから、設定
を選択します。
「モデルプロバイダー」のタブから、使用したいモデルプロバイダーを選択して設定していきます。
今回は「Amazon Bedrock」を使用します。
Amazon Bedrockを選択し、インストールします。
その後、AWSのセットアップとして以下設定値を入力します。
- Access Key:入力不要
- Secret Access Key:入力不要
- AWS Region:
Asia Pacific(Tokyo)
- Bedrock Endpoint URL:入力不要
- Available Model Name:
anthropic.claude-3-5-sonnet-20240620-v1:0
本来はAWSユーザーのアクセスキーなどを入力する必要がありますが、今回はEC2インスタンスにAmazoBedrockFullAccess
のポリシーが入ったIAMロールをアタッチしてあるため、入力不要です。
また、Available Model Name
には、アクセスを許可したモデルであれば何を入力しても構いません。
以上の設定により、Bedrock上のモデルが使えるようになりました。
これにより、事前設定は完了です!
Bedrockを用いて生成AIアプリケーションを作成することができるようになりました。
5.『Qiita記事レビューさん』を作ってみた!!
今回は、Qiita記事を採点するための生成AIアプリケーションを作成してみます。
せっかく頑張って技術ブログを書きあげても、
「内容に漏れはないかな?」
「ちゃんと伝わる文章になってる?」
「閲覧数伸びる??」
.....などの不安、ありますよね?
そこで活躍するのが、今回作成するQiita記事採点アプリです!
(ついでにQiita記事要約機能も追加しています。)
以下に作成手順を示します。
アプリの作成手順
まずは、ホーム画面の「スタジオ」タブより「最初から作成」を選択し、アプリの種類は「チャットフロー」を選択します。
アプリ名は『Qiita記事レビューさん<辛口>』にします。
「チャットフロー」は、会話の流れをブロックで組み立てられる機能です。
「質問する」「外部データを取ってくる」「回答する」などのやりとりを順番に並べるだけで、複雑なチャットボットが簡単に作成できます。
公式ドキュメントにて、各ブロックの詳細が説明されています。
今回使用するブロックは以下の6種類です。
- 開始:アプリ実行時の入力。チャットフローに必ず1つ必要
- 回答:チャットの応答内容を定義。フローの最後に必須
- LLM:LLMを呼び出して自然言語を処理
- IF/ELSE:条件に基づいてフローを分割
- テキスト抽出:ドキュメントをテキストに変換
- 質問分類器:質問の分類条件を定義
紹介したブロックを組み合わせて、以下のようなフロー図を組みます。
LLMにはすべて「Claude 3.5 Sonnet」を使用しました。
これでアプリの作成は完了です。
次は実際にこのアプリケーションを使用してみます。
[補足] アプリの詳細
各ブロックの詳細な設定について以下に示します。
サマリー
SYSTEM
あなたはサマリー作成者です。
USER
添付されたPDF(テキスト抽出ツール/text)は、Qiitaという技術者向けブログサイトに掲載予定の資料です。資料の構成に従い、要約をお願いします。
辛口レビュー
SYSTEM
あなたは辛口で厳格ながら、部下の成長を本気で考える公正な上司です。
USER
添付されたPDF(テキスト抽出ツール/text)は、Qiitaという技術者向けブログサイトに掲載予定の資料です。この資料をレビューしてください。レビューの目的は、資料の質を高め、読者にとって技術的・実用的に価値ある投稿を実現することです。
指示
・技術ブログとしての点数を100点満点で太字で文字の大きさを大きく目立つように最初に示してください。
・点数は資料ごとに有意差が出るように、広い範囲(0~100)で点数をつけてください。
・批評は長くなりすぎないように、要点をまとめてください。
・部下が具体的に「何を直せばよいか」を理解できるようにフィードバックしてください。
・実際にQiitaに投稿された場合の読者の反応を予測し、それを踏まえたアドバイスも記載してください。
・改善点は具体的に場所を示してください。
評価の観点
1.技術的な正確性: 内容に誤りや曖昧さがないか、根拠が適切か。
2.分かりやすさ: 初心者にも直感的に理解でき、説明が明確か。
3.構成: 情報が論理的で適切に整理されているか。
4.読者の興味を引きつける表現力: タイトルや文章がキャッチーか。
5.不足情報や改善点: 読者に混乱を与える箇所がないか。
出力フォーマット
1.全体の評価(辛口で総評): 点数と資料全体の印象を簡潔に。
2.改善が必要なポイント: 問題点と具体的な改善案(箇条書きで詳細に)。
3.良かった点: 評価すべき部分を短く記載し、モチベーション向上に繋げる。
アプリの使い方
Qiita記事を要約する
ホーム画面の「探索」タブより、先ほど作成したアプリを選択します。
「ローカルアップロード」より、Qiita記事を選択します。
今回は以前執筆した記事である
『【ツール紹介】その生成AI、ちゃんと働いてる?OpenLITで見守ろう!!』
をPDF化したものを選択しました。
「チャット開始」を選択し、会話を始めると、
- 要約をする
- 辛口レビューを受ける
を選択するよう促されます。
まずは要約から試します。
「要約をお願いします」
「1」
などと入力することで、Qiita記事の要約をしてくれます。
以下に要約内容を示します。
要約内容には、「OpenLITの導入と使用方法について解説している」との記載があり、記事の内容と一致しています!
その他の細かい内容についても完全に一致しており、かなり精度の高い要約が可能です。
また、追加で話かけると以下のような回答が返ってくるため、別資料の要約やレビューをする場合は「新しいチャット」を開く必要があります。
Qiita記事を辛口レビューする
「新しいチャット」を選択し、先ほどと同じQiita記事を選択します。
今回は「②辛口レビュー」を選択します。
以下にレビュー内容を示します。
なかなかに耳が痛いコメントですね.....
特に読者層の想定は意識したいと思っている部分ですので、とても勉強になりました。
以上のようにQiita記事の要約およびレビューができる生成AIアプリを簡単に作成することができました!
Qiita記事を執筆した後に使用することで、改善の参考になるかと思います。
[補足] 生成AIアプリを配布する
ホーム画面の「スタジオ」タブより、特定のアプリを選択します。
ページ左のタブから「監視」を選択すると公開URLが記載されています。
このURLおよびQRコードを共有することで、アプリを使用することができます。
アプリを共有する場合は、EC2インスタンスに紐づけたセキュリティグループのインバウンドルールを適切に設定する必要があります。
6. おわりに
今回は初級エンジニアの私が、生成AIアプリケーション開発ツールであるDifyを導入し、アプリ作成までの工程をまとめました。
Difyでは、本当に簡単に生成AIアプリを作ることができるので、「まったくコーディングできないです」という方もぜひ触ってみてほしいです!!
Dify公式ドキュメントには、生成AIアプリ作成のための情報が日本語でわかりやすく解説されているため、ぜひ参考にしながら進めてください。
ただ、アプリを作ったあとには
「これってちゃんと動いてるの?」
「リクエスト数やトークンの消費ってどうなってるの?」
といった、運用面での不安や疑問も出てくるかもしれません。
次回は、そんな“作ったあとの不安”を解消するためのツールとして「LangSmith」を使用した記事を投稿する予定です。
最後までお読みいただき、ありがとうございました。