0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

QWEN VL と Model Studio を使用して Function Compute に OCR をデプロイする

Last updated at Posted at 2025-03-21

本記事はこちらのブログを参考にしています。
翻訳にはアリババクラウドのModelStudio(Qwen)を使用しております。

M Fakhri Darmawan(アリババクラウドインドネシア ソリューションアーキテクト)が執筆

現代のデータ駆動型社会において、光学式文字認識(OCR)は画像やスキャンされた文書からテキストを自動的に抽出する上で重要な役割を果たしています。請求書、レシート、フォーム、その他の種類の文書に関わる作業であっても、OCRは非構造化データを構造化され、機械で読み取り可能な形式に変換することでワークフローを大幅に効率化できます。このブログ記事では、QWEN VL、アリババクラウドのModel Studio、およびFunction Computeを使用してOCRソリューションを展開する方法について説明します。

ステップ1

このリンクを使用して、無料でModel Studioを有効化してください。次にAPIキーを作成します。

ステップ2

APIキーの作成と取得

  1. ページの右上にある 1 にカーソルを合わせ、「API-KEY」を選択します。 2
  2. 左側のナビゲーションペインで「すべてのAPIキー」または「マイAPIキー」を選択し、APIキーを表示または作成します。「マイAPIキーを作成」または「既存のAPIキーを表示」をクリックします。 3

注意

「すべてのAPIキー」ページは、アリババクラウドアカウントを使用している場合のみ利用可能です。アリババクラウドアカウントはすべてのRAMユーザーのAPIキーを取得できますが、RAMユーザーは自身のAPIキーしか取得できません。APIキーは安全に保管し、不正使用によるセキュリティリスクや財務損失を避けてください。APIキーは重要な資産です。必ず安全に保管してください。「操作」列の「削除」をクリックして既存のAPIキーを削除した場合、そのキーを使用してModel Studioサービスを利用することはできなくなります。このキーに関連付けられたすべてのアプリケーションやサービスは動作しなくなります。

ステップ3

OCRサンプルアプリケーションのデプロイ

前提条件

手順

  1. このGitHubリポジトリからサンプルコードをダウンロードします。
  2. コードを解凍します。
  3. s.yamlファイル内のコードを変更します。yaml
    edition: 3.0.0
    name: fc3-example
    access: default
    resources:
    fcDemo:
    component: fc3
    props:
    region: ap-southeast-5
    handler: handler
    role: acs:ram::XXXX:role/aliyunfcdefaultrole # XXXXにメインアカウントUIDを入力
    disableOndemand: false
    description: OCR
    timeout: 120
    diskSize: 512
    internetAccess: true
    customRuntimeConfig:
    port: 9000
    command:
    - python3
    - app.py

    logConfig: # slsでログプロジェクトを定義してFCのログを有効にする

    enableRequestMetrics: true

    enableInstanceMetrics: true

    logBeginRule: DefaultRegex

    project: serverless-ap-southeast-5-xxx

    logstore: default-logs

    functionName: ocr-qwen
    runtime: custom.debian10
    cpu: 1
    instanceConcurrency: 100
    memorySize: 1024
    environmentVariables:
    PATH: >-
    /var/fc/lang/python3.10/bin:/usr/local/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/local/ruby/bin:/opt/bin:/code:/code/bin
    PYTHONPATH: /opt/python_disabled:/code/python_disabled:/code
    OSS_BUCKET: yourossbucket # あなたのOSSバケット名を入力
    TZ: Asia/Jakarta
    USER_PASSWORD: # ログインページを有効にする場合に使用
    DASHSCOPE_API_KEY: sk-xxx # ここにAPIキーを入力するか、FC設定 -> 環境変数に設定
    USER_NAME: # ログインページを有効にする場合に使用
    OSS_ENDPOINT: https://oss-ap-southeast-1.aliyuncs.com # OSSシンガポールエンドポイント
    ENABLE_LOGIN: false
    code: ./ocr-qwen
    triggers:
    - triggerConfig:
    methods:
    - GET
    - POST
    - PUT
    - DELETE
    authType: anonymous
    disableURLInternet: false
    triggerName: httpTrigger
    description:
    qualifier: LATEST
    triggerType: http

変更が必要なコード:

10行目:role: acs:ram::XXXX:role/aliyunfcdefaultrole # XXXXにメインアカウントUIDを入力

36行目:OSS_BUCKET: yourossbucket # あなたのOSSバケット名を入力

39行目:DASHSCOPE_API_KEY: sk-xxx # ここにAPIキーを入力するか、FC設定 -> 環境変数に設定

  1. サーバーレスデプロイを使用してコードをデプロイします:bash
    s deploy s.yaml

デプロイ成功時の結果:bash
[2025-03-14 12:24:59][WARN][s_cli] rootユーザーとしてコマンドを実行することは推奨されません。(node:46363) [DEP0060] DeprecationWarning: util._extend APIは非推奨です。代わりにObject.assign()を使用してください。(詳細を表示するにはnode --trace-deprecation ...を使用してください)
⌛ [deploy] のステップ [fc3-example]

Downloading[/v3/packages/fc3-domain/zipball/0.0.26]...
Download fc3-domain successfully
(node:46363) [DEP0040] DeprecationWarning: punycodeモジュールは非推奨です。代わりにユーザーランドの代替を使用してください。ヒント:

s info を使用するとさらに詳細を確認できます。

✔ [fcDemo] completed (9.51s)

🚀 [deploy] の結果 [fc3-example]

region: ap-southeast-5
cpu: 1
customRuntimeConfig:
command:
- python3
- app.py
port: 9000
description: OCR
diskSize: 512
environmentVariables:
DASHSCOPE_API_KEY: sk-xxx
ENABLE_LOGIN: false
OSS_BUCKET: yourossbucket
OSS_ENDPOINT

ドメインの追加とアプリケーションのテスト

  1. 5

  2. ドメインを追加します。
    6
    ドメインを入力し、関数とバージョンを選択してから作成します。

  3. ドメインを設定し、Function Compute に CNAME を指すように構成します。
    7

  4. ドメインに移動してアプリケーションをテストします。
    8

  5. 自分の画像を使用し、プロンプトを指定して試してみてください。
    9

Qwen-VL を OCR に使用し、Model Studio と Function Compute をサーバーレス実行環境として組み合わせることで、さまざまなビジネスニーズに合わせた拡張性があり、効率的でコスト効果の高い OCR ソリューションを構築できます。このアプローチは、Qwen-VL と Function Compute の強みを活用し、最小限のインフラ管理で堅牢な OCR システムを提供します。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?