はじめに
前回「C#(Blazor)でClaude APIを使う方法について」の続きです。
本記事では画像入力の機能について説明したいと思います。
完成イメージ
このような感じで画像入力ができるように機能を追加したいと思います。
概要説明
ファイルの選択ボタンを押して画像を選択し、その画像を入力に使います。
・BlazorApp1のHome.razor
、Home.razor.cs
に変更を加えます。
以下のリンクUpload File
を参考にコードを追加します。
Anthropic ConsoleにWorkbenchという機能があります。
API実行および実行時のコードやデータ構造を確認することができます。
コードはPythonとTypeScriptですが、参考になると思います。
チュートリアル
それでは機能追加していきましょう。
ファイルを追加する
ボタンを追加します。
ボタンを押すとファイルを選択できるようになります。
ファイルが追加された後の処理UploadImage
にて画像をbyte配列に変換します。
<div class="p-4">
<InputFile id="InputFileImage" OnChange="@UploadImage" type="file" accept="image/*" />
</div>
bool isLoading = false;
string imageType = "";
byte[]? imageBytes = null;
private async Task UploadImage(InputFileChangeEventArgs e)
{
if (isLoading) return;
isLoading = true;
// Get the uploaded image(s)
var files = e.GetMultipleFiles();
// Read the image data
var buffer = new byte[files[0].Size];
await files[0].OpenReadStream().ReadAsync(buffer);
// Convert the image data to a base64 string
imageBytes = buffer;
imageInput = Convert.ToBase64String(buffer);
imageType = files[0].ContentType;
isLoading = false;
}
Claude APIを呼び出すタイミングはSendボタンを押した時にしています。
入力データは「テキスト」or「画像+テキスト」の形式です。
async Task SendClick()
{
if (running) return;
if (string.IsNullOrWhiteSpace(textInput)) return;
running = true;
try
{
chatMessages.Add(new() {
Role = Roles.User,
Content = (imageBytes == null) ? textInput : [new(imageBytes, imageType), textInput ]
});
var stream = Anthropic.Messages.CreateStreamAsync(new()
{
Model = Models.Claude3Opus,
MaxTokens = 1024,
Temperature = temperature,
System = string.IsNullOrWhiteSpace(systemInput) ? null : systemInput,
Messages = chatMessages.ToArray()
});
var currentMessage = new Message { Role = Roles.Assistant, Content = "" };
chatMessages.Add(currentMessage);
textInput = ""; // clear input.
imageType = "";
imageBytes = null;
await JSRuntime.InvokeVoidAsync("resetFileInput", null);
StateHasChanged();
await foreach (var messageStreamEvent in stream)
{
if (messageStreamEvent is ContentBlockDelta content)
{
currentMessage.Content[0].Text += content.Delta.Text;
StateHasChanged();
}
}
}
finally
{
running = false;
}
}
チャット表示部の変更
switch
文で分岐しています。入力に画像が含まれる場合はitem.Content[0].Text
がnull
なのでご注意ください。
@foreach (var item in chatMessages)
{
@if (item.Role == Roles.User)
{
<div class="mb-2">
<span class="font-bold text-blue-500">User:</span>
@switch (item.Content[0].Type)
{
case ContentTypes.Text:
@((MarkupString)item.Content[0].Text!.Replace("\n", "<br />"))
break;
case ContentTypes.Image:
@((MarkupString)item.Content[1].Text!.Replace("\n", "<br />"))
// 画像のbyte配列からBase64文字列を生成
var base64Image = Convert.ToBase64String(item.Content[0].Source.Data.Span);
<img src="data:@item.Content[0].Source.MediaType;base64,@base64Image" alt="User Image" />
break;
default:
break;
}
</div>
}
else
{
<div class="mb-2">
<span class="font-bold text-green-500">Assistant:</span> @((MarkupString)item.Content[0].Text!.Replace("\n", "<br />"))
</div>
}
}
画像入力後にリセットする処理:resetFileInput
<script>
var rangeInput = document.querySelector(".range_slider");
var rangeBubble = document.querySelector(".range_bubble");
rangeInput.addEventListener("input", () => {
setBubble(rangeInput, rangeBubble);
});
rangeInput.addEventListener("mouseover", () => {
setBubble(rangeInput, rangeBubble);
});
rangeInput.addEventListener("mouseleave", () => {
rangeBubble.style.display = "none";
});
function setBubble(range, bubble) {
var val = range.value;
var min = range.min ? range.min : 0;
var max = range.max ? range.max : 100;
var newVal = Number(((val - min) * 100) / (max - min));
bubble.innerHTML = val;
bubble.style.left = `calc(${newVal}% + (${-5 - newVal * 0.15}px))`;
rangeBubble.style.display = "inline-block";
}
function downloadFromBase64String(fileName, base64String) {
const a = document.createElement('a');
a.href = "data:application/octet-stream;base64," + base64String;
a.download = fileName;
a.click();
a.remove();
}
+ function resetFileInput(element) {
+ if (element) {
+ element.value = null;
+ } else {
+ const fileInputs = document.querySelectorAll('input[type="file"]');
+ fileInputs.forEach(input => input.value = null);
+ }
+ }
</script>
おわり
複数画像には対応していません。画像を使うと通信データ量が大きくなる為、クレジットの減りが早くなるのでご注意ください。
また、画像サイズが大きいとうまく動かない場合があります。
MaxTokens = 1024
を変更するか、画像を小さくして対応してください。