記事投稿の経緯
約半年ほど前に「ナレッジベースへ追加する際のファイル名は日本語NG」というQiita記事を投稿しました。
その後、あるプロジェクトにて、日本語ファイル名でもナレッジベースが動作していることにふと気づきました。
なるほど、このプロジェクトは10月頃に追加したものだから、いつの間にか日本語OKになったのね!
と思い、では「ナレッジベースへ追加する際のファイル名は日本語 OK」というタイトルで、再度Qiita記事を執筆しようではないかと思い立ちました。
トライ
前回の記事と同じ内容で日本語を含むファイルをソースリンクに指定してデータソースの作成を試します。
てっきり成功すると思っていたものの、やってみると相変わらずエラーになります。(エラー内容も同じ)
検討
日本語ファイル名でも動作しているナレッジベースとの差を確認したところ、成功しているものは以下の内容になっていることに気づきました。
- ソースリンク:日本語なし ←※ここがポイント
- そのソースリンクの配下のファイル名:日本語あり
再チャレンジ
これを踏まえて、この条件でデータソースを追加して、検索までを試してみます。
- ソースリンク:日本語なし
- そのソースリンクの配下のファイル名:日本語あり(「テスト_S3からナレッジベース.txt」)
- テスト_S3からナレッジベース.txtの中身:marudogは動物好きです
データソースの追加が無事に成功しました。
その後、同期の上、検索してみると、日本語ファイルでも内容を検索できていることが確認できました。
まとめ
ソースリンクは日本語NGですが、 ファイル名自体は日本語OK であることが確認できました。
ファイル名が日本語OKだと、日本語を使わない形に変換する手間がなくなったり、識別しやすくなったりでうれしいですね。
ここのところ忙しくて、残念ながらアドベントカレンダーには間に合いませんでしたが、みなさま良いお年をお過ごしください。

