目次
はじめに
生成AIに表形式のデータを出力させて、ExcelやGoogleスプレッドシートにそのまま貼り付けたいと思ったことはありませんか。実は、そんなときに便利な形式としてTSV形式があります。CSV形式は知っていても、TSV形式については初めて聞いたという方も多いかもしれません。私自身も最近まで知らず、調べてみて「こんな便利なものがあったのか」と感じました。この記事では、TSV形式の基本から実際の使い方まで、備忘録として残しておきます。
TSV形式とは
TSV形式(Tab-Separated Values)は、データをタブ文字で区切って表現するテキスト形式のことです。「タブ区切り形式」とも呼ばれます。
表形式のデータを保存したり、アプリケーション間でデータをやり取りしたりする際に使われます。ExcelやGoogleスプレッドシートなどの表計算ソフトは、TSV形式のテキストを貼り付けると、自動的にセルに分割して表示してくれます。
TSV形式の具体例
実際のTSV形式のデータを見てみます。以下は、商品リストのデータをTSV形式で表現した例です。
商品名 価格 在庫数
りんご 150 100
バナナ 200 50
オレンジ 180 80
この例では、各項目がタブ文字で区切られています。見た目では分かりにくいですが、「商品名」と「価格」の間、「価格」と「在庫数」の間にはタブ文字が入っています。
このテキストをコピーしてExcelやGoogleスプレッドシートに貼り付けると、次のように自動的に表として認識されます。
| 商品名 | 価格 | 在庫数 |
|---|---|---|
| りんご | 150 | 100 |
| バナナ | 200 | 50 |
| オレンジ | 180 | 80 |
CSV形式との違い
TSV形式とよく比較されるのがCSV形式(Comma-Separated Values)です。どちらも表形式のデータを扱う点では同じですが、区切り文字が異なります。
| 形式 | 区切り文字 | メリット | 注意点 |
|---|---|---|---|
| CSV | カンマ(,) | 広く普及している | データにカンマが含まれると処理が複雑 |
| TSV | タブ文字 | データにタブが含まれることは少ない | 見た目で区切りが分かりにくい |
【具体例での比較】
同じデータをCSV形式とTSV形式で表現してみます。
CSV形式の場合
商品名,価格,タグ
りんご,150,"fruit,seasonal,popular"
バナナ,200,"fruit,tropical,sale"
この例では、「タグ」の項目に「fruit,seasonal,popular」というカンマを含む文字列があります。CSV形式では、このような場合にダブルクォーテーション(")で囲む必要があり、処理が複雑になります。
TSV形式の場合
商品名 価格 タグ
りんご 150 fruit,seasonal,popular
バナナ 200 fruit,tropical,sale
TSV形式では、データ内にカンマがあってもタブ文字で区切られているため、そのまま扱えます。データの中でカンマを使うことは多くても、タブ文字を含めることは少ないため、TSV形式の方が扱いやすいケースもあります。
TSV形式が使われる場面
TSV形式は、以下のような場面でよく使われます。
- 生成AIの出力形式として - ChatGPTやClaudeなどにデータをTSV形式で出力してもらい、Excelやスプレッドシートに直接貼り付ける
- データのエクスポート・インポート - データベースや分析ツールからデータを取り出したり、読み込んだりする際の中間形式として
- プログラミングでのデータ処理 - Pythonなどのプログラミング言語でデータを扱う際の形式として
- 大量データの受け渡し - システム間でデータをやり取りする際、シンプルで扱いやすい形式として
特に、生成AIを使ったデータ作成では、TSV形式がとても便利です。例えば、「〇〇についてのデータをTSV形式で10件作成してください」と指示すれば、そのままスプレッドシートに貼り付けられる形で出力してもらえます。
生成AIでTSV形式を出力する方法
生成AIにTSV形式でデータを出力してもらう際の具体的な指示方法を紹介します。
【基本的な指示の例】
以下の内容をTSV形式で出力してください。
- 日本の都道府県名
- 県庁所在地
- 人口(概数)
10件程度でお願いします。
このように指示すると、生成AIは以下のような形式で出力してくれます。
都道府県名 県庁所在地 人口
東京都 東京 約1400万人
神奈川県 横浜 約920万人
大阪府 大阪 約880万人
【より具体的な指示の例】
以下の条件でプロジェクトタスク一覧をTSV形式で作成してください。
- タスク名
- 担当者
- 期限
- ステータス(未着手/進行中/完了)
## 情報
ここに情報を記載
このように条件を詳しく指定することで、より実用的なデータを作成してもらえます。出力されたデータをコピーして、そのままスプレッドシートに貼り付ければ、すぐに表として使えます。
TSV形式を扱う際の注意点
TSV形式は便利ですが、いくつか注意すべきポイントがあります。
【タブ文字の可視化】
通常のテキストエディタでは、タブ文字と連続した空白文字の区別がつきにくいことがあります。データが正しくTSV形式になっているか確認したい場合は、タブ文字を可視化できるエディタ(Visual Studio Codeなど)を使用すると便利です。
Visual Studio Codeの設定方法について、以下の記事に詳しい手順が掲載されています。
【データ内にタブや改行が含まれる場合】
データの中にタブ文字や改行が含まれていると、正しく区切られなくなります。そのような場合は、以下の対応が考えられます。
- タブ文字を空白に置き換える
- 改行を削除するか、別の記号に置き換える
- CSV形式に切り替えて、ダブルクォーテーションで囲む
まとめ
TSV形式は、タブ文字でデータを区切るシンプルな形式で、生成AIの出力をスプレッドシートに貼り付ける際などに便利です。CSV形式と似ていますが、データ内にカンマが含まれていても扱いやすいという利点があります。