1.はじめに
- Google Driveの中のipynbを自然文で検索できるようにした。
- 「あれってどこに書いてあったっけ?」というのがなくなりそうなので良かった。
2.経緯
- google Colaboratory いろいろと便利なのでヘビーに使わせてもらっている。
- しかし作りすぎるとどこに何が書いてあったのかわからなくなる。300個以上ある!
- 例えばGoogleサービスの認証とか、BigQueryの最初の動作とかすぐ忘れて書けない。
- ただ、「なんとなく今回書きたいコードってどっかで書いた気がする」みたいなものはちょっとすぐ出せなくなって結局一からウェブ情報しらべて書くなど面倒なことになってしまっている。
- 特に、「なんか前に同じようなことしたくて書いた気がする」とか、キーワードがズバッと出ずに苦労する。
#@title 最初1回実行(認証)
from google.colab import auth
auth.authenticate_user()
from google.cloud import bigquery
PROJECT_NAME="***"
client = bigquery.Client(PROJECT_NAME)
QUERY_TEMPLATE = """
SELECT ***
FROM `***.***.***`
WHERE ***
LIMIT {limit} OFFSET {offset};
"""
- そこで、なるべく手間をかけずに聞けて、すぐ関連ソースコードをとってきてもらうべく、langchainの RetrievalQAWithSourcesChainでipynbをベクトル化して取得できるようにしました(が・・・)。
3.作り方
- 最初、全部自前で作ろうとしてたけど、GoogleCloudのAI Appplicationsならすぐできるのを発見!
(1)Googleドライブを指定
まず「Data Store」でGoogle Driveのipynbが蓄積されている場所を指定

なお、過去作成のipynb群は、デフォルトだとMyDrive>Colab NoteBooksに入っている。




