Mastraで作る超簡易CiNii検索エージェント
Mastra Mastraは、TypeScript製AIエージェントフレームワークです。 Node.js v20以上があれば、簡単に始められますので、ここではセットアップなどは省略します。 Ci...
26 search resultsShowing 1~20 results
You need to log-in
Mastra Mastraは、TypeScript製AIエージェントフレームワークです。 Node.js v20以上があれば、簡単に始められますので、ここではセットアップなどは省略します。 Ci...
概要 図書館情報学的には「主題を分析し、件名、分類を付与する」とは、個別的なコンテンツを、学問体系に照らして概念化し、統制された語彙に写像し、データベースの主キーとする理論的操作であると整理でき...
概要 ウェブサイトのリンクを再帰的に取得するには、専用のツールやプログラミング(Python、Bashなど)を利用することが多いと思いますが、中規模以下のサイトであればブラウザのコンソールから、...
はじめに 先日、図書館目録の自動生成について雑文を書いたので、その重要な要素の一つである典拠コントロールの自動化についても書いてみます。 典拠コントロール 図書館情報学用語辞典 第5版 「典拠...
図書館目録とメタデータ 図書館目録は、図書や資料の書誌情報を体系的に記述・管理するものであり、メタデータの典型的な応用例です。 目録に記載される著者名、書名、出版年、主題などは、資料の検索・...
はじめに 生成AIに記事を書かせたら意外と面白かったので、そのまま、投稿してみます。 学術的に意味はないと思いますが(むしろ怒られそう)、エッセイとしては楽しいのではないかと思います。 'pap...
概要 GoogleのライブラリLangExtractで、書籍のメタデータを抽出してみます。 LangExtract LangExtractはいわゆるNER(固有表現抽出)が簡単にできます。 環境...
はじめに 書籍や論文、データ、あるいは音楽など、なんらかのコンテンツをそのメタデータで検索する、ということが一般的に行われていますが、それが本質的にはどういうことか、考えてみたいと思います。 な...
概要 wikidataはQ番号という形式のWikidataエンティティIDを、SPARQLを使って検索します、最初のQ番号を検索する部分が大変なので、それを検索するインターフェイスを作りました。...
概要 中身は標題のとおりですが、真新しいこと、技術的な知見はまったくありませんが、超簡単なわりには、事務的な作業には便利です。 Excelファイルを、簡単なPythonスクリプト(Pandas)...
概要 テキストを「数値ベクトル」に変換することを「テキスト埋め込み」とかtext embeddingとかいいますが、それによって、テキスト間の類似度を測ることができます。 ベクトルの類似度を測る...
概要 wikidata の Q番号(P5(ヒト)だったら)から、子孫、先祖をたどって、jsonで抽出 ネットワークの幅優先探索(BFS)と深さ優先探索(DFS) を使って範囲を絞る markdo...
概要 標題のとおりですが、以下の内容になります。 wikidataから紫式部の先祖、子孫のデータをjsonで抽出 jsonから配列データを作成し、netoworkxに入力、距離の近い(〇親等)...
はじめに LangChainのtaggingを使ってキーワード抽出をしてみました。 環境は以下のとおりです。 Windows11 プロセッサ 11th Gen Intel(R) Core(TM)...
環境構築 windows11で、pythonとchromadbその他のバージョンの整合性をとるのに苦労したので、以下を使いました。 miniforge create -n env_chroma ...
概要 CiNii Researchの検索結果をLLMを使ってまとめてみます。 環境は前回作った、普通のノートPC上の llama.cpp で、rinna 4bit量子化版で動かしてみたので、実...
ごく普通のノートPCで、大規模言語モデルを動かしてみました(動かしてみた、だけです)。 使ったPCのスペック Windows11 プロセッサ 11th Gen Intel(R) Core(TM)...
情報検索のための大規模言語モデル:サーベイ この記事は、以下のサーベイ論文の要点をまとめたものです。 Large Language Models for Information Retrieva...
ひらがなの清音部分を取り出します String.prototype.normalize() のNFDを使って、濁音を分解し、一文字目を取り出します。 // 濁音を清音に変換する function...
概要 会議資料の右上によくある みたいものをまとめて作成します。 作成した資料番号の画像を、PDFに貼り付けると会議資料の完成です。 コード from PIL import Image, I...
26 search resultsShowing 1~20 results
Qiita is a knowledge sharing service for engineers.