はじめに
複雑な単語検索(クロスワード検索+α)ができるLINE Bot「ことばさがし」を作った。前半は主に機能の説明、後半は制作にあたり必要になった技術やソースコード、参考サイトを部分的に紹介する。
LINE Bot「ことばさがし」
(上のボタンから友だち追加できます。フィードバックをいただけますと幸いです。)
背景
謎解きを作っていると「Xを含むN文字の単語」「XがM文字目にあるN文字の単語」などを考えることがよくある。このような条件の単語検索が手軽にできればと思い、この LINE Bot を作ることにした。謎解きやクロスワードの制作者にはぜひ使ってほしい。
使用例
友だち追加時のあいさつメッセージ
ルールとボタンパネルが送られてくる。
単語の検索
1. 基本的な検索
基本的な検索は「?」や「~」を使って直感的に入力できる。
2. 高度な検索
高度な検索は、ボタンパネル押下後に送られてくる入力形式に従って入力する。
特徴
-
全角対応
日本語入力モードの時に一々半角に変換するのは面倒なので、全角のアルファベット、数字、記号に対応した。 -
ボタンパネル
高度な検索において正規表現をそのまま打つのは手間になるのでボタンパネルを設置し、最小限の入力で済むようにした。 -
クイックリプライ(スマホ版のみの機能)
クリックリプライ(画面下部のボタン)を設置し、すぐにルールとボタンパネルを確認できるようにした。 -
文字種フィルター
基本的な検索では先頭に[特定の文字][ハイフン/長音符]
を付けることで文字種を絞ることができる(無ければひらがな)。高度な検索ではTYPE
に特定の文字
を指定する。ひらがな → ひ
漢字 → 漢字
ひらがな・漢字 → ひ漢字
アルファベット → a
ルール
機能・仕組み
大まかな流れ
単語のデータ
1. ウィクショナリーの見出し語
ウィクショナリー (Wiktionary) は wiki と dictionary の合成語です。ウィキを使った参加型プロジェクトで、辞書を作成することを目的としています。ウィクショナリーは GFDL および CC BY-SA 3.0 というライセンスを採用しています。ウィクショナリーでの著作はすべてこのライセンスの下に公開されます。これは、複製や翻案を、一般的な著作物よりも自由に誰でもできることを意味します。(ウィクショナリーとは)
こちらからjawiktionary-latest-all-titles.gz
(全項目のページ名一覧)をダウンロードできる。(参考:Wikipedia:データベースダウンロード)
2. 百科辞書
私立PDD図書館の百科辞書は単語がすべてひらがなで、クロスワード検索を作るのに適した辞書である。こちらからテキストファイルをダウンロードできる。
これらの単語データを一つにまとめ、csvファイルにして Google Drive にアップロードした。
csvファイルを読み込み文字列配列へ
単語データが入ったcsvファイルを読み込んで文字列配列にする。
const wordsId = "csvファイルのid";
const wordsFile = DriveApp.getFileById(wordsId); // ファイルを取得
const wordsArray = wordsFile.getBlob().getDataAsString("UTF-8").split(","); // 配列にする
正規表現を用いた検索
基本的な正規表現はこちらを参考にした。
複雑な正規表現についてはこちらにまとめた。
複数マッチした場合すべて置換する
g
オプションが必要
let text = `文字列`;
text = text.replace(/正規表現/g, '置き換える文字列');
文字種フィルター
文字種でフィルターをかけるための正規表現を返す getFilterRgx(type)
を実装した。
function getFilterRgx(type){
if(type === "ひ"){
// ひらがなのみで構成される単語にマッチする正規表現
return /^[\u3040-\u309F]+$/;
}
else if(type === "a"){
// アルファベットのみで構成される単語にマッチする正規表現
return /[a-z]+/;
}
else if(type === "漢字"){
// 漢字のみで構成される単語にマッチする正規表現
return /^[\u3005-\u3006\u4E00-\u9FFF]+$/;
}
else{
// type === "ひ漢字"
// ひらがなと漢字のみで構成される単語にマッチする正規表現
return /^[\u3040-\u309F\u3005-\u3006\u4E00-\u9FFF]+$/;
}
}
正規表現で配列にフィルターをかける
// wordsArray: 単語の配列
let str = "/正規表現/";
let filterRgx = getFilterRgx("TYPE");
// 単語の配列から正規表現にマッチしたものだけを取り出す
let resultArray = wordsArray.filter(RegExp.prototype.test, eval(str));
// マッチした単語に文字種フィルターをかける
resultArray = resultArray.filter(RegExp.prototype.test, eval(filterRgx));
全角を半角に変換
日本語入力の場合の入力ストレスを減らすために全角にも対応した。全角のアルファベット、数字を半角にする getHalfWidth(str)
を実装した。
function getHalfWidth(str){
return str.replace(/[A-Za-z0-9]/g, function(s) {
return String.fromCharCode(s.charCodeAt(0) - 0xFEE0);
});
}
LINE BotとGASの連携
こちらの記事では Flex Message の実装と Channel access token の取得からデプロイまでの詳しい手順が書かれている。
ユーザIDの記録
友だち追加時にスプレッドシートにユーザIDを記録
function doPost(e){
const events = JSON.parse(e.postData.contents).events;
for (var i = 0; i < events.length; i++){
execute(events[i]);
}
}
function execute(event){
const eventType = event.type;
const userId = event.source.userId;
if(eventType === "follow"){
const writeRow = data.getLastRow()+1; // 書く行を取得
data.getRange(writeRow,1).setValue(userId); // A列目にユーザIDを記入
data.getDataRange().removeDuplicates([1]); // ユーザIDの重複を削除
}
}
さいごに
昔自分用につくった単語検索サイト「KOTOBA SAGASHI」を紹介。
- データはLINE版と同じ
- ルールをコピペできるため入力が楽
- シンプルなデザイン
- 今のところ謎解き専用の機能はなし
クロスワード検索
単語検索
辞書検索
ワイルドカード検索
部分一致
謎解き
熟語
英単語
英語