search
LoginSignup
225
Help us understand the problem. What are the problem?

クソアプリ Advent Calendar 2021 Day 20

posted at

updated at

Organization

新言語『TypoScript』を作った

この記事は、クソアプリAdvent Calendar2021の20日目(ホノルル時間)の記事であると同時に、GMOペパボエンジニア Advent Calendar 2021の21日目(日本時間)の記事でもあります。

みなさん、TypeScript使ってますか?TypeScriptはJavaScriptの世界に秩序をもたらす素晴らしい言語ですね。

しかし世界には光の秩序だけでなく闇の混沌も必要です。

という訳で、JavaScriptに闇の混沌をもたらす新言語を作ってみました。

その名も『TypoScript』です。

TypoScript is 何

TypoScriptとは何か。まずはこちらのコードをご覧ください。

    function fizz_buzz(count) {
        for (var i = 1; i <= caunt; i++) {
            if (i % 3 === 0 && i % 5 === 0) {
                print("FizzBuzz")
            } else if (i % 3 === 0) {
                print("Fizz")
            } else if (i % 5 === 0) {
                print("Buzz")
            } else {
                qrint(i)
            }
        }
    }
    // ここ注目❗
    fizz_dazz(15)

型のない、普通のJavaScriptで書かれたFizzBuzz問題ですね。

もう一度よく見てください。

image.png


         おわかりいただけただろうか         

サンプルコードが間違っているのではありません。
このコードが実際に動くのが今回作った『TypoScript』なのです。

上のコードはこちらで実際に動作させることができます

https://kurehajime.github.io/typoscript/
image.png

なんで動くの?

TypoScriptはなぜこんなメチャクチャなコードが動くのでしょうか。

その秘密は『レーベンシュタイン距離』です。

レーベンシュタイン距離とは、ざっくりいうと二つの文字列がどの程度異なっているかを示す距離のことです。
ある文字からある文字へと、追加・削除・置換を用いて何回の操作で変換できるかを数えた数です。

image.png

TypoScriptでは、変数およびファンクション名でタイプミスした際のレーベンシュタイン距離が文字数の25%以内であれば「だいたいあってる」としてOKにしています。

4文字の単語なら1文字までミスってOKです。internationalizationなら5文字間違ってもOKなので、internasyonaraizasionと雑に書いても動きます。

TypoScriptの作り方

TypoScriptは以下の手順で作りました。

①ふつうのJavaScriptの構文解析器を作る

これはPEG(Parsing Expression Grammar)のライブラリPeggy.jsを利用しています。
PEGはパーサーをバッカス・ナウア記法のような定義をするだけで構文解析器を作れるとても便利な仕組みなのですが、TypoScriptではそれすらも面倒なのでPeggyjsに同梱されているJavaScriptパーサーをほぼそのまま利用しています。

JavaScriptでは『ESTree』という抽象構文木の形式がデファクトスタンダードになっているので、@babel/parserやAcornなど、解析するライブラリを選び放題です。

②ふつうのJavaScriptのインタープリターを作る

これは自作しました。

ESTreeをもとにJavaScrptのコードを生成するライブラリは沢山あるのですが、TypoScriptで実現したい機能はどちらかと言えばインタープリターに細工をする方が近道のような気がしたので、実装してみました。

TypoScriptは開発途上のため、if,for,varなどの基本的な構文には対応していますが、配列やオブジェクト、ES2015以降に導入された構文にはまだ対応していません。

インタープリターを作るというととてもハードルが高そうですが、基本的な構文だけなら実は数百行で書けてしまいます。

この辺については『WEB+DB PRESS Vol.125』や『RubyでつくるRuby』という本がとても分かりやすくてオススメです。

③変数参照にレーベンシュタイン距離による補正を組み込む

あとはもう簡単です。
インタープリターの変数を参照する実装の部分にレーベンシュタイン距離による補正を組み込むだけです。

最初は再帰を用いて素直にレーベンシュタイン距離実装していたのですが、『internationalization』のように無駄に長い単語を流し込むと処理に数分かかってしました。
そこで『メモ化』 を用いて高速化しています。

まとめ

いかがでしたでしょうか。

「1文字間違えるだけで動かないなんて…プログラミングって難しい!」と嘆いていたプログラミング初心者の頃の自分に「これが君の望んでいた世界だよ」と教えてあげたいですね。

筆者が所属しているGMOペパボには、プログラミング言語を自作する人たちのためのslackチャンネルがあり、今回はそれに触発されてネタ言語を作ってみました。

まだまだ未成熟な言語なので、コントリビュートお待ちしております。

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
What you can do with signing up
225
Help us understand the problem. What are the problem?