Python
api
機械学習
python2.7

Summpyにバグ(?)があり上手く使えなかったのでforkして修正してみた

大元のSummpyについて

リクルートが提供している要約API。
日本語をよしなに生成してくれるという感じではないが、複数の文からなるパラグラフを投げると、重要度順にランク付けしてそれの高いものを配列で返してくれる。文字数や返す文章の数、ランク付けのアルゴリズムの種類など色々指定できて便利。

Github:https://github.com/recruit-tech/summpy

因みにMacの環境下においては以下のQiitaの記事で自分はセットアップが完了した。多謝。
Summpyを使ってみた

修正版のSummpy-fix

ただし元のPythonがエラーを返していたので、productionでは使えなかった。
なので、forkして修正版を公開してみた。
Github:https://github.com/OnetapInc/summpy-fix

こちらはAWS内で実際にAPIサーバーを立ち上げて要約の処理を行う所まで実施しているので、現時点では問題がない状態。
Mac環境下でのセットアップは以下になります。Mac以外でもbrew経由でのインストールを変更すれば動作します。
Summpy-fixのREADMEと一緒ですが....

brew install mecab
brew install mecab-ipadic
pyenv 2.7.3
pyenv local 2.7.13
pip install git+https://github.com/OnetapInc/summpy-fix.git
pip install mecab-python
python2.7 -m summpy.server -h 127.0.0.1 -p 8080
curl http://127.0.0.1:8080/summarize\?sent_limit\=3\&text\=要約したい文章を入力。