(夢)ブロックチェーン・ストレージの活用事業を立ち上げたい
ブロックチェーン・ストレージにビジネス面で興味がある。私一人では到底できない話なので、
どなたか賛同いただける方と取り組むことができればと思っている。当初は大学等との共同研究からかも。
ネタ的には、いわゆるグリッドコンピューティングに近い話(実需あり)。
まずはブロックチェーン・ストレージ自体の近況について、リンク紹介を中心にさらりと触れた上で、考え中のビジネス、ヒトゲノム情報解析向けのストレージ・サービスについて書きたい。
「ブロックチェーンでストレージ」、についての一般論は、
ブロックチェーンを生かしたクラウドストレージの安全策
が参考になる(概論すぎて、あまり参考にならなそうだが)。
#(1) Storj
本家 https://storj.io/
##Storjとは?
以下の技術的解説を読むと良い。Proof-of-Storageがキーワード。
「ストージ」と発音するようです。Storjの利用者は、P2P型のネットワークを形成したネットワーク内の他人のPCにファイルを保存し、その対価として仮想通貨(Storjcoin X: 通称SJCX)を払います。また、自分自身のPCに他人のファイルを保存すると、SJCXを受け取ることができます。
Storjは当初、dropboxとガチンコ勝負というビッグマウスが注目されたことがややマイナスに働いたのではないかと考える。
今月に、Storjは、ホワイトペーパーをアップデートしている。
Abstract
A peer-to-peer cloud storage network implementing client-side encryption
would allow users to transfer and share data without reliance on a
third party storage provider. The removal of central controls would mitigate
most traditional data failures and outages, as well as significantly
increase security, privacy, and data control. Peer-to-peer networks are
generally unfeasible for production storage systems, as data availability
is a function of popularity, rather than utility. We propose a solution in
the form of a challenge-response verification system coupled with direct
payments. In this way we can periodically check data integrity, and offer
rewards to peers maintaining data. We further propose a model for
addressing access and performance concerns with a set of independent or
federated nodes
新ホワイトペーパーには、dropboxという語はない。
ここ数ヶ月で、storjクライアント向けの各種SDKが公開されているようであり、使い始めるならば今からかもしれない。
- 例、python SDK https://github.com/Storj/storj-python-sdk
#(2) bigchaindb
本家 https://www.bigchaindb.com/
こちらのホワイトペーパーもビッグマウスが少し目立っていた。裏方のデータベースとしてrethinkdbを担いでいたが、rethinkdbの開発元がクローズしてしまったこともあってから、先月から、裏方のデータベースにmongodbも使えるようにすると、言い始めた。今後はmongodbベースになったほうが安心感があるのかもしれない。
オープンソースなのは良い。pythonベースでWAFはしてはflaskが使われている(はず)。
気になった人はソースを眺めてみよう。絶賛開発中。
ドキュメントは割合と整備されてきている感じ。
#(3) Proof log / Broof
本家 https://sivira.co/
独自開発のブロックチェーン「Broof」、
および、それを活用した ログストレージサービス「Proof log」。
国産だ。メンバーがいけてる感じで期待が持てる。
クローズドソースのため、委細分からないが、
日本語でユースケースが読める。
https://sivira.co/pr/press/20161019-01-ja.html
バックエンドでは、PostgresとCassandraを使っているとのこと。
#事業プラン ヒトゲノム情報解析向けのストレージングサービス
ヒトゲノム情報解析には、ペタバイト級のストレージがずらずら必要
21世紀に終わった頃に完了した、人のゲノム情報の解析研究「ヒトゲノム計画」。これ自体は、
wikipediaや世界史の教科書に載るような話。その後、米国VBを中心に解析技術は大きく進歩し、現在では、中国企業の参戦もあって、個々人から概ねのゲノム情報を抽出すること自体1週間以内・1000ドル以下で行えるようになっている。
現状の大きな課題は、情報解析。計算量が多い上に、ストレージ容量も多量に必要。
このあたり、いわゆるバイオインフォマティクスとして取り組まれていること。委細は記さないが、興味ある方は,以下を出発点に読み解いてほしい。
http://bi.biopapyrus.net/
pythonでゲノム解析、といったあたりのメモ書きを現在進行形で作成中なので、まとまったら、いずれgistあたりに晒したい。
ヒトゲノム情報解析には、プライバシー保護が不可欠
NHKクローズアップ現代いわく、生死にかかわる情報を含みうるヒトの遺伝子(≒ヒトゲノム)は「究極の個人情報」。プライバシー保護が不可欠だ。
http://www.nhk.or.jp/gendai/articles/1817/index.html
それゆえ、ヒトゲノムの解析は、厳重にセキュリティが担保された研究機関のスーパーコンピューターにおいて行われているのが現状だ。
改ざん不可能でセキュアで比較的安価なストレージへの大きな需要。
人に限らす生物のゲノム解析に携わっいる方々は、大きく同意するところだろう。
ひとまずは比較的安価なストレージというだけでも良い。
読み取ったゲノム情報をインターネット上の「生物データベース」に公開することが、
ゲノム系の論文の査読を通すの必要条件となっている。これらの情報を使っての追加試験をするために、安価なストレージをペタバイト単位で契約したいというニーズを、世界中のドライバイオ(計算生物学)研究者は持っている。
dropboxにはない、ペタバイト単位での契約コースが安価で用意されれば、世界中のドライバイオ研究者たちが続々と契約を申し込むのではないかと思われる。
...つまりはエクサバイト級のストレージを用意してね、ということ。
完全性の担保と機密性の担保については、その後にじっくりと取り組んでも良いと思う。
こうしたビジネスに興味を持った方は。
ブロックチェーン・ストレージを使って、ドライバイオ研究者向けのストレージサービスを提供することに十分な興味を持ったブロックチェーン界隈の技術者の方は、他に情報源が思い浮かばないので、とりあえず私にコンタクトしてください(笑)。
生物医学への進歩にどう貢献しうるのか、など具体的な話をすることができます。
ドライバイオ研究者の方々のリテラシーを考えるに、開発言語はpythonかJava/scalaが良いと考える。鬼のように情報量の多い世界なので、普通の意味での情報共有webサービスと組み合わせてのサービス化が良いのではないかと思う。このあたりも含め、bigchaindbを使うかどうかはともかく、
フロントエンドは、良きpython使いの方に参加いただいた上で、
flask+mongoで作るのが良いのかもしれない。
今回は、このあたりまで。
近未来の話としては、ゲノムベースの保険事業なんてのも考えられるがこちらは、来年以降のアドベントカレンダーにて。
ブロックチェーン界隈の方、少し早いけど、メリー・クリスマス♪