はじめに
- Google's SRE Book を読んで分散合意アルゴリズムかっこいいと思ったので etcd を試してみた
- せっかくなので分散ロックマネージャを実装してみる
etcd とは
- 分散合意アルゴリズムを使った KVS
- 10000 write/sec 程度と高速で信頼性が高く k8s のバックエンドで利用されるなど実績もある
- 公式ドキュメント
使ってみる
ダウンロード
- https://github.com/coreos/etcd/releases/ から etcd の実行バイナリをダウンロードする
- zip を展開
実行
./etcd.ext
クライアントで動作確認
# 環境変数の設定
$ export ETCDCTL_API=3
# 値の記録
$ ./etcdctl.ext put mykey "value1"
OK
# 値の取得
./etcdctl.ext get mykey
mykey
value1
# 値の取得(メタデータも含めて JSON で取得)
$ ./etcdctl.ext get --write-out="json" mykey
{"header":{"cluster_id":14841639068965178418,"member_id":10276657743932975437,"revision":4,"raft_term":2},"kvs":[{"key":"bXlrZXk=","create_revision":2,"mod_revision":4,"version":3,"value":"dmFsdWUgMQ=="}],"count":1}
複数サーバーで動作させる
- 待ち受けポートを変えれば同じマシンで複数の etcd を動かせる
サーバー用ウィンドウその1で実行
TOKEN=token-01
CLUSTER_STATE=new
NAME_1=machine-1
NAME_2=machine-2
NAME_3=machine-3
HOST_1=127.0.0.1
HOST_2=127.0.0.1
HOST_3=127.0.0.1
PORT_1A=2380
PORT_1B=2379
PORT_2A=2390
PORT_2B=2389
PORT_3A=2400
PORT_3B=2399
CLUSTER=${NAME_1}=http://${HOST_1}:${PORT_1A},${NAME_2}=http://${HOST_2}:${PORT_2A},${NAME_3}=http://${HOST_3}:${PORT_3A}
THIS_NAME=${NAME_1}
THIS_IP=${HOST_1}
THIS_PORT_A=${PORT_1A}
THIS_PORT_B=${PORT_1B}
./etcd --data-dir=data.1.etcd --name ${THIS_NAME} \
--initial-advertise-peer-urls "http://${THIS_IP}:${THIS_PORT_A}" --listen-peer-urls "http://${THIS_IP}:${THIS_PORT_A}" \
--advertise-client-urls "http://${THIS_IP}:${THIS_PORT_B}" --listen-client-urls "http://${THIS_IP}:${THIS_PORT_B}" \
--initial-cluster ${CLUSTER} \
--initial-cluster-state ${CLUSTER_STATE} --initial-cluster-token ${TOKEN}
サーバー用ウィンドウその2で実行
TOKEN=token-01
CLUSTER_STATE=new
NAME_1=machine-1
NAME_2=machine-2
NAME_3=machine-3
HOST_1=127.0.0.1
HOST_2=127.0.0.1
HOST_3=127.0.0.1
PORT_1A=2380
PORT_1B=2379
PORT_2A=2390
PORT_2B=2389
PORT_3A=2400
PORT_3B=2399
CLUSTER=${NAME_1}=http://${HOST_1}:${PORT_1A},${NAME_2}=http://${HOST_2}:${PORT_2A},${NAME_3}=http://${HOST_3}:${PORT_3A}
THIS_NAME=${NAME_2}
THIS_IP=${HOST_2}
THIS_PORT_A=${PORT_2A}
THIS_PORT_B=${PORT_2B}
./etcd --data-dir=data.2.etcd --name ${THIS_NAME} \
--initial-advertise-peer-urls "http://${THIS_IP}:${THIS_PORT_A}" --listen-peer-urls "http://${THIS_IP}:${THIS_PORT_A}" \
--advertise-client-urls "http://${THIS_IP}:${THIS_PORT_B}" --listen-client-urls "http://${THIS_IP}:${THIS_PORT_B}" \
--initial-cluster ${CLUSTER} \
--initial-cluster-state ${CLUSTER_STATE} --initial-cluster-token ${TOKEN}
サーバー用ウィンドウその3で実行
TOKEN=token-01
CLUSTER_STATE=new
NAME_1=machine-1
NAME_2=machine-2
NAME_3=machine-3
HOST_1=127.0.0.1
HOST_2=127.0.0.1
HOST_3=127.0.0.1
PORT_1A=2380
PORT_1B=2379
PORT_2A=2390
PORT_2B=2389
PORT_3A=2400
PORT_3B=2399
CLUSTER=${NAME_1}=http://${HOST_1}:${PORT_1A},${NAME_2}=http://${HOST_2}:${PORT_2A},${NAME_3}=http://${HOST_3}:${PORT_3A}
THIS_NAME=${NAME_3}
THIS_IP=${HOST_3}
THIS_PORT_A=${PORT_3A}
THIS_PORT_B=${PORT_3B}
./etcd --data-dir=data.3.etcd --name ${THIS_NAME} \
--initial-advertise-peer-urls "http://${THIS_IP}:${THIS_PORT_A}" --listen-peer-urls "http://${THIS_IP}:${THIS_PORT_A}" \
--advertise-client-urls "http://${THIS_IP}:${THIS_PORT_B}" --listen-client-urls "http://${THIS_IP}:${THIS_PORT_B}" \
--initial-cluster ${CLUSTER} \
--initial-cluster-state ${CLUSTER_STATE} --initial-cluster-token ${TOKEN}
クライアント用のウィンドウで動作確認
export ETCDCTL_API=3
HOST_1=10.240.0.17
HOST_2=10.240.0.18
HOST_3=10.240.0.19
ENDPOINTS=127.0.0.1:2379,127.0.0.1:2389,127.0.0.1:2399
./etcdctl --endpoints=$ENDPOINTS member list
Go のクライアントライブラリからアクセスしてみる
コード
client.go
package main
import (
"github.com/coreos/etcd/clientv3"
"time"
"fmt"
"log"
"golang.org/x/net/context"
)
var requestTimeout = 5 * time.Second
func main() {
cli, err := clientv3.New(clientv3.Config{
Endpoints: []string{"127.0.0.1:2379", "127.0.0.1:2389", "127.0.0.1:2399"},
DialTimeout: 5 * time.Second,
})
if err != nil {
panic(err)
}
defer cli.Close()
_, err = cli.Put(context.TODO(), "foo", "bar")
if err != nil {
log.Fatal(err)
}
ctx, cancel := context.WithTimeout(context.Background(), requestTimeout)
resp, err := cli.Get(ctx, "foo")
cancel()
if err != nil {
log.Fatal(err)
}
for _, ev := range resp.Kvs {
fmt.Printf("%s : %s\n", ev.Key, ev.Value)
}
}
インストール
-
github.com/coreos/etcd
は glide で依存パッケージを管理しているので glide から最新のバージョンをインストールする-
go get
とかgovendor
とかでインストールすると依存パッケージのバージョンがそろわずに正常に動作しなかった
-
# glide のインストール
go get github.com/Masterminds/glide
go install github.com/Masterminds/glide
# パッケージのインストール
glide create
glide install
動作確認
$ go run client.go
foo : bar
分散ロックマネージャを実装する
- etcd はトランザクション機能で一貫性が保証されるので、これを利用して分散環境でリソースのロック情報を共有するための分散ロックマネージャを実装してみる
コード
- REST API を提供するウェブサーバーとして実装した
- PUT でロック取得
- GET でステータス確認
- DELETE でロック開放
- etcd サーバーの設定は先に起動しているものをハードコーディングしてある
package main
import (
"encoding/json"
"github.com/coreos/etcd/clientv3"
"golang.org/x/net/context"
"log"
"net/http"
"time"
)
var servers = []string{"127.0.0.1:2379", "127.0.0.1:2389", "127.0.0.1:2399"}
var timeout = 5 * time.Second
func main() {
http.HandleFunc("/", func(w http.ResponseWriter, r *http.Request) {
switch r.Method {
case "PUT":
lockHandler(w, r)
case "GET":
statusHandler(w, r)
case "DELETE":
unlockHandler(w, r)
}
})
log.Fatal(http.ListenAndServe(":8888", nil))
}
func lockHandler(w http.ResponseWriter, r *http.Request) {
// decode request
req := struct {
Resource string `json:"resource"`
UserID string `json:"user_id"`
}{}
err := json.NewDecoder(r.Body).Decode(&req)
if err != nil {
http.Error(w, err.Error(), http.StatusBadRequest)
return
}
// create client
cli, err := clientv3.New(clientv3.Config{
Endpoints: servers,
DialTimeout: timeout,
})
if err != nil {
http.Error(w, err.Error(), http.StatusInternalServerError)
return
}
defer cli.Close()
// lock resource if unlocked
key, val := req.Resource, req.UserID
ctx, cancel := context.WithTimeout(context.Background(), timeout)
txnRes, err := cli.Txn(ctx).
If(clientv3.Compare(clientv3.CreateRevision(key), "=", 0)).
Then(clientv3.OpPut(key, val)).
Commit()
cancel()
// create result
res := struct {
Succeeded bool `json:"succeeded"`
}{
Succeeded: txnRes.Succeeded,
}
json.NewEncoder(w).Encode(&res)
}
func statusHandler(w http.ResponseWriter, r *http.Request) {
// decode request
req := struct {
Resource string `json:"resource"`
}{}
err := json.NewDecoder(r.Body).Decode(&req)
if err != nil {
http.Error(w, err.Error(), http.StatusBadRequest)
return
}
// create client
cli, err := clientv3.New(clientv3.Config{
Endpoints: servers,
DialTimeout: timeout,
})
if err != nil {
http.Error(w, err.Error(), http.StatusInternalServerError)
return
}
defer cli.Close()
// get status
ctx, cancel := context.WithTimeout(context.Background(), timeout)
getRes, err := cli.Get(ctx, req.Resource)
cancel()
if err != nil {
http.Error(w, err.Error(), http.StatusInternalServerError)
return
}
// create result
res := struct {
Locked bool `json:"locked"`
UserID string `json:"user_id"`
}{
Locked: len(getRes.Kvs) > 0,
}
if res.Locked {
res.UserID = string(getRes.Kvs[0].Value)
}
json.NewEncoder(w).Encode(&res)
}
func unlockHandler(w http.ResponseWriter, r *http.Request) {
// decode request
req := struct {
Resource string `json:"resource"`
UserID string `json:"user_id"`
}{}
err := json.NewDecoder(r.Body).Decode(&req)
if err != nil {
http.Error(w, err.Error(), http.StatusBadRequest)
return
}
// create client
cli, err := clientv3.New(clientv3.Config{
Endpoints: servers,
DialTimeout: timeout,
})
if err != nil {
http.Error(w, err.Error(), http.StatusInternalServerError)
return
}
defer cli.Close()
// unlock resource if locked
key, val := req.Resource, req.UserID
ctx, cancel := context.WithTimeout(context.Background(), timeout)
txnRes, err := cli.Txn(ctx).
If(clientv3.Compare(clientv3.Value(key), "=", val)).
Then(clientv3.OpDelete(key)).
Commit()
cancel()
// create response
res := struct {
Succeeded bool `json:"succeeded"`
}{
Succeeded: txnRes.Succeeded,
}
json.NewEncoder(w).Encode(&res)
}
動作確認
# ロックの取得
$ curl -H "Accept: application/json" -H "Content-type: application/json" -X PUT -d '{"resource":"/path/to/my/file1","user_id":"user1"}' http://localhost:8888
{"succeeded":true}
# ロックの確認
$ curl -H "Accept: application/json" -H "Content-type: application/json" -X GET -d '{"resource":"/path/to/my/file1"}' http://localhost:8888
{"locked":true,"user_id":"user1"}
# ロックの開放
$ curl -H "Accept: application/json" -H "Content-type: application/json" -X DELETE -d '{"resource":"/path/to/my/file1","user_id":"user1"}' http://localhost:8888
{"succeeded":true}
# 開放できていることの確認
$ curl -H "Accept: application/json" -H "Content-type: application/json" -X GET -d '{"resource":"/path/to/my/file1"}' http://localhost:8888
{"locked":false,"user_id":""}
簡単な解説
// lock resource if unlocked
key, val := req.Resource, req.UserID
ctx, cancel := context.WithTimeout(context.Background(), timeout)
txnRes, err := cli.Txn(ctx).
If(clientv3.Compare(clientv3.CreateRevision(key), "=", 0)).
Then(clientv3.OpPut(key, val)).
Commit()
cancel()
// create result
res := struct {
Succeeded bool `json:"succeeded"`
}{
Succeeded: txnRes.Succeeded,
}
- トランザクション処理の部分が肝なのでそこだけ
- トランザクション処理は
(*clientv3.Client).Txn
で開始 -
Txn.If
でトランザクションの実行条件を指定- 上のコードの
clientv3.Compare(clientv3.CreateRevision(key), "=", 0)
は作成リビジョンが 0 の場合ということでキーが未登録の場合に成功処理を実行する
- 上のコードの
-
Txn.Then
で実行条件が真の場合の処理を指定- 上のコードでは
clientv3.OpPut(key, val)
ということで、条件とあわせると「キーが未登録ならバリューをセットする」という処理になる
- 上のコードでは
-
Txn.Else
で実行条件が偽の場合の処理を指定- 上のコードでは必要がないので記載していない
-
Txn.Commit
で一連の処理を実行する - github.com/coreos/etcd/clientv3/concurrency パッケージを使うと口座間の預金の振込みのようなさらに複雑なトランザクション処理もできるということだがこちらはまだ試していない