LoginSignup
4

More than 5 years have passed since last update.

k8s source code reading #0 に行ってきた。

Last updated at Posted at 2019-01-15

TL;DR

  • Kubernetesのソースを読むきっかけとして、k8s source code reading #0という勉強会にいってみた。
  • StatefulSetのプルリクをテーマにソースを読んでみた。
  • Goはあまり読めないけどテーマに集中して読んだら、収穫は確実にあった。

k8s source code reading とは

conpassのイベントページに概要がありますが、今回は#0ということで、色々と進め方も議論しながらソースコード・リーディングをしてみた、という感じでした。

色々な勉強会を主催されていたり登壇されている方々が出席されており、メンバーの豪華さに一般人の私は少し気圧され気味でした。

そして、このグループの目標は日本からのコントリビュータを増やすこと、だそうです。

グループ分けの結果

初回ということで、自己紹介に加えて自分が読みたい箇所を一つあげて、それらをグループ分けしていきます。結果は以下のようになったのですが、kube-apiserverの人気が高かったです(テーブル2つ、10名弱)。

私はStatefulSet周りを読みたかったということで「その他」のグループになりました。ちなみにその他は3人メンバーがいましたが、以下のようにテーマを持っていました。

  • eksctlを読みたい
  • kubeflow周りを読みたい
  • StatefulSetを中心にコントローラを読みたい(私)

私が読んでみたところ

昨年末のアドベントカレンダーでも書いたのですが、StatefulSetでノード障害時にポッドが移動されないという問題に対するプルリクがありました。このプルリク自体は却下されているのですが、何をしようとしていたものなのかは当時から理解したかったため、それを中心に読んでみることにしました。

対象のプルリクエストはforce deleting sts pods when nodes get lostというもので、StatefulSetのソースにいくつかの修正がされています。

StatefulSetのソースはどこにあるか

ソースは以下になります。

kubernetes/pkg/controllerには他にもdeploymentやdaemonなどのフォルダがあり、それぞれのコントローラのソースが置かれています。

force deleting sts pods when nodes get lost #54472 の意図

このプルリクはノード障害を検知し、その上で稼動しているポッドを"force delete"することが目的です。そのため、下記モジュールの修正が根幹となります。

このモジュールではStatefulSetの状態を変更する処理を担当しており、具体的にはfunc \(ssc *defaultStatefulSetControl\) updateStatefulSetの中に処理が実装されています。

#54472のプルリクではそのうちの条件分岐に手が入れられており、PodがisFailedな時だけでなく、NodeLostの際にもpkg/controller/statefulset/stateful_pod_control.goのDeleteStaefulPodが呼び出される(=ポッドを削除する)ように修正されています。

さらにこのDeleteStaefulPodと呼び出し元にも修正がされており、PodのDelete時にオプションが渡せるようになっています。

pkg/controller/statefulset/stateful_pod_control.goの修正部分
# 修正前
func (spc *realStatefulPodControl) DeleteStatefulPod(set *apps.StatefulSet, pod *v1.Pod) error {
    err := spc.client.Core().Pods(set.Namespace).Delete(pod.Name, nil)

# 修正後
func (spc *realStatefulPodControl) DeleteStatefulPod(set *apps.StatefulSet, pod *v1.Pod, options *metav1.DeleteOptions) error {
    err := spc.client.Core().Pods(set.Namespace).Delete(pod.Name, options)

ここから先はclient-goの範囲になるようで読めていないのですが、意図からしてpod.Spec.TerminationGracePeriodSecondsを0で上書きするオプションを渡しているようです。これによって強制削除が可能となるのが、#54472のプルリクの詳細であると今回は理解しました(違っていたらすみません)。

まとめ

StatefulSetのプルリクを中心にコードを追ってみましたが、仕様がコードベースで確認できるとやはり良いですね。私自身の課題として、そもそもKubernetesのkube-apiserverやController、client-goなどの関係を理解できていないことに気付きましたので、改めてその辺りを調べたいというモチベーションが湧いてきました。

Kubernetesについて何か知りたい・調べたいことがあれば、k8s source code reading、おすすめです。私は雰囲気でしかGoを読めませんし、そもそも書けませんが、そんなライトユーザでも学びがありました。

参加者の皆様、様々な情報の共有、ありがとうございました。
次回お会いできることを楽しみにしています。

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4