Section 13-2. Worker Node Failure
udemy의 Certified Kubernetes Administrator (CKA) with Practice Tests 강의 및 쿠버네티스 인 액션 (마르코 룩샤)를 참고하여 정리한 글입니다.
Section13. Troubleshooting
Worker Node Failure
- 노드의 상태를 확인한다.
1 2 3 4
$ kubectl get nodes NAME STATUS ROLES AGE VERSION woreker-1 Ready <none> 8d v1.13.0 woreker-2 NotReady <none> 8d v1.13.0
- Not Ready 상태의 노드가 있을 경우 상세 확인한다.
1 2 3 4 5 6 7 8 9 10
$ kubectl describe node worker-2 ... Conditions: Type Status LeastHeartbeatTime Reason Message ---- ------ ------------------ ------ ------- OutOfDisk False ... ... ... MemoryPressure False ... DiskPressure False ... PIDPressure False ... Ready True ...
- 해당 서버의 여유 자원을 확인한다.
1 2 3
$ top $ df -h
- kubelet의 상태를 확인한다.
1 2 3 4 5
# kubelet 상태 확인 $ service kubelet status # kubelet 로그 확인 $ sudo journalctl -u kubelet
- kubelet의 certificates를 확인한다 (만료 여부 등)
1
$ openssl x509 -in /var/lib/kubelet/worker-2.crt -text
This post is licensed under CC BY 4.0 by the author.