Post

Section 13-2. Worker Node Failure

udemy의 Certified Kubernetes Administrator (CKA) with Practice Tests 강의 및 쿠버네티스 인 액션 (마르코 룩샤)를 참고하여 정리한 글입니다.

Section13. Troubleshooting

Worker Node Failure

  • 노드의 상태를 확인한다.
    • 1
      2
      3
      4
      
      $ kubectl get nodes
        NAME        STATUS      ROLES     AGE    VERSION
        woreker-1   Ready       <none>   8d      v1.13.0
        woreker-2   NotReady    <none>   8d      v1.13.0
      
  • Not Ready 상태의 노드가 있을 경우 상세 확인한다.
    • 1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      
      $ kubectl describe node worker-2
        ...
        Conditions:
          Type            Status      LeastHeartbeatTime      Reason      Message
          ----            ------      ------------------      ------      -------
          OutOfDisk       False       ...                     ...         ...
          MemoryPressure  False       ...
          DiskPressure    False       ...
          PIDPressure     False       ...
          Ready           True        ...
      
  • 해당 서버의 여유 자원을 확인한다.
    • 1
      2
      3
      
      $ top
      
      $ df -h
      
  • kubelet의 상태를 확인한다.
    • 1
      2
      3
      4
      5
      
      # kubelet 상태 확인
      $ service kubelet status
          
      # kubelet 로그 확인
      $ sudo journalctl -u kubelet
      
  • kubelet의 certificates를 확인한다 (만료 여부 등)
    • 1
      
      $ openssl x509 -in /var/lib/kubelet/worker-2.crt -text
      
This post is licensed under CC BY 4.0 by the author.