Cloud/GCP

[GCP / Monitoring] GCP ops Agent 설치시 에러 메시지가 발생될때

달빛궁전- 2024. 5. 27. 12:10
GCP에서 GCE의 리소스 Monitoring을 하기 위해 운영 에이전트를 설치가 되지 않을때 내용을 정리하였습니다.
 
운영에이전트는 gcloud에서 설치할 수도 있고, GCE에서 진행할 수도 있습니다.

 

다만, gcloud에서 설치진행이 완료 되었다고 하지만, 실제로 Agent에서 “service google-cloud-ops-agent status” 명령으로 확인시 설치가 안된경우가 있습니다.

수동 설치방안은 아래와 같습니다.

   curl -sSO https://dl.google.com/cloudagents/add-google-cloud-ops-agent-repo.sh
   sudo bash add-google-cloud-ops-agent-repo.sh --also-install

 

docs : https://cloud.google.com/monitoring/monitor-compute-engine-virtual-machine?hl=ko
이렇게 설치하였을 때 아래와 같이 “404 NOT FOUND”가 뜨면서 진행이 안되는 경우가 있습니다.
방화벽에서 이그레스는 Allow되어 있고, 패킷 캡쳐를 해서 보아도 위 에러가 난 “172.217.161.238” 서버에서 별다른 응답을 못받는 것을 확인하였습니다.
 
해결방법은 아래와 같습니다.

 

 
  1. 해당경로의 google-cloud-monitoring.list 삭제
    sudo rm /etc/apt/sources.list.d/google-cloud-monitoring.list
  2. 다시 ops-agent 재설치
    sudo bash add-google-cloud-ops-agent-repo.sh --also-install 
아래는 설치 불가에 대한 원인 예상입니다.
(명확하게 파악할 수가 없어 추측만 하였습니다.)
google-cloud-monitoring.list는 GCP에서 agent를 설치할때 소스 레파지토리를 검색하는 파일로 파악됩니다.
그래서 agent-repo.sh설치 스크립트에서는 해당 파일을 참조하는 것이 보입니다.

명확하게 확인하기 위해 google-cloud-monitoring.list 파일내용을 확인해보려 했으나, 인스턴스를 새로 생성 후 테스트 했으나 해당파일이 생성되지 않았습니다.
GCP에서 어떠한 이유로 설치시에 해당 파일을 참조하였지만, 해당 파일에 현재는 운영 에이전트 설치에 필요한 파일의 경로가 잘못 지정되어 있을 것이라 추정됩니다.

그래서 혹여나 설치가 안되고 에러메시지가 발생된다면 “google-cloud-monitoring.list” 파일 삭제 후 재실행하면 설치 진행이 됩니다.  
파일 위치 : “/etc/apt/sources.list.d/google-cloud-monitoring.list”