Monitoring """""""""" Schéma de base '''''''''''''' .. graphviz:: digraph "arch" { rankdir="LR" subgraph cluster_hypervisor { rankdir="TD" label="Hypervisor #1" "exporter1"[label="exporter"] subgraph cluster_machine1 { label="Service VM" "prometheus" "alertmanager" } subgraph cluster_machine2 { label="Service VM" "exporter2"[label="exporter"] } subgraph cluster_machine3 { label="Service VM" "exporter3"[label="exporter"] } } subgraph cluster_hypervisor2 { rankdir="TD" label="Hypervisor #2" "exporter4"[label="exporter"] subgraph cluster_machine4 { label="Service VM" "exporter5"[label="exporter"] } subgraph cluster_machine5 { label="Service VM" "exporter6"[label="exporter"] } } prometheus->alertmanager[color="red"] prometheus->exporter1[color=blue4] prometheus->exporter2[color=blue4] prometheus->exporter3[color=blue4] prometheus->exporter4[color=blue4] prometheus->exporter5[color=blue4] prometheus->exporter6[color=blue4] ood[label="Ops"] alertmanager -> ood[label="Notification"] } Description ''''''''''' L'architecture proposée se repose sur l'utilisation de `Prometheus` en remplacement de `shinken` dont l'avenir est perçu comme incertain. `Prometheus` sera mis en place avec un lancement d'alertes vers `AlertManager`, l'outil d'alerting livré avec `prometheus`. `prometheus` fera le monitoring de toutes les machines et tous les services du cluster de management au travers d'exporteurs de statistiques. Dans le cas d'un portage d'une sonde de type `nrpe`, l'utilisation de l'exporteur ``nrpe_exporter`` peut être envisagé. Les notification d'alertes se feront par mail. En cas d'adhérences fortes avec une interface de type `nagios`, un `nagios` pourra être installé afin de garantir l'interfaçage avec le centre de calcul. Un travail d'intégration aux systèmes existants et a venir est à prévoir. .. raw:: latex \clearpage