Monitoring Serveur
Visibilité complète sur vos serveurs, du bare-metal aux instances cloud. Surveillez les ressources système, découvrez automatiquement plus de 100 services, suivez les conteneurs et bénéficiez d'alertes préconfigurées — le tout avec un seul agent léger.
Tout ce que font vos serveurs, surveillé
Un seul agent couvre les ressources système, les services applicatifs, les conteneurs et la santé du matériel.
Ressources système
CPU, mémoire, disque, réseau, swap et load average avec une granularité par coeur et par point de montage. Chaque métrique est échantillonnée à une résolution de 10 secondes, vous offrant une visibilité quasi temps réel sur les tendances de consommation et les pics de charge.
Plus de 100 services
Bases de données, serveurs web, caches, files de messages et bien plus — chacun avec des métriques dédiées et des tableaux de bord préconfigurés. Déployez une nouvelle instance MySQL ou Redis et elle apparaît dans votre panel en quelques minutes, sans aucune configuration.
Conteneurs
Conteneurs Docker et containerd avec métriques CPU, mémoire, I/O disque et réseau par conteneur. Les services s'exécutant dans les conteneurs sont auto-découverts comme les services bare-metal, vous offrant une visibilité applicative sur les charges conteneurisées.
Monitoring GPU
Utilisation GPU NVIDIA, mémoire, température, consommation électrique et métriques encodeur/décodeur via nvidia-smi. Essentiel pour l'entraînement ML/IA, l'inférence et les charges de rendu où la performance GPU impacte directement le débit applicatif.
Qu'est-ce que le monitoring serveur ?
Le monitoring serveur est la pratique d'observer en continu la santé, les performances et la disponibilité des serveurs physiques et virtuels qui alimentent vos applications et services. Il consiste à collecter des métriques du système d'exploitation, à suivre la consommation des ressources, à détecter les anomalies et à alerter les équipes d'exploitation lorsque des seuils sont dépassés.
L'infrastructure moderne s'étend sur des serveurs bare-metal, des machines virtuelles, des instances cloud et des conteneurs — souvent répartis entre plusieurs fournisseurs et régions. Sans un monitoring serveur complet, les équipes naviguent à l'aveugle : elles ne peuvent pas identifier les goulets d'étranglement, planifier la capacité ou réagir aux incidents avant que les utilisateurs ne soient affectés. Une solution de monitoring fiable transforme la gestion réactive en gestion proactive de l'infrastructure.
Un monitoring serveur efficace va au-delà de simples vérifications ping. Il nécessite une visibilité approfondie sur les schémas d'utilisation CPU, la pression mémoire, la latence des I/O disque, le débit réseau et les services exécutant sur chaque hôte. Il doit corréler les métriques à travers toute la pile — des capteurs matériels aux indicateurs applicatifs — pour fournir une image complète de la santé du serveur. Les meilleures solutions de monitoring offrent également une rétention longue durée pour la planification de capacité, des règles d'alerte préconfigurées qui détectent immédiatement les problèmes courants, et une découverte automatique des services qui suit l'évolution de votre infrastructure. Bleemeo fournit tout cela via un seul agent léger qui s'installe en 60 secondes et commence à collecter des données immédiatement.
Comment fonctionne l'agent Glouton
Un seul binaire léger collecte les métriques et les logs de votre serveur et les envoie de manière sécurisée vers Bleemeo Cloud.
Binaire unique, empreinte minimale
Glouton est un binaire Go unique qui s'installe en une commande et s'exécute comme un service système. Il occupe environ 50 Mo sur disque et utilise 70-80 Mo de RAM en fonctionnement normal — environ 3% de CPU sur un serveur moderne. L'agent est conçu pour être invisible pour vos charges de travail : il regroupe et compresse les données de télémétrie avant de les transmettre via MQTT et HTTPS, maintenant la charge réseau au minimum. L'installation se fait en une seule ligne : fournissez votre identifiant de compte et votre clé d'enregistrement, et l'agent s'enregistre auprès de Bleemeo Cloud en quelques secondes.
Résolution de 10 secondes et auto-découverte continue
Toutes les 10 secondes, Glouton échantillonne les métriques système — CPU, mémoire, I/O disque et réseau — vous offrant une visibilité quasi temps réel sur les changements de performance. En parallèle, l'agent sonde en continu les ports TCP ouverts pour détecter les services en exécution. Lorsqu'il trouve une nouvelle base de données, un serveur web ou une file de messages, il commence automatiquement à collecter des métriques spécifiques au service. Si vous déployez une nouvelle instance Redis ou démarrez un conteneur PostgreSQL, les métriques apparaissent dans votre tableau de bord en quelques minutes — sans changement de configuration ni redémarrage de l'agent.
Configuration flexible
Bien que Glouton fonctionne immédiatement sans aucune configuration, les utilisateurs avancés peuvent personnaliser le comportement via des fichiers YAML placés dans /etc/glouton/conf.d/. Chaque paramètre peut également être surchargé via des variables d'environnement préfixées par GLOUTON_, ce qui facilite les déploiements via conteneurs et cloud-init. Les modifications de configuration sont prises en compte automatiquement — l'agent se recharge sans redémarrer, assurant une collecte de métriques continue. Vous pouvez définir des cibles de vérification personnalisées, ajuster les seuils, ajouter des équipements SNMP ou configurer les chemins de collecte de logs, le tout via le même modèle de configuration déclaratif.
Plus de 60 métriques OS prêtes à l'emploi
L'agent Glouton collecte automatiquement des métriques système complètes — aucune configuration requise.
Métriques CPU
Utilisation détaillée du processeur ventilée par type et par coeur.
- User, system, idle, iowait
- Nice, irq, softirq, steal
- Détail par coeur
- Changements de contexte par seconde
- Nombre et états des processus
Métriques mémoire
Suivi complet de l'utilisation mémoire et swap.
- Utilisée, libre, en cache, buffers
- Mémoire disponible (réellement utilisable)
- Swap utilisée et libre
- Taux d'I/O swap
- Hugepages (si applicable)
Métriques disque
Capacité de stockage et performance I/O par point de montage et par périphérique.
- Espace utilisé et disponible
- Utilisation des inodes
- Débit lecture/écriture (Mo/s)
- IOPS (opérations par seconde)
- Latence I/O et profondeur de file
Métriques réseau
Bande passante par interface, erreurs et suivi des connexions.
- Bits reçus/envoyés par seconde
- Paquets entrants/sortants
- Erreurs et paquets perdus
- États des connexions TCP
- Statut actif/inactif de l'interface
Métriques système
Santé du système d'exploitation et indicateurs au niveau du noyau.
- Load average (1, 5, 15 min)
- Uptime du système
- Descripteurs de fichiers ouverts
- Utilisateurs connectés
- Suivi de la version du noyau
Métriques de processus
Suivi des ressources par processus pour les applications critiques.
- Utilisation CPU par processus
- Mémoire par processus (RSS)
- Nombre de threads
- Descripteurs de fichiers ouverts
- Alerte processus actif/arrêté
Découverte automatique des services
L'agent Glouton détecte automatiquement les services en cours d'exécution sur vos serveurs — aucune configuration manuelle nécessaire. Il reconnaît plus de 100 services prêts à l'emploi, incluant les bases de données, serveurs web, caches, files de messages, moteurs de recherche et environnements d'exécution applicatifs.
Lorsqu'un service est découvert, Bleemeo commence immédiatement à collecter des métriques spécifiques au service. Par exemple, une instance MySQL découverte obtient le débit de requêtes, les requêtes lentes, le nombre de connexions et les métriques de lag de réplication. Un Nginx découvert obtient les taux de requêtes, les connexions actives et la ventilation des codes de réponse.
La découverte est continue : lorsque vous déployez un nouveau service, il apparaît dans votre tableau de bord en quelques minutes. Lorsqu'un service s'arrête, vous êtes alerté immédiatement. Si un service change de port ou qu'une nouvelle version est déployée, l'agent s'adapte sans intervention manuelle. Cette approche zéro-configuration élimine le travail répétitif de maintenance des configurations de monitoring à mesure que votre infrastructure évolue — plus de services oubliés fonctionnant sans surveillance en production.
Bases de données
MySQL, PostgreSQL, MongoDB, Redis, Elasticsearch, Cassandra, InfluxDB, MemcachedServeurs web
Apache, Nginx, HAProxy, Traefik, Varnish, EnvoyFiles de messages
RabbitMQ, Kafka, ActiveMQ, Mosquitto, NATSEnvironnements et applications
Java/JMX, Node.js, PHP-FPM, Python UWSGI, .NET, GoMonitoring des conteneurs intégré
Glouton détecte automatiquement les conteneurs Docker et containerd s'exécutant sur vos serveurs. Chaque conteneur obtient des métriques individuelles — utilisation CPU, consommation mémoire, I/O disque et trafic réseau — sans aucune configuration. Les noms, images et labels des conteneurs sont attachés en tant que métadonnées, facilitant le filtrage et le regroupement des conteneurs dans les tableaux de bord.
Ce qui rend le monitoring de conteneurs de Bleemeo unique, c'est que la découverte de services fonctionne aussi à l'intérieur des conteneurs. Si un conteneur exécute MySQL, Nginx ou Redis, Glouton le détecte de la même manière que sur du bare-metal et commence immédiatement à collecter des métriques spécifiques au service. Vous obtenez à la fois la vue infrastructure (utilisation des ressources du conteneur) et la vue applicative (débit de requêtes, taux de requêtes, ratios de cache hit) dans un seul tableau de bord.
Pour les stacks Docker Compose, Glouton cartographie les relations entre conteneurs via les liens réseau et les labels. Pour les environnements de production avec des centaines de conteneurs, utilisez les labels de conteneurs pour contrôler le comportement du monitoring : bleemeo.enable: "false" exclut les conteneurs sidecar bruyants, bleemeo.check.ignore.port.* ignore les vérifications de santé sur les ports de debug. Lorsque des conteneurs plantent et redémarrent, Bleemeo suit le nombre de redémarrages et alerte en cas de boucles de crash — un indicateur courant de bugs applicatifs ou d'épuisement des ressources.
Fonctionnalités avancées
Santé des disques S.M.A.R.T.
Surveillez la santé des disques physiques via les attributs S.M.A.R.T. lorsque smartmontools est installé. Suivez les secteurs réalloués, les secteurs en attente, la température, les heures de fonctionnement et l'évaluation globale de santé. Recevez des alertes avant que les disques ne défaillent pour les remplacer de manière proactive.
Monitoring GPU NVIDIA
Suivez l'utilisation GPU, l'usage mémoire, la température, la vitesse des ventilateurs, la consommation électrique et l'utilisation encodeur/décodeur via nvidia-smi. Essentiel pour l'entraînement en machine learning, les charges d'inférence et les serveurs de rendu qui dépendent de la performance GPU.
Monitoring de processus clés
Définissez les processus critiques à surveiller. L'agent rapporte l'utilisation CPU, la consommation mémoire, le nombre de threads et les descripteurs de fichiers pour chaque processus surveillé. Recevez des alertes immédiates lorsqu'un processus clé plante ou cesse de fonctionner de manière inattendue.
Capteurs matériels
Collectez les relevés de température des coeurs CPU, du chassis et des disques via IPMI ou lm-sensors. Surveillez les vitesses de ventilateurs et les tensions sur le matériel compatible. Prévenez le throttling thermique et détectez précocement la dégradation matérielle.
Démarrez en 60 secondes
Installez l'agent
Une seule commande installe et configure l'agent Glouton sur tout OS supporté.
wget -qO- 'https://get.bleemeo.com?accountId=<your_account_id>®istrationKey=<your_registration_key>' | sh L'auto-découverte se lance
En quelques secondes, l'agent commence à collecter plus de 60 métriques système et scanne les ports TCP ouverts pour découvrir les services en exécution. MySQL, PostgreSQL, Nginx, Redis, RabbitMQ, conteneurs Docker — tout est détecté automatiquement. Aucun fichier de configuration à écrire, aucune définition de service à maintenir.
Consultez les tableaux de bord et les alertes
Votre serveur apparaît dans le panel Bleemeo Cloud en quelques secondes, avec des tableaux de bord préconfigurés pour les ressources système, les services découverts et la santé des conteneurs. Les règles d'alerte par défaut pour le CPU, la mémoire, le disque et la disponibilité des services sont déjà actives. Personnalisez les seuils ou ajoutez de nouvelles alertes depuis le panel web selon vos besoins.
Alertes préconfigurées
Des dizaines de règles d'alerte sont actives dès l'installation. Aucun réglage manuel des seuils nécessaire. Chaque alerte est personnalisable — ajustez les seuils, changez les canaux de notification ou créez de nouvelles règles basées sur n'importe quelle métrique collectée. Les alertes sont délivrées par email, Slack, PagerDuty, Microsoft Teams, webhooks ou l'application mobile Bleemeo.
Alertes ressources
- Utilisation CPU élevée soutenue
- Mémoire faible
- Espace disque critique
- Utilisation swap en augmentation
Alertes réseau
- Erreurs d'interface détectées
- Pic de paquets perdus
- Interface réseau inactive
- Saturation de la bande passante
Alertes système
- Attente I/O élevée
- CPU steal (voisin bruyant)
- Pic de load average
- Fichiers ouverts proches de la limite
Alertes services
- Service arrêté
- Service ne répond pas
- Boucle de crash de conteneur
- Fuite mémoire de processus
Cas d'usage
Hébergement web et serveurs d'applications
Surveillez les serveurs web (Apache, Nginx), les environnements d'exécution (PHP-FPM, Node.js, Java) et les backends de base de données ensemble. Corrélez la dégradation des temps de réponse avec les pics CPU ou la saturation des I/O disque pour identifier rapidement les goulets d'étranglement de votre pile web.
Serveurs de bases de données
Suivez les performances des requêtes, le lag de réplication, l'utilisation du pool de connexions et la croissance du stockage pour MySQL, PostgreSQL, MongoDB et Redis. Recevez des alertes lorsque les taux de requêtes lentes augmentent ou que l'espace disque approche des seuils de capacité.
Serveurs de build CI/CD
Surveillez Jenkins, GitLab Runner ou d'autres agents CI aux côtés de l'hôte de build. Assurez-vous que les serveurs de build disposent de suffisamment de CPU, mémoire et disque pour les pipelines concurrents. Détectez les contentions de ressources qui causent des builds instables ou lents.
Charges ML/IA et GPU
Suivez l'utilisation des GPU NVIDIA, la consommation de VRAM et la température pendant les tâches d'entraînement et d'inférence. Corrélez les métriques GPU avec le CPU système, la mémoire et les I/O disque pour identifier les goulets d'étranglement du pipeline de données qui sous-alimentent le GPU.
Machines virtuelles et hyperviseurs
Surveillez les VMs invitées et leurs hyperviseurs hôtes côte à côte. Détectez le CPU steal qui indique des hôtes surchargés. Suivez le ballonnement mémoire, la contention des I/O disque et le débit réseau pour dimensionner correctement votre infrastructure virtuelle.
Edge et passerelles IoT
Déployez l'agent léger sur des périphériques edge basés sur ARM et des passerelles IoT. Surveillez les ressources limitées, suivez la santé des services et recevez des alertes lorsque des périphériques distants se déconnectent ou manquent de stockage ou de mémoire.
Bonnes pratiques du monitoring serveur
Définissez des seuils significatifs, pas des valeurs par défaut
Un serveur de base de données qui maintient 80% de CPU est normal si les requêtes sont rapides. Un serveur web à 80% de CPU peut être au bord de la saturation. Ajustez vos seuils d'alerte en fonction du rôle de chaque serveur et de ses lignes de base historiques — la rétention de 13 mois de Bleemeo facilite l'identification des plages de fonctionnement normales et la définition de seuils qui détectent réellement les problèmes.
Surveillez la latence I/O disque, pas seulement l'espace
Manquer d'espace disque est une urgence au ralenti facile à détecter. Une latence I/O élevée est bien plus insidieuse : elle dégrade silencieusement les performances applicatives bien avant que l'espace ne s'épuise. Suivez la latence de lecture/écriture et les IOPS en plus des métriques de capacité pour détecter les goulets d'étranglement I/O liés à des SSD usés, une dégradation RAID ou des voisins bruyants sur du stockage partagé.
Surveillez le CPU steal sur les instances cloud
Le CPU steal indique que l'hyperviseur prend des cycles CPU à votre VM pour servir d'autres locataires. Un steal soutenu au-dessus de 5-10% dégrade les performances de manière apparemment aléatoire depuis l'intérieur de la VM. Bleemeo suit le steal par coeur, vous aidant à décider quand redimensionner une instance ou migrer vers un hôte dédié.
Activez le monitoring S.M.A.R.T. sur les disques physiques
Les disques tombent rarement en panne sans avertissement. Les attributs S.M.A.R.T. comme les secteurs réalloués et les secteurs en attente augmentent des semaines avant qu'un disque ne meure. Installez smartmontools et laissez Bleemeo suivre ces attributs automatiquement — un remplacement proactif de disque évite les temps d'arrêt imprévus et la perte de données.
Corrélez les métriques serveur avec les logs
Un pic CPU seul vous dit que quelque chose ne va pas. Combiné avec les logs applicatifs, il vous dit exactement ce qui l'a déclenché — une requête non maîtrisée, un pic de trafic ou une tâche cron mal configurée. Activez la collecte de logs en plus des métriques serveur pour l'analyse de cause racine la plus rapide.
Pourquoi Bleemeo pour le monitoring serveur ?
Monitoring zero-configuration
Installez un agent et tout est surveillé : métriques système, services, conteneurs, matériel. Aucun fichier de configuration à écrire, aucun YAML à éditer, aucun plugin à activer. L'agent découvre ce qui tourne et commence à collecter les bonnes métriques automatiquement.
Rétention de 13 mois
Conservez 13 mois d'historique de métriques en pleine résolution pour l'analyse de tendances, la planification de capacité et les revues post-incident. Comparez les performances de ce mois avec la même période l'année dernière — sans gérer votre propre base de données de séries temporelles.
Agent léger
Glouton utilise moins de 100 Mo de RAM et moins de 1% de CPU. Il regroupe et compresse les données avant transmission, maintenant la charge réseau à quelques kilooctets par seconde. Déployez-le sur vos serveurs de production en toute confiance — vos charges de travail ne le remarqueront pas.
Plateforme unifiée
Serveurs, Kubernetes, services AWS, équipements réseau et vérifications de disponibilité — le tout dans un seul tableau de bord avec des règles d'alerte cohérentes. Plus besoin d'assembler des outils séparés ou de maintenir plusieurs piles de monitoring pour différentes parties de votre infrastructure.
Plateformes supportées
L'agent Glouton est développé en Go et compilé nativement pour plusieurs architectures. Il fonctionne sur tous les principaux systèmes d'exploitation serveur sans dépendances ni environnement d'exécution requis.
Linux
Ubuntu, Debian, CentOS, RHEL, Fedora, Rocky Linux, AlmaLinux, SUSE et toute distribution basée sur systemd. Packages disponibles en .deb, .rpm et via le script d'installation.
Windows
Windows Server 2016 et versions ultérieures. Installateur MSI pour le déploiement automatisé. Collecte les mêmes métriques système et de services que l'agent Linux, y compris la découverte IIS et SQL Server.
FreeBSD
Support natif FreeBSD pour les environnements d'hébergement basés sur des jails. Collecte les métriques système et découvre les services avec le même moteur d'auto-découverte que sous Linux.
ARM64
Builds ARM64 natifs pour Raspberry Pi, AWS Graviton, Ampere Altra et autres serveurs basés sur ARM. Même agent, mêmes fonctionnalités, même empreinte légère sur ARM que sur x86_64.
Envie d'aller plus loin ?
Lire la documentationQuestions fréquemment posées
Tout ce que vous devez savoir sur le monitoring serveur de Bleemeo
Quels systèmes d'exploitation Bleemeo prend-il en charge ?
Bleemeo prend en charge toutes les principales distributions Linux (Ubuntu, Debian, CentOS, RHEL, Fedora, Rocky Linux, AlmaLinux, SUSE), Windows Server 2016+ et FreeBSD. L'agent Glouton est développé en Go et fonctionne nativement sur les architectures x86_64 et ARM64, ce qui le rend adapté à tout, des VMs cloud aux Raspberry Pi et passerelles edge.
Comment installer l'agent de monitoring Bleemeo ?
L'installation se fait en une seule commande. Exécutez notre script d'installation avec votre identifiant de compte et votre clé d'enregistrement : wget -qO- 'https://get.bleemeo.com?accountId=YOUR_ID®istrationKey=YOUR_KEY' | sh. L'agent s'installe, commence à collecter les métriques et s'enregistre automatiquement auprès de Bleemeo Cloud. Pour Windows, un installateur MSI est disponible. Pour Kubernetes, utilisez le chart Helm pour un déploiement en DaemonSet.
Quelles métriques l'agent Bleemeo collecte-t-il ?
L'agent collecte plus de 60 métriques système prêtes à l'emploi : CPU (user, system, iowait, steal, nice, par coeur), Mémoire (utilisée, libre, en cache, buffers, swap), Disque (espace, débit I/O, IOPS, latence par périphérique), Réseau (bande passante, erreurs, paquets perdus, états TCP par interface) et Système (load average, uptime, FDs ouverts, changements de contexte). En plus de cela, chaque service découvert ajoute ses propres métriques spécialisées.
Bleemeo découvre-t-il automatiquement les services en cours d'exécution ?
Oui, la découverte automatique des services est une fonctionnalité clé. Glouton détecte plus de 100 services incluant les bases de données (MySQL, PostgreSQL, MongoDB, Redis, Elasticsearch), les serveurs web (Apache, Nginx, HAProxy), les files de messages (RabbitMQ, Kafka) et bien d'autres. Chaque service découvert obtient des métriques dédiées et des tableaux de bord préconfigurés sans configuration manuelle. La découverte est continue — les nouveaux services apparaissent automatiquement.
Bleemeo peut-il surveiller les conteneurs Docker ?
Oui, Glouton découvre et surveille automatiquement tous les conteneurs Docker et containerd s'exécutant sur l'hôte. Il collecte les métriques CPU, mémoire, I/O disque et réseau par conteneur. Les services s'exécutant dans les conteneurs sont également auto-découverts et surveillés avec la même profondeur que les services bare-metal. Les labels et noms de conteneurs sont utilisés pour l'identification dans les tableaux de bord.
Bleemeo prend-il en charge le monitoring GPU ?
Oui, Bleemeo surveille les GPU NVIDIA via l'interface nvidia-smi. Les métriques incluent le pourcentage d'utilisation GPU, la mémoire utilisée et totale, la température, la vitesse des ventilateurs, la consommation électrique et l'utilisation encodeur/décodeur. C'est essentiel pour les charges de travail ML/IA, les serveurs de rendu et tout environnement où la performance GPU impacte le comportement applicatif.
Quelles alertes préconfigurées sont incluses avec le monitoring serveur ?
Bleemeo inclut des dizaines d'alertes préconfigurées : utilisation CPU élevée, mémoire disponible faible, espace disque critique, attente I/O disque élevée, erreurs d'interface réseau, service arrêté, boucles de crash de conteneurs, CPU steal indiquant des voisins bruyants, et bien d'autres. Tous les seuils d'alerte sont personnalisables, et vous pouvez créer des alertes personnalisées supplémentaires basées sur n'importe quelle métrique collectée.
Bleemeo surveille-t-il la santé des disques S.M.A.R.T. ?
Oui, lorsque smartmontools est installé, Glouton collecte les attributs S.M.A.R.T. des disques physiques incluant les secteurs réalloués, les secteurs en attente, la température, les heures de fonctionnement et l'évaluation globale de santé. Cela permet le remplacement proactif des disques défaillants avant toute perte de données. Des alertes préconfigurées vous préviennent lorsque les indicateurs S.M.A.R.T. franchissent les seuils d'avertissement.
Puis-je surveiller des processus spécifiques ?
Oui, Bleemeo prend en charge le monitoring de processus clés. Vous pouvez configurer des processus spécifiques à surveiller, et l'agent rapportera leur utilisation CPU, consommation mémoire, nombre de threads et descripteurs de fichiers ouverts. Vous serez alerté si un processus surveillé cesse de fonctionner. C'est idéal pour les applications personnalisées, les workers en arrière-plan et les daemons critiques qui ne sont pas couverts par la découverte de services standard.
Quel est l'impact sur les ressources de l'agent Bleemeo ?
L'agent Glouton est conçu pour être léger. Il utilise généralement moins de 100 Mo de mémoire et moins de 1% de CPU sur du matériel moderne. L'agent utilise des collecteurs natifs Go efficaces et une transmission de données par lots et compressés pour minimiser la charge en calcul et en réseau. Vous pouvez le déployer en toute sécurité sur vos serveurs de production sans impacter vos charges de travail.
Commencez à surveiller vos serveurs
Installez une fois. Surveillez tout. Obtenez une visibilité complète en 60 secondes.