Monitoreo Kubernetes

Q: ¿Cómo despliego Bleemeo en mi cluster de Kubernetes?

Bleemeo se despliega mediante Helm chart como un DaemonSet, colocando un agente Glouton en cada nodo. Simplemente añade el repositorio Helm de Bleemeo, luego ejecuta helm upgrade --install con las credenciales de tu cuenta. Herramientas GitOps como ArgoCD y Flux son totalmente compatibles.

Q: ¿Qué métricas de Kubernetes recopila Bleemeo?

Bleemeo recopila métricas completas incluyendo métricas de pods (conteo por estado, conteo de reinicios, uso de CPU/memoria), métricas de nodos (CPU, memoria, disco, red, estado de kubelet), métricas de cluster (conteo de nodos, conteo de namespaces, estado de API) y expiración de certificados.

Q: ¿Bleemeo auto-descubre servicios en mis pods?

Sí, el auto-descubrimiento de servicios es una característica central. El agente de Bleemeo detecta todos los servicios ejecutándose en tus pods y comienza a monitorearlos sin configuración manual. Reconoce más de 100 servicios de serie.

Q: ¿Puedo recolectar métricas Prometheus de mis aplicaciones?

Sí, Bleemeo soporta recolección estilo Prometheus mediante anotaciones de pods. Añade prometheus.io/scrape: true a tus pods, y opcionalmente especifica prometheus.io/path y prometheus.io/port para endpoints de métricas personalizados.

Q: ¿Cuáles son los requisitos de recursos del agente?

El agente Glouton está diseñado para ser ligero. Típicamente usa menos de 100MB de memoria y CPU mínimo por nodo. El agente está optimizado para entornos de alta densidad con muchos pods por nodo.

Q: ¿Qué distribuciones de Kubernetes son compatibles?

Bleemeo funciona con todas las principales distribuciones de Kubernetes incluyendo servicios gestionados (EKS, GKE, AKS), auto-gestionados (kubeadm, k3s, k0s, microk8s) y distribuciones enterprise (OpenShift, Rancher, Tanzu). Soportamos Kubernetes 1.19+.

Q: ¿Puedo monitorear múltiples clusters de Kubernetes?

Sí, Bleemeo soporta monitoreo multi-cluster. Cada cluster aparece como una entidad separada en tu dashboard. Puedes ver todos los clusters en un dashboard unificado y comparar métricas entre clusters.

Q: ¿Qué alertas vienen preconfiguradas para Kubernetes?

Bleemeo incluye alertas preconstruidas para problemas comunes de Kubernetes: CrashLoopBackOff, pods pendientes, alto conteo de reinicios, OOMKilled, nodo NotReady, presión de disco/memoria y certificado por expirar.

Q: ¿Cómo rastreo los resource requests vs el uso real?

Bleemeo recopila tanto los resource requests/limits como el uso real de CPU y memoria. Los dashboards muestran la comparación, ayudándote a identificar cargas de trabajo sobre-aprovisionadas y sub-aprovisionadas para un dimensionamiento correcto.

Q: ¿Bleemeo monitorea logs de contenedores?

Sí, con la recolección de logs habilitada, Glouton captura automáticamente logs de todos los contenedores en tu cluster de Kubernetes sin configuración adicional. Los logs pueden correlacionarse con métricas para una solución de problemas completa.

Observabilidad completa para tus clusters Kubernetes. Monitorea nodos, pods, contenedores y servicios con descubrimiento automático, compatibilidad con Prometheus y alertas inteligentes.

Iniciar Prueba Gratuita Ver Precios

Bleemeo Kubernetes Dashboard - Monitoreo completo de clusters K8s con estado de nodos, métricas de pods, requests de CPU y uso de memoria

Capas de Monitoreo

<100MB

Memoria del Agente

100+

Auto-Descubrimientos

Observabilidad Full-Stack de Kubernetes

Desde la salud del cluster hasta las métricas de contenedores individuales, obtén visibilidad completa de tu entorno Kubernetes.

Cluster API, etcd, scheduler

→

Nodos CPU, memoria, kubelet

→

Pods Ciclo de vida, reinicios

→

Contenedores CPU, memoria, OOM

Nivel de Cluster

Salud del plano de control, latencia del API Server, rendimiento de etcd, métricas del scheduler

Nivel de Nodo

CPU, memoria, disco, red, estado de kubelet, condiciones del nodo

Nivel de Pod

Ciclo de vida de pods, conteo de reinicios, resource requests vs limits, readiness

Nivel de Contenedor

Throttling de CPU, uso de memoria, eventos OOM, estados de contenedores

Red

Endpoints de servicios, tráfico de ingress, resolución DNS, network policies

Almacenamiento

Uso de PersistentVolume, estado de claims, capacidad de storage class, salud de montajes

Qué Monitoreamos

Plano de Control

Monitorea el corazón de tu cluster Kubernetes para confiabilidad y rendimiento.

Latencia de solicitudes del API Server
Salud y latencia de etcd
Profundidad de cola del Scheduler
Métricas del Controller manager
Expiración de certificados

Nodos y Kubelet

Rastrea la salud de los nodos y el rendimiento de kubelet en todo tu cluster.

CPU, memoria, disco del nodo
Estado de salud de Kubelet
Condiciones del nodo (Ready, DiskPressure, etc.)
Capacidad y asignación de pods
Métricas del runtime de contenedores

Pods y Contenedores

Visibilidad profunda del rendimiento de cargas de trabajo y consumo de recursos.

Uso de CPU y throttling
Uso de memoria y OOM kills
Conteo de reinicios y crash loops
Resource requests vs limits
Estados y eventos de contenedores

Servicios y Red

Monitorea endpoints de servicios y conectividad de red.

Salud de endpoints de servicios
Tráfico y latencia de Ingress
Efectividad de network policies
Tiempos de resolución DNS
Métricas de service mesh (Istio, Linkerd)

Recursos de Cargas de Trabajo

Rastrea Deployments, StatefulSets, DaemonSets y Jobs.

Estado de réplicas de Deployment
Progreso de rolling updates
Ordenamiento de StatefulSet
Cobertura de DaemonSet
Completación de Job y CronJob

Almacenamiento Persistente

Monitorea PersistentVolumes y rendimiento de almacenamiento.

Estado de binding PV/PVC
Uso de capacidad de almacenamiento
Throughput y latencia de E/S
Aprovisionamiento de StorageClass
Errores de montaje de volúmenes

Características Nativas de Kubernetes

🔍 Auto-Descubrimiento

Descubre y monitorea automáticamente pods, servicios y endpoints. Sin configuración manual necesaria mientras las cargas de trabajo escalan.

📊 Compatible con Prometheus

Soporte nativo de PromQL. Recolecta endpoints Prometheus existentes. Usa tus recording rules y alertas existentes.

🏷️ Consciente de Labels

Filtra y agrega por labels y annotations de Kubernetes. Agrupa métricas por namespace, deployment o labels personalizados.

📈 Optimización de Recursos

Dimensiona correctamente los resource requests y limits basándote en el uso real. Identifica cargas de trabajo sobre-aprovisionadas y sub-aprovisionadas.

🔔 Alertas Inteligentes

Alertas preconfiguradas para problemas comunes de K8s: CrashLoopBackOff, pods pendientes, nodo NotReady, expiración de certificados.

🌐 Multi-Cluster

Monitorea múltiples clusters Kubernetes desde un único dashboard. Compara el rendimiento entre entornos.

📦 Despliegue con Helm

Despliega el agente Bleemeo con un único Helm chart. Listo para GitOps con opciones de personalización completas.

🔗 OpenTelemetry

Ingesta métricas y logs vía OpenTelemetry. Correlaciona métricas de infraestructura con datos de aplicación.

Configuración Rápida con Helm

Añadir Repositorio Helm de Bleemeo

Añade el repositorio oficial de Helm charts de Bleemeo a tu instalación de Helm.

helm repo add bleemeo-agent https://packages.bleemeo.com/bleemeo-agent/helm-charts
helm repo update

Instalar el Agente

Despliega el agente Glouton como DaemonSet con las credenciales de tu cuenta.

helm upgrade --install glouton bleemeo-agent/glouton \
    --set account_id="your_account_id" \
    --set registration_key="your_registration_key" \
    --set config.kubernetes.clustername="my_k8s_cluster_name" \
    --set namespace="default"

Ver Tu Cluster

Los nodos, pods y servicios aparecen automáticamente en tu dashboard de Bleemeo en segundos.

Despliegue DaemonSet

Glouton se despliega como DaemonSet, colocando automáticamente un pod de agente en cada nodo de tu cluster, incluidos los nodos añadidos por autoscalers.

Un agente por nodo, siempre
Tolerations para todos los tipos de nodos
Cobertura compatible con autoscaler
Helm chart listo para GitOps

Bleemeo Kubernetes Agents - Despliegue DaemonSet mostrando pods de agente en cada nodo del cluster

Arquitectura del Agente DaemonSet

Un pod Glouton por nodo garantiza cobertura completa del cluster, desde la salud del plano de control hasta métricas individuales de contenedores.

Modelo de Despliegue DaemonSet

Glouton se despliega como un DaemonSet vía Helm, colocando exactamente un pod de agente en cada nodo de tu cluster. El Helm chart incluye tolerations para todos los tipos de nodos estándar: nodos GPU, nodos de sistema y nodos gestionados por autoscaler reciben un agente automáticamente. Solo se requieren tres variables de entorno: GLOUTON_ACCOUNT_ID, GLOUTON_REGISTRATION_KEY y GLOUTON_KUBERNETES_CLUSTERNAME. El pod del agente solicita recursos mínimos (menos de 100 MB de memoria) y no competirá con tus cargas de trabajo de producción.

Anotaciones de Pods para Control Granular

Las annotations de Kubernetes en tus pods controlan cómo Glouton interactúa con cada carga de trabajo. Establece glouton.enable: "false" para excluir un pod del monitoreo por completo. Usa glouton.check.ignore.port.* para omitir health checks en puertos específicos (útil para contenedores sidecar o puertos de depuración). Añade annotations estándar de Prometheus (prometheus.io/scrape: "true", prometheus.io/port, prometheus.io/path) para exponer métricas específicas de aplicación que Glouton recolectará y enviará a Bleemeo Cloud junto con las métricas de infraestructura.

Métricas Completas de Kubernetes

Más allá de los conteos básicos de pods y nodos, Glouton recopila métricas profundas de Kubernetes: conteos de pods por estado (Running, Pending, Failed, Succeeded), conteos de reinicios por contenedor, uso de CPU y memoria comparado con requests y limits, conteos de nodos y namespaces, fechas de expiración de certificados para CA y certificados de nodo, e indicadores de salud del API Server y kubelet. Todas las métricas están etiquetadas con namespace, tipo de propietario (Deployment, DaemonSet, StatefulSet) y nombre del propietario para un filtrado y agregación potentes en los dashboards.

Personalización mediante ConfigMap

Sobreescribe los valores predeterminados de Glouton por cluster usando un Kubernetes ConfigMap. Excluye namespaces completos del monitoreo (por ejemplo, kube-system o namespaces de CI runners), ajusta los intervalos de recolección de métricas, añade labels personalizados a todas las métricas de un cluster específico, o configura targets de Prometheus adicionales. El enfoque de ConfigMap se integra naturalmente con flujos de trabajo GitOps: almacena tu configuración de monitoreo junto a los manifiestos de tu aplicación y deja que ArgoCD o Flux lo gestionen de forma declarativa.

Alertas Predefinidas de Kubernetes

Recibe notificaciones sobre problemas comunes de Kubernetes antes de que impacten a tus usuarios.

Problemas de Pods

CrashLoopBackOff detectado
Pod atascado en Pending
Alto conteo de reinicios
Contenedores OOMKilled

Problemas de Nodos

Nodo NotReady
Alta presión de CPU/memoria
Espacio en disco bajo
Demasiados pods programados

Problemas de Cluster

Errores del API Server
Latencia alta de etcd
Certificado por expirar
PVC pendiente

Problemas de Cargas de Trabajo

Réplicas de Deployment no disponibles
StatefulSet no listo
Job fallido
HPA en réplicas máximas

Funciona Con Tu Stack

K8s Gestionado EKS, GKE, AKS, DigitalOcean

Distribuciones OpenShift, Rancher, k3s, k0s

Service Mesh Istio, Linkerd, Consul Connect

Ingress NGINX, Traefik, HAProxy, Kong

Almacenamiento Ceph, Longhorn, OpenEBS, CSI

Observabilidad Prometheus, Grafana, OpenTelemetry

CI/CD ArgoCD, Flux, Jenkins, GitLab

Bases de Datos PostgreSQL, MySQL, MongoDB, Redis

¿Por Qué Bleemeo para Kubernetes?

Visibilidad en Tiempo Real

Ve la creación de pods, eventos de escalado y fallos a medida que ocurren. Sin demora en la recolección de métricas.

Optimización de Costos

Identifica desperdicio de recursos y dimensiona correctamente tus cargas de trabajo. Reduce el gasto en la nube sin impactar el rendimiento.

Agente Ligero

Glouton usa recursos mínimos. Menos de 100MB de memoria por nodo. No competirá con tus cargas de trabajo.

13 Meses de Retención

Mantén datos históricos para planificación de capacidad y análisis de tendencias. Compara el rendimiento a lo largo del tiempo.

¿Qué Es el Monitoreo de Kubernetes?

El monitoreo de Kubernetes es la práctica de recopilar, analizar y alertar sobre métricas de cada capa de un entorno Kubernetes, desde el plano de control del cluster hasta los procesos individuales de contenedores. A diferencia del monitoreo de servidores tradicional, Kubernetes introduce desafíos únicos: las cargas de trabajo son efímeras, los pods se crean y destruyen constantemente, y una sola aplicación puede abarcar docenas de réplicas en múltiples nodos.

Un monitoreo efectivo de Kubernetes requiere visibilidad en cuatro capas distintas. La capa de cluster rastrea la salud del plano de control, la latencia del API Server, el rendimiento de etcd y la expiración de certificados. La capa de nodos monitorea CPU, memoria, disco y estado de kubelet en cada nodo worker. La capa de cargas de trabajo rastrea réplicas de Deployment, ordenamiento de StatefulSet, cobertura de DaemonSet y completación de Jobs. Finalmente, la capa de pods y contenedores proporciona uso de recursos, conteos de reinicios, eventos OOM y throttling de CPU por contenedor.

Sin monitoreo multicapa, los operadores de Kubernetes se ven obligados a usar comandos kubectl e inspección manual de logs para diagnosticar problemas, un enfoque reactivo que no escala. Una solución de monitoreo adecuada como Bleemeo recopila métricas de las cuatro capas automáticamente mediante despliegue DaemonSet, correlaciona datos entre capas y proporciona alertas predefinidas para modos de fallo comunes como CrashLoopBackOff, pods pendientes y expiración de certificados.

Métricas Detalladas de Kubernetes

Métricas de Pods

Rastrea conteos de pods por estado (Running, Pending, Failed, Succeeded), conteos de reinicios por contenedor, uso de CPU y memoria versus requests y limits, y antigüedad del pod. Los labels incluyen namespace, tipo de propietario (Deployment, DaemonSet, StatefulSet) y nombre del propietario para agregación y filtrado fáciles.

Resource Requests vs Limits

Compara lo que los pods solicitaron (requests de CPU y memoria) con lo que realmente consumen. Identifica cargas de trabajo sobre-aprovisionadas desperdiciando recursos y las sub-aprovisionadas en riesgo de throttling de CPU u OOMKill. Estos datos son esenciales para dimensionar correctamente las definiciones de recursos en tus manifiestos de deployment.

Salud del Cluster

Monitorea el conteo total de nodos, nodos Ready vs NotReady, conteo de namespaces y estado general del cluster. Rastrea la disponibilidad del API Server, la latencia de etcd y la profundidad de cola del scheduler. Estas métricas te ayudan a evaluar la salud general y capacidad de tu infraestructura Kubernetes.

Expiración de Certificados

Rastrea las fechas de expiración de certificados CA y certificados de nodo usados para la comunicación interna de Kubernetes. Recibe alertas antes de que los certificados expiren, una causa común de fallos repentinos del cluster que es completamente prevenible con monitoreo automatizado.

Kubelet y Condiciones de Nodo

Monitorea el estado de salud de kubelet en cada nodo, condiciones del nodo (Ready, DiskPressure, MemoryPressure, PIDPressure) y salud del runtime de contenedores. Detecta nodos degradados antes de que comiencen a expulsar pods o se vuelvan NotReady.

Red e Ingress

Rastrea bytes de red recibidos y transmitidos por pod, paquetes descartados y conteos de errores. Monitorea tasas de solicitudes del controlador de Ingress, latencias de respuesta y ratios de errores HTTP. Correlaciona métricas de red con reinicios de pods o degradación de servicios para identificar problemas de conectividad, fallos de resolución DNS o network policies mal configuradas.

Casos de Uso

Resolución de Fallos de Pods

Cuando un pod entra en CrashLoopBackOff, necesitas saber por qué inmediatamente. Bleemeo muestra el conteo de reinicios, el último código de salida, logs del contenedor y métricas correlacionadas a nivel de nodo. Determina si el crash es causado por errores de aplicación, OOM kills o presión de recursos del nodo subyacente, todo desde un único dashboard.

Dimensionamiento de Cargas de Trabajo

Los resource requests sobre-aprovisionados desperdician capacidad del cluster y aumentan los costos en la nube. Los requests sub-aprovisionados causan throttling y OOM kills. Usa las métricas de resource requests vs uso real de Bleemeo a lo largo del tiempo para identificar los requests óptimos de CPU y memoria para cada carga de trabajo, reduciendo el desperdicio mientras previenes la contención de recursos.

Planificación de Capacidad

Rastrea las tendencias de utilización de recursos del cluster a lo largo de semanas y meses. Identifica cuándo los nodos se acercan a los límites de capacidad y planifica eventos de escalado antes de que los pods queden pendientes por recursos insuficientes. Usa 13 meses de datos históricos para prever patrones estacionales y presupuestar el crecimiento de infraestructura.

Gestión Multi-Cluster

Monitorea clusters de desarrollo, staging y producción desde un único dashboard. Compara la utilización de recursos entre entornos, detecta desviaciones de configuración entre clusters y asegúrate de que los clusters de staging reflejen el dimensionamiento de producción. Cada cluster se identifica por su nombre configurado para filtrado fácil.

Validación de Despliegues GitOps

Después de un despliegue de Flux o ArgoCD, monitorea el rollout en tiempo real. Rastrea la creación de nuevos pods, la terminación de pods antiguos y la disponibilidad de réplicas durante rolling updates. Detecta despliegues fallidos (rollouts atascados, crash loops en nuevas versiones) y correlaciona el timing del despliegue con cambios en métricas para validar que los releases funcionan como se espera.

Optimización de Costos y Chargeback

Analiza el consumo de recursos por namespace para asignar costos de infraestructura a equipos o proyectos. Identifica namespaces con utilización consistentemente baja de CPU y memoria que están sobre-aprovisionados. Usa datos históricos de uso para dimensionar correctamente los node pools del cluster, cambiar a instancias spot o preemptibles para cargas de trabajo tolerantes, y reducir el gasto general en infraestructura Kubernetes.

Mejores Prácticas de Monitoreo Kubernetes

Despliega como DaemonSet

Ejecuta el agente de monitoreo como DaemonSet para que cada nodo reciba automáticamente un pod de agente, incluidos los nodos añadidos por autoscalers. Esto garantiza cobertura completa del cluster sin intervención manual. El Helm chart de Bleemeo lo maneja por defecto, incluyendo tolerations y resource limits adecuados.

Usa Annotations de Prometheus para Métricas Personalizadas

Añade prometheus.io/scrape: "true" a las annotations de tus pods para exponer métricas específicas de aplicación mediante el formato Prometheus. El agente de Bleemeo descubre estos endpoints automáticamente y envía las métricas a la nube. Este es el enfoque estándar nativo de Kubernetes para métricas personalizadas de aplicación sin requerir configuración adicional.

Siempre Establece Resource Requests y Limits

Los pods sin resource requests no pueden dimensionarse correctamente porque no hay una línea base con la cual comparar. Siempre establece requests de CPU y memoria en tus manifiestos de deployment. Bleemeo luego compara el uso real con los recursos solicitados, permitiendo decisiones de dimensionamiento basadas en datos que reducen el desperdicio y previenen la contención de recursos.

Monitorea la Expiración de Certificados

Kubernetes usa certificados TLS para la comunicación interna entre el API Server, kubelet y etcd. Los certificados expirados causan fallos repentinos y totales del cluster. Bleemeo rastrea las fechas de expiración de certificados y te alerta antes de que expiren, dándote tiempo para rotar certificados proactivamente en lugar de descubrir el problema durante una caída.

Correlaciona Métricas con Logs de Contenedores

Un conteo de reinicios de pod en aumento te dice que algo está mal. Los logs del contenedor te dicen exactamente qué. Habilita la recolección de logs junto con las métricas para el análisis de causa raíz más rápido. El agente de Bleemeo recopila ambos desde el mismo DaemonSet, y la plataforma cloud los muestra juntos, vinculados por nombre de pod y timestamp.

¿Quieres ir más allá?

Leer la Documentación

Preguntas Frecuentes

Todo lo que necesitas saber sobre el monitoreo de Kubernetes de Bleemeo

¿Cómo despliego Bleemeo en mi cluster de Kubernetes?

Bleemeo se despliega mediante Helm chart como un DaemonSet, colocando un agente Glouton en cada nodo. Simplemente añade el repositorio Helm de Bleemeo, luego ejecuta helm upgrade --install con las credenciales de tu cuenta y nombre de cluster. El agente descubre automáticamente todos los pods y servicios. También puedes desplegar usando kubectl plano con nuestros manifiestos proporcionados. Herramientas GitOps como ArgoCD y Flux son totalmente compatibles.

¿Qué métricas de Kubernetes recopila Bleemeo?

Bleemeo recopila métricas completas incluyendo: Métricas de pods (conteo por estado, conteo de reinicios, uso de CPU/memoria vs requests/limits), Métricas de nodos (CPU, memoria, disco, red, estado de kubelet), Métricas de cluster (conteo de nodos, conteo de namespaces, estado de API) y Expiración de certificados (CA y certificados de nodo). Las métricas se etiquetan por namespace, tipo de propietario (Deployment, DaemonSet) y nombre del propietario para filtrado fácil.

¿Bleemeo auto-descubre servicios en mis pods?

Sí, el auto-descubrimiento de servicios es una característica central. El agente de Bleemeo detecta todos los servicios ejecutándose en tus pods (bases de datos, servidores web, colas de mensajes, etc.) y comienza a monitorearlos sin configuración manual. Reconoce más de 100 servicios de serie. A medida que los pods escalan arriba o abajo, el monitoreo sigue automáticamente; no se necesita reconfiguración para cargas de trabajo efímeras.

¿Puedo recolectar métricas Prometheus de mis aplicaciones?

Sí, Bleemeo soporta recolección estilo Prometheus mediante anotaciones de pods. Añade prometheus.io/scrape: "true" a tus pods, y opcionalmente especifica prometheus.io/path y prometheus.io/port para endpoints de métricas personalizados. El agente descubre y recolecta automáticamente estos endpoints. También puedes usar PromQL para consultar métricas en tus dashboards.

¿Cuáles son los requisitos de recursos del agente?

El agente Glouton está diseñado para ser ligero. Típicamente usa menos de 100MB de memoria y CPU mínimo por nodo. El agente no competirá con tus cargas de trabajo de producción por recursos. Los resource requests y limits pueden personalizarse en los valores de Helm si es necesario. El agente está optimizado para entornos de alta densidad con muchos pods por nodo.

¿Qué distribuciones de Kubernetes son compatibles?

Bleemeo funciona con todas las principales distribuciones de Kubernetes: Servicios gestionados (EKS, GKE, AKS, DigitalOcean Kubernetes), Auto-gestionados (kubeadm, k3s, k0s, microk8s) y Distribuciones enterprise (OpenShift, Rancher, Tanzu). Soportamos Kubernetes 1.19+. El agente se adapta a diferentes runtimes de contenedores incluyendo containerd, CRI-O y Docker.

¿Puedo monitorear múltiples clusters de Kubernetes?

Sí, Bleemeo soporta monitoreo multi-cluster. Cada cluster aparece como una entidad separada en tu dashboard con su propio nombre (configurado mediante config.kubernetes.clustername). Puedes ver todos los clusters en un dashboard unificado, comparar métricas entre clusters y profundizar en detalles de clusters individuales. Esto es ideal para gestionar entornos de desarrollo, staging y producción.

¿Qué alertas vienen preconfiguradas para Kubernetes?

Bleemeo incluye alertas preconstruidas para problemas comunes de Kubernetes: Problemas de pods (CrashLoopBackOff, pods pendientes, alto conteo de reinicios, OOMKilled), Problemas de nodos (NotReady, presión de disco/memoria), Problemas de cluster (errores del API Server, certificado por expirar) y Problemas de cargas de trabajo (réplicas de deployment no disponibles, jobs fallidos). Puedes personalizar umbrales o crear alertas adicionales.

¿Cómo rastreo los resource requests vs el uso real?

Bleemeo recopila tanto los resource requests/limits como el uso real de CPU y memoria. Los dashboards muestran la comparación entre lo que los pods solicitaron y lo que realmente están usando, ayudándote a identificar cargas de trabajo sobre-aprovisionadas (desperdiciando recursos) y sub-aprovisionadas (en riesgo de throttling o OOM). Esto permite el dimensionamiento correcto efectivo de tus cargas de trabajo.

¿Bleemeo monitorea logs de contenedores?

Sí, con la recolección de logs habilitada, Glouton captura automáticamente logs de todos los contenedores en tu cluster de Kubernetes. Los logs se recopilan de stdout/stderr de contenedores sin configuración adicional. Puedes aplicar parsers y filtros personalizados usando anotaciones de pods (glouton.log_format, glouton.log_filter). Los logs pueden correlacionarse con métricas para una solución de problemas completa.

Comienza a Monitorear Tus Clusters Kubernetes

Despliega en minutos. Obtén visibilidad completa de tu infraestructura K8s.

Iniciar Prueba Gratuita Hablar con Ventas