1. Introducción
El presente Plan tiene como finalidad garantizar la operatividad del software Ágora en situaciones de contingencia o fallo de infraestructura.
2. Alcance
Este plan aplica a los siguientes componentes:
-
Software: Ágora POS (tanto en versión cloud como híbrida)
-
Infraestructura: Servidores, bases de datos, comunicaciones, dispositivos TPV
-
Puntos de venta: Establecimientos propios, franquiciados o en modelo mixto
-
Servicios: Backend, Frontend, API, integraciones (Sihot, Delivery, pagos, etc.)
3. Análisis de riesgos críticos
Riesgo | Impacto en operación | Nivel de criticidad | Estrategia de mitigación |
---|---|---|---|
Fallo en la nube principal | Parada total | Alto | HA, réplicas y migración automática |
Fallo en TPV local | Parada parcial | Medio | Modo offline habilitado, soporte remoto |
Ciberataque (ransomware, DDoS) | Alto | Alto | Firewall, copias inmutables, segmentación |
Corte de Internet en local | Medio | Alto | Operación offline, sincronización posterior |
Corrupción de base de datos | Muy alto | Bajo | Backups + validación automática |
Fallo humano en sede | Medio | Medio | Procedimientos operativos estandarizados |
4. Estrategia de backups
-
Frecuencia:
-
Full diario + incrementales cada hora
-
-
Retención:
-
30 días en clientes con SLA premium
-
-
Ubicación:
-
Local + remoto ( S3)
-
-
Backups inmutables:
-
Activados con retención mínima de 7 días
-
-
Verificación:
-
Test de recuperación automatizado diario
-
Restauraciones completas trimestrales
-
5. Infraestructura de alta disponibilidad (HA)
-
Cloud: Arquitectura redundante en diferentes zonas de disponibilidad
-
Base de datos: Cluster con failover automático
-
Balanceadores de carga
-
Proxmox + Ceph: tolerancia a fallo de nodo, red o almacenamiento
-
UPS y conmutación eléctrica en instalaciones físicas
-
Monitorización proactiva 24/7 (Prometheus)
6. Objetivos de recuperación
Tipo de incidente | RTO (Tiempo de recuperación) | RPO (Pérdida máxima de datos) |
---|---|---|
Fallo total de servicio cloud | ≤ 1 hora | ≤ 15 minutos |
Incidencia local en TPV | ≤ 30 minutos | ≤ 1 hora |
Restauración desde backup | ≤ 4 horas | Última copia disponible |
7. Procedimientos de recuperación
-
Fallo parcial (local): intervención remota en <15 min. Activación de modo offline.
-
Fallo total (cloud): conmutación automática al entorno de contingencia.
-
Restauración desde backup: carga de snapshot + sincronización de cambios posteriores.
-
Comunicación de crisis:
-
Email, teléfono y canal directo con nuestro equipo técnico.
-
8. Validación y revisión del plan
-
Pruebas programadas:
-
Restauración completa: Trimestral
-
Simulacro de caída de infraestructura: Anual
-
-
Auditorías de seguridad y backups: Mensuales
-
Revisión del plan: Anual o ante cambios críticos
9. Información adicional para el cliente
-
Acceso al portal técnico de fos.consulting (FAQs, actualizaciones, estado de servicio)
-
Posibilidad de formación específica para el equipo del cliente