Plano de Recuperação de Desastres (DRP)
Versão | Data | Autor | Alterações realizadas | Aprovado por | Data aprovação |
1.0 | 30/06/2025 | Vanderson Andrade | Criação | Direção Geral | 30/06/2025 |
1. Introdução e Objetivo
Este Plano de Recuperação de Desastres (DRP) descreve os procedimentos necessários para restaurar os sistemas críticos de comunicação e automação em caso de uma interrupção significativa ou desastre.
O objetivo principal é minimizar o tempo de inatividade, reduzir o impacto financeiro e operacional, e garantir que os serviços essenciais ao cliente e às operações internas sejam restabelecidos de forma rápida e ordenada.
Escopo do Plano:
Este plano abrange os seguintes sistemas críticos:
-
Sistemas de Chat: Plataformas de atendimento ao cliente via chat.
-
Agentes de Voz (VoIP/PABX): Sistema de telefonia e central de atendimento.
-
Discador Automático: Ferramentas para realização de chamadas ativas (outbound).
-
Orquestrador de Mensagens: Plataforma que centraliza e distribui mensagens de múltiplos canais (WhatsApp, Messenger, etc.).
-
Sistemas de Automação: Ferramentas de automação de marketing, chatbots ou fluxos de trabalho.
2. Equipe de Recuperação de Desastres (DRT - Disaster Recovery Team)
A equipe a seguir é responsável por declarar um desastre e executar este plano.
Papel |
Coordenador de DR (Líder da Equipe) |
Líder Técnico (Execução Técnica) |
Líder de Comunicações (Com. Interna/Externa) |
Líder de Operações (Validação de Negócio) |
3. Critérios para Ativação do Plano
O Coordenador de DR, em consulta com o Líder Técnico, ativará este plano se um ou mais dos seguintes critérios forem atendidos:
-
Indisponibilidade total de um ou mais sistemas críticos por mais de 60 minutos.
-
Confirmação de uma falha catastrófica pelo(s) fornecedor(es) do(s) serviço(s).
-
Incidente de segurança cibernética (ex: ransomware) que comprometa a integridade dos sistemas.
-
Desastre físico que impeça o acesso da equipe às ferramentas de gestão (mesmo que os sistemas sejam em nuvem).
4. Plano de Comunicação de Crise
A comunicação clara é vital durante um desastre. O Líder de Comunicações executará o seguinte plano:
Público | Método de Comunicação Primário | Método Secundário (se primário falhar) | Frequência de Atualização |
Equipe de DR | Grupo de WhatsApp/Telegram "Crise TI" | Ligação Telefônica Direta | A cada 30 minutos |
Todos os Colaboradores | E-mail geral para @nomedaempresa.com | Mensagem em Grupo de WhatsApp Geral | A cada 60-90 minutos |
Clientes Chave | Contato direto pelo Gestor da Conta | E-mail de Status | Conforme necessário |
Público Geral/Clientes | Postagem na página de Status/Redes Sociais | Banner no site principal | A cada 2 horas |
5. Análise de Impacto e Objetivos de Recuperação
Definimos a criticidade e os objetivos de tempo (RTO) e ponto de recuperação (RPO) para cada sistema.
-
RTO (Recovery Time Objective): Tempo máximo aceitável para restaurar a função do sistema.
-
RPO (Recovery Point Objective): Perda de dados máxima aceitável (medida em tempo).
Sistema | Criticidade | RTO (Tempo para Voltar) | RPO (Perda de Dados) | Estratégia de Backup |
Chat e Voz (Atendimento) | Alta | 4 Horas | 1 Hora | Backup diário das configurações de fluxo e integrações |
Orquestrador de Mensagens | Alta | 4 Horas | 1 Hora | Backup diário das configurações de fluxo e integrações |
Discador Automático | Média | 8 Horas | 24 Horas | Exportação semanal das listas de contatos e configurações |
Sistemas de Automação | Média | 8 Horas | 24 Horas | Backup diário/semanal das configurações e fluxos |
6. Procedimentos de Recuperação por Sistema
6.1. Procedimento Geral (Primeiros Passos)
-
Diagnóstico: O Líder Técnico verifica a conectividade interna e acessa a página de status de cada fornecedor de serviço (ver Apêndice B).
-
Contato com Suporte: Se a página de status não indicar um problema, abrir um chamado de emergência com o fornecedor.
-
Ativação do Plano: Se o problema for confirmado como um desastre, o Coordenador de DR ativa formalmente o plano.
6.2. Sistemas de Chat e Voz (VoIP)
-
Estratégia Primária (Falha do Provedor):
-
O Líder Técnico contata o suporte de emergência do fornecedor (ex: Twilio, Zenvia).
-
O Líder de Comunicações informa colaboradores e clientes sobre a instabilidade nos canais de voz e chat.
-
Aguardar a resolução pelo fornecedor, que geralmente possui redundância geográfica.
-
-
Estratégia de Contingência (Plano B - Se o provedor demorar a voltar):
-
Voz: O Líder Técnico redireciona o número de telefone principal (0800 ou fixo) para um ou mais números de celular pré-definidos da equipe de atendimento.
-
Chat: Desativar o widget de chat no site.
-
A equipe de atendimento utiliza caixas de e-mail e o WhatsApp Web para continuar o suporte.
-
6.3. Orquestrador de Mensagens
-
Estratégia Primária (Falha do Provedor):
-
Contatar o suporte de emergência do fornecedor.
-
Informar as equipes que a distribuição automática de mensagens está interrompida.
-
-
Estratégia de Contingência (Plano B):
-
Acesso Direto aos Canais: As equipes devem acessar as plataformas de origem diretamente para responder às mensagens.
-
WhatsApp: Acessar o WhatsApp Business/Web.
-
Facebook/Instagram: Acessar a Caixa de Entrada da Meta Business Suite.
-
E-mail: Acessar a caixa de e-mail de suporte diretamente.
-
-
A distribuição de mensagens será manual até o restabelecimento do orquestrador.
-
6.4. Discador Automático
-
Estratégia Primária (Falha do Provedor):
-
Contatar o suporte de emergência do fornecedor.
-
A equipe de vendas/outbound interrompe as atividades de discagem.
-
-
Estratégia de Contingência (Plano B):
-
O Líder Técnico localiza a última exportação das listas de contatos (mailing).
-
A equipe de vendas realiza chamadas manuais utilizando celulares ou o sistema de VoIP (se estiver funcionando) com base na lista exportada. A produtividade será menor, mas a operação não para completamente.
-
6.5. Sistemas de Automação
-
Estratégia Primária (Falha do Provedor):
-
Contatar o suporte de emergência do fornecedor.
-
A equipe de marketing/operações fica ciente de que fluxos automáticos (e-mails, leads, etc.) estão parados.
-
-
Estratégia de Contingência (Plano B):
-
As atividades críticas que dependem de automação (ex: envio de propostas, qualificação de leads) devem ser feitas manualmente.
-
Utilizar planilhas para controle de leads e follow-ups.
-
Pausar campanhas de marketing pagas que direcionam para fluxos de automação quebrados para evitar desperdício de verba.
-
7. Retorno à Normalidade (Fallback)
-
Confirmação: O Líder Técnico, junto aos fornecedores, confirma que os sistemas estão 100% operacionais.
-
Validação: O Líder de Operações realiza testes em cada sistema (envia um chat de teste, faz uma ligação, recebe uma mensagem no orquestrador).
-
Desativação da Contingência: O Líder Técnico reverte as configurações de contingência (ex: remove o redirecionamento de chamadas, reativa o chat no site).
-
Comunicação Final: O Líder de Comunicações envia um comunicado a todos os públicos informando que a situação foi normalizada.
-
Revisão Pós-Incidente: A Equipe de DR se reúne em até 48 horas para documentar as lições aprendidas e propor melhorias a este plano.
8. Testes e Manutenção do Plano
-
Revisão do Plano: Este DRP deve ser revisado e atualizado a cada 6 meses ou sempre que um sistema crítico ou fornecedor for alterado.
-
Teste de Simulação (Tabletop): Realizado a cada 6 meses. A equipe se reúne para discutir um cenário de desastre hipotético e validar os passos do plano.
-
Teste de Contingência: Realizado anualmente. Testar um procedimento de contingência real (ex: redirecionar a linha telefônica por 30 minutos fora do horário de pico).