Skip to main content

Plano de Recuperação de Desastres (DRP)

Versão Data Autor Alterações realizadas Aprovado por Data aprovação
1.0 30/06/2025 Vanderson Andrade Criação Direção Geral 30/06/2025

1. Introdução e Objetivo

Este Plano de Recuperação de Desastres (DRP) descreve os procedimentos necessários para restaurar os sistemas críticos de comunicação e automação em caso de uma interrupção significativa ou desastre.

O objetivo principal é minimizar o tempo de inatividade, reduzir o impacto financeiro e operacional, e garantir que os serviços essenciais ao cliente e às operações internas sejam restabelecidos de forma rápida e ordenada.

Escopo do Plano:
Este plano abrange os seguintes sistemas críticos:

  • Sistemas de Chat: Plataformas de atendimento ao cliente via chat.

  • Agentes de Voz (VoIP/PABX): Sistema de telefonia e central de atendimento.

  • Discador Automático: Ferramentas para realização de chamadas ativas (outbound).

  • Orquestrador de Mensagens: Plataforma que centraliza e distribui mensagens de múltiplos canais (WhatsApp, Messenger, etc.).

  • Sistemas de Automação: Ferramentas de automação de marketing, chatbots ou fluxos de trabalho.


2. Equipe de Recuperação de Desastres (DRT - Disaster Recovery Team)

A equipe a seguir é responsável por declarar um desastre e executar este plano.

Papel
Coordenador de DR (Líder da Equipe)
Líder Técnico (Execução Técnica)
Líder de Comunicações (Com. Interna/Externa)
Líder de Operações (Validação de Negócio)

3. Critérios para Ativação do Plano

O Coordenador de DR, em consulta com o Líder Técnico, ativará este plano se um ou mais dos seguintes critérios forem atendidos:

  • Indisponibilidade total de um ou mais sistemas críticos por mais de 60 minutos.

  • Confirmação de uma falha catastrófica pelo(s) fornecedor(es) do(s) serviço(s).

  • Incidente de segurança cibernética (ex: ransomware) que comprometa a integridade dos sistemas.

  • Desastre físico que impeça o acesso da equipe às ferramentas de gestão (mesmo que os sistemas sejam em nuvem).


4. Plano de Comunicação de Crise

A comunicação clara é vital durante um desastre. O Líder de Comunicações executará o seguinte plano:

Público Método de Comunicação Primário Método Secundário (se primário falhar) Frequência de Atualização
Equipe de DR Grupo de WhatsApp/Telegram "Crise TI" Ligação Telefônica Direta A cada 30 minutos
Todos os Colaboradores E-mail geral para @nomedaempresa.com Mensagem em Grupo de WhatsApp Geral A cada 60-90 minutos
Clientes Chave Contato direto pelo Gestor da Conta E-mail de Status  Conforme necessário
Público Geral/Clientes Postagem na página de Status/Redes Sociais Banner no site principal A cada 2 horas

5. Análise de Impacto e Objetivos de Recuperação

Definimos a criticidade e os objetivos de tempo (RTO) e ponto de recuperação (RPO) para cada sistema.

  • RTO (Recovery Time Objective): Tempo máximo aceitável para restaurar a função do sistema.

  • RPO (Recovery Point Objective): Perda de dados máxima aceitável (medida em tempo).

Sistema Criticidade RTO (Tempo para Voltar) RPO (Perda de Dados) Estratégia de Backup
Chat e Voz (Atendimento) Alta 4 Horas 1 Hora Backup diário das configurações de fluxo e integrações
Orquestrador de Mensagens Alta 4 Horas 1 Hora Backup diário das configurações de fluxo e integrações
Discador Automático Média 8 Horas 24 Horas Exportação semanal das listas de contatos e configurações
Sistemas de Automação Média 8 Horas 24 Horas Backup diário/semanal das configurações e fluxos

6. Procedimentos de Recuperação por Sistema

6.1. Procedimento Geral (Primeiros Passos)

  1. Diagnóstico: O Líder Técnico verifica a conectividade interna e acessa a página de status de cada fornecedor de serviço (ver Apêndice B).

  2. Contato com Suporte: Se a página de status não indicar um problema, abrir um chamado de emergência com o fornecedor.

  3. Ativação do Plano: Se o problema for confirmado como um desastre, o Coordenador de DR ativa formalmente o plano.

6.2. Sistemas de Chat e Voz (VoIP)

  • Estratégia Primária (Falha do Provedor):

    1. O Líder Técnico contata o suporte de emergência do fornecedor (ex: Twilio, Zenvia).

    2. O Líder de Comunicações informa colaboradores e clientes sobre a instabilidade nos canais de voz e chat.

    3. Aguardar a resolução pelo fornecedor, que geralmente possui redundância geográfica.

  • Estratégia de Contingência (Plano B - Se o provedor demorar a voltar):

    1. Voz: O Líder Técnico redireciona o número de telefone principal (0800 ou fixo) para um ou mais números de celular pré-definidos da equipe de atendimento.

    2. Chat: Desativar o widget de chat no site. 

    3. A equipe de atendimento utiliza caixas de e-mail e o WhatsApp Web para continuar o suporte.

6.3. Orquestrador de Mensagens

  • Estratégia Primária (Falha do Provedor):

    1. Contatar o suporte de emergência do fornecedor.

    2. Informar as equipes que a distribuição automática de mensagens está interrompida.

  • Estratégia de Contingência (Plano B):

    1. Acesso Direto aos Canais: As equipes devem acessar as plataformas de origem diretamente para responder às mensagens.

      • WhatsApp: Acessar o WhatsApp Business/Web.

      • Facebook/Instagram: Acessar a Caixa de Entrada da Meta Business Suite.

      • E-mail: Acessar a caixa de e-mail de suporte diretamente.

    2. A distribuição de mensagens será manual até o restabelecimento do orquestrador.

6.4. Discador Automático

  • Estratégia Primária (Falha do Provedor):

    1. Contatar o suporte de emergência do fornecedor.

    2. A equipe de vendas/outbound interrompe as atividades de discagem.

  • Estratégia de Contingência (Plano B):

    1. O Líder Técnico localiza a última exportação das listas de contatos (mailing).

    2. A equipe de vendas realiza chamadas manuais utilizando celulares ou o sistema de VoIP (se estiver funcionando) com base na lista exportada. A produtividade será menor, mas a operação não para completamente.

6.5. Sistemas de Automação

  • Estratégia Primária (Falha do Provedor):

    1. Contatar o suporte de emergência do fornecedor.

    2. A equipe de marketing/operações fica ciente de que fluxos automáticos (e-mails, leads, etc.) estão parados.

  • Estratégia de Contingência (Plano B):

    1. As atividades críticas que dependem de automação (ex: envio de propostas, qualificação de leads) devem ser feitas manualmente.

    2. Utilizar planilhas para controle de leads e follow-ups.

    3. Pausar campanhas de marketing pagas que direcionam para fluxos de automação quebrados para evitar desperdício de verba.


7. Retorno à Normalidade (Fallback)

  1. Confirmação: O Líder Técnico, junto aos fornecedores, confirma que os sistemas estão 100% operacionais.

  2. Validação: O Líder de Operações realiza testes em cada sistema (envia um chat de teste, faz uma ligação, recebe uma mensagem no orquestrador).

  3. Desativação da Contingência: O Líder Técnico reverte as configurações de contingência (ex: remove o redirecionamento de chamadas, reativa o chat no site).

  4. Comunicação Final: O Líder de Comunicações envia um comunicado a todos os públicos informando que a situação foi normalizada.

  5. Revisão Pós-Incidente: A Equipe de DR se reúne em até 48 horas para documentar as lições aprendidas e propor melhorias a este plano.


8. Testes e Manutenção do Plano

  • Revisão do Plano: Este DRP deve ser revisado e atualizado a cada 6 meses ou sempre que um sistema crítico ou fornecedor for alterado.

  • Teste de Simulação (Tabletop): Realizado a cada 6 meses. A equipe se reúne para discutir um cenário de desastre hipotético e validar os passos do plano.

  • Teste de Contingência: Realizado anualmente. Testar um procedimento de contingência real (ex: redirecionar a linha telefônica por 30 minutos fora do horário de pico).