Como coletamos, processamos e verificamos os dados — passo a passo
O Crime Brasil processa exclusivamente dados abertos publicados por órgãos governamentais. Não compramos dados, não recebemos dados em sigilo e não usamos técnicas de raspagem sobre portais fechados.
As fontes são acessadas de duas formas:
O pipeline de ingestão é executado mensalmente e verifica automaticamente se há novos arquivos disponíveis. Cada arquivo é identificado por um hash SHA-256 antes de ser processado, garantindo que o mesmo lote de dados nunca seja contado duas vezes.
Um dos maiores desafios em dados de segurança pública é a inconsistência nos nomes de bairros e municípios entre registros do mesmo estado. Identificamos e corrigimos mais de 208 variantes conhecidas.
PASSO PEDRAS e PASSO DAS PEDRAS → mesmo bairro de Porto AlegreBOMFIM e BOM FIM → mesmo bairro de Porto AlegreCORONEL APARICO e CORONEL APARICIO BORGES → mesmo bairroCENTRO HISTÓRICO, CENTRO HISTORICO e CENTRO → verificados caso a caso por municípioPara municípios, mantemos um dicionário de aliases que mapeia grafias alternativas usadas pelas secretarias estaduais para o nome canônico do IBGE. Por exemplo: SANTANA DO LIVRAMENTO (SSP) → SANT’ANA DO LIVRAMENTO (IBGE).
Antes de qualquer publicação, cada número passa por um pipeline de verificação que cruza a API com os arquivos-fonte originais. O processo usa uma suíte de 68 testes automatizados:
Artigos e análises têm uma verificação adicional: antes de publicar, rodamos um script de verificação específico para cada artigo que valida cada número citado no texto contra a base de dados ao vivo.
Todas as taxas usam as populações do Censo 2022 do IBGE. Para municípios e estados, usamos as populações censitárias divulgadas oficialmente. Para bairros, estimamos a população por agregação de setores censitários usando os limites geográficos oficiais da malha territorial do IBGE.
A fórmula é taxa = (ocorrências / população) × 100.000, aplicada sobre o período selecionado. Para períodos menores que 12 meses, não annualizamos automaticamente — a taxa exibida é sempre para o período exato consultado.
A profundidade dos dados varia conforme o que cada secretaria publica. O Crime Brasil não inventa dados onde não existem — a granularidade real de cada estado é exibida transparentemente:
Para estados com cobertura parcial (MG apenas crimes violentos; SC e SP com categorias limitadas), sinalizamos a limitação ao lado dos dados para evitar comparações enganosas.
O pipeline de atualização automática roda a cada 7 dias e verifica se há novos arquivos disponíveis nas fontes primárias. Quando novos dados são publicados pelas secretarias, são ingeridos automaticamente dentro de 24 horas.
O snapshot de SEO (que alimenta as páginas por município e bairro) é regenerado diariamente às 05h30 UTC. A data do dado mais recente disponível é exibida em cada página.
Se encontrou um dado que parece incorreto, use o botão de reporte de problema no site ou envie e-mail para [email protected]. Todos os relatos são investigados contra os arquivos-fonte. Correções são publicadas com nota de transparência.
Para mais detalhes sobre o projeto e a equipe, veja a página Sobre o Crime Brasil.
Última atualização: maio de 2026 · Crime Brasil