Este repositório contém a entrega do nosso projeto de Global Solutions para a disciplina de Statistics for Machine Learning and AI (1º Semestre - 2025). Nosso time foi desafiado a atuar como cientistas de dados para o Governo de São Paulo, utilizando o poder dos dados para analisar informações críticas e auxiliar no combate à desinformação (Fake News).
Fomos contratados para auxiliar o Governo de São Paulo na análise e refutação de narrativas sobre a gestão de desastres. O cenário proposto é claro:
- O atual governo iniciou em 2021, e o partido da oposição esteve no poder entre 2016 e 2020.
- Nosso desafio é investigar diversas alegações e, com base em análises de dados, classificá-las como "Fake" ou "Not Fake".
- Além disso, geramos insights e argumentos para defender a gestão governamental.
Para isso, mergulhamos no Sistema Nacional de Informações sobre Segurança de Barragens (SNISB), um dataset rico que nos permite explorar eventos críticos e suas implicações.
Este projeto foi desenvolvido utilizando as seguintes ferramentas e bibliotecas:
- Python: Linguagem de programação principal.
- Pandas: Para manipulação e análise de dados.
- NumPy: Para operações numéricas eficientes.
- Matplotlib / Seaborn: Para criação de visualizações e gráficos.
- Scikit-learn: Para modelos de Machine Learning (se utilizados futuramente).
- Google Colab: Ambiente de desenvolvimento interativo.
Antes de qualquer análise aprofundada, exploramos o dataset para responder:
- Quantas linhas e colunas temos?
- Quantos municípios e UFs estão registrados?
- Qual é o período mínimo e máximo registrado para desastres?
- Quais os tipos de desastres registrados?
Este blog alegou um aumento drástico dos incêndios florestais desde o início do governo atual. Validamos:
- Frequência de incêndios antes (2016-2020) e depois (a partir de 2021).
- Gráfico comparativo.
- Se a alegação é "Fake" ou "Not Fake".
- Estratégia de resposta baseada nos dados.
A conta @SomosDoBrasilOficial postou: "Nunca houve na história desse país tantos desabrigados!!!". Verificamos:
- Histórico de desabrigados em SP.
- Gráfico para identificar tendências.
- Se a alegação é "Fake" ou "Not Fake".
- Melhor forma de resposta governamental.
O PLC afirmou que escolas danificadas aumentaram 5%, destruídas cresceram 7% e o total subiu 10%. Investigamos:
- Dataset com histórico de danos em instituições de ensino.
- Comparação entre governos anteriores e atuais.
- Validação da afirmação como "Fake" ou "Not Fake".
- Estratégia de resposta.
Diante de manifestações sobre aumento de mortes, feridos, desabrigados e gastos, analisamos:
- Dados históricos sobre vítimas e infraestrutura.
- Gastos governamentais com danos materiais.
- Argumentação baseada nos dados para responder jornalistas.
Com esse projeto, utilizamos dados e ciência para combater a desinformação e reforçar a importância da análise crítica na gestão de desastres! 🚀