Quanto à região, há dominância no Nordeste em relação ao Sudeste nos grupos 0, 1 e 2. Quanto aos modelos de urnas, há proporcionalmente mais urnas antigas do que na média geral. No grupo 3, já fica mais próximo da média geral. (60% antiga, 40% nova)
app.powerbi.com
app.powerbi.com
O formato do gráfico do grupo 1 é praticamente um triângulo retângulo, similar ao que seria, matematicamente, uma função trigonométrica. Curioso que a inteligência artificial tenha separado esses pontos dessa maneira.
Nas frequências, nota-se bimodal no exterior.
Nas frequências, nota-se bimodal no exterior.
Ou seja, apenas considerando votos em B, L, brancos, nulos, abstenções e taxa de não habilitados biometria, o algoritmo foi capaz de segmentar um grupo sozinho contendo mais frequência de votos de urnas novas, e grupos menores contendo mais frequência em urnas antigas.
Esse trabalho complementa o outro, pois utilizou outras variáveis. Aqui focamos apenas nas variáveis da eleição: votos em B, L, Brancos, Nulos, Abstenções e taxa de não habilitados biometria. Todos números da mesma ordem de grandeza (entre 0 e 1).
O fato de não ter usado nenhuma variável de modelo e a inteligência artificial acabar agrupando dessa maneira foi bastante surpreendente e positivo. Sinal de que sempre podemos nos impressionar do que os dados podem oferecer. Espero que essa nova thread tenha sido educativa!
Para ver o notebook completo no GitHub, basta clicar no link abaixo.
github.com
github.com
Caso queira rodá-lo, agora está bem fácil fazê-lo no Google Colab. Demora um pouco para rodar a parte de Machine Learning na versão gratuita e vc precisará colocar os datasets do repositório no seu Google Drive. Mas é bem tranquilo.
colab.research.google.com
colab.research.google.com
Importante: existe uma caixa em que estava tentando configurar Spark para usar GPU, mas não funcionou. De qualquer maneira, fica o desafio caso você queira contribuir. Por enquanto, use a caixa de CPU mesmo.
[]s e sucesso!
[]s e sucesso!
Loading suggestions...