Em meados do ano passado (2023), duas plataformas de Geomarketing disputaram o título de “primeira a atualizar” sua base de dados com as informações do Censo 2022.
Mesmo quando, àquela altura, as informações ainda estavam limitadas à escala dos municípios e sujeitas a alterações, conforme o próprio IBGE advertia.
Vale destacar que o texto da primeira é mais exagerado, afirmando que o Censo 22 já está na plataforma, enquanto a outra, mais cuidadosa, descreve corretamente os dados que foram atualizados, mas no plano geral dá a entender que os dados do Censo 2022 estão na plataforma deles.
Ao largo de tal disputa, aqui na Mapfry, continuamos com a projeção a partir do Censo 2010, surpresos com a abordagem rasteira de nossos colegas, que distorceram conceitos complexos em uma corrida de marketing.
Tamanha malícia nos obrigou a marcar posição a fim de afastar de movimentos tecnicamente rasos.
Aproveitamos a ocasião para sustentar a importância do rigor com as informações publicando o artigo:
Riscos das utilização antecipada das informações do Censo 22
Em agosto de 2024 o IBGE divulgou uma revisão das estimativas populacionais, algo que já estava previsto na metodologia, mas que surpreendeu os apressadinhos.
Censo nuevo, pero no mucho
Naquela ocasião, a única informação disponibilizada pelo Censo 2022 era a de População e Domicílios por Municípios.
Tal métrica é importante para ajustar as bases, mas insuficiente para se ver refletida das demais dimensões como População por Idade, Moradores por Domicílio, Renda.
O desafio que se coloca é, como distribuir os novos números numa escala inferior?
Ou seja, desagregar a informação de um município em seus bairros e quarteirões sem ter noção de como estão as estruturas inferiores.
Uma saída simples é fazer uma inferência linear, a famosa regra de três, se a população aumentou 2% no município, aumenta-se 2% em todas as faixas.
Considerando que o maior valor do Geomarketing está na granularidade, a inferência linear nada diz de novo, apenas usa uma informação nova para ajustar os números do Censo 2010.
O que é válido e ainda neste texto vamos explicar nossa metodologia, mas daí a chamar isso de “Atualização do novo Censo” é exagero.
Deixando de lado esse baixo astral, agora, oito meses depois, o cenário é outro.
Altas expectativas
O calendário de divulgação das informações do Censo 2022 se aproxima de entregas materiais para o Geomarketing.
A primeira delas foi a divulgação do Censo das Coordenadas Geográficas dos Endereços.
Esta pesquisa inédita em Censos anteriores é resultado da captura de informações georreferenciadas de diversos momentos da pesquisa, desde os trajetos percorridos até cada visita aos endereços.
Uma base monumental de informações sobre onde as coisas realmente aconteceram.
Ela vai nos mostrar os lugares onde existem novos endereços, lugares onde não existem endereços, a primeira visão ponto a ponto do novo Censo.
De todas, a divulgação mais importante ainda está por vir, que são os dados do universo pesquisado abertos por Setores Censitários.
Ao falar sobre o "universo do Censo em Setores", estamos nos referindo a informações detalhadas sobre todas as pessoas e domicílios pesquisados.
Nessa hora, teremos a perspectiva completa do quantitativo e do qualitativo em cada local.
Censo, manual de uso
Assim que tivermos as informações sobre o universo, vai começar um processo de comparação entre as informações.
Muita calma nessa hora, pois estaremos comparando uma projeção, que são métodos quantitativos super válidos, com uma pesquisa em si.
Em termos comparativos, um Censo vale muitas vezes mais que a projeção em termos de verdade.
Como vimos no artigo Um novo dia, um novo Censo
Um novo Censo muda o jogo
Muda muito mais que isso, mudam as estruturas dos questionários, o desenho dos Setores Censitários, o sentido das respostas.
Comparar Censos exige cuidados.
É como dizer que a população de um município encolheu quando, na verdade, uma parte dele foi emancipada.
O Censo mais antigo que temos, de 1872, dava conta de 643 municípios no Brasil, contra 5.570 hoje.
Como você faria para comparar dados de diferentes períodos de uma maneira que reflita as mudanças reais na população ou nas condições sociais, eliminando ou minimizando os efeitos de variações metodológicas ou geográficas?
Para este fim, existe o conceito de áreas minimamente comparáveis no tempo, uma sofisticada metodologia de equivalências espaciais ao longo das inúmeras transformações nas áreas de análise.
Garantir a comparabilidade ao longo do tempo envolve a padronização de categorias em benefício da consistência das variáveis e a adaptação em função das mudanças nas fronteiras geográficas.
Comparar dados também exige cuidados
Ao longo do tempo, profissões são criadas, cursos técnicos são convertidos em educação superior, a moeda mudou várias vezes, a inflação agiu em ondas.
Não é uma questão meramente lógica-matemática comparar Censos e outras informações populacionais, é preciso ter conhecimento da história recente para que cada informação seja ajustada ao seu maior valor informativo no tempo.
É aí que mora o perigo, aí que todo mundo caiu lindo
A Demografia é uma área de estudos essencialmente acadêmica, sendo um mestrado frequentado por profissionais com forte base estatística e muita visão humanística para perceber as pessoas nos números.
Nossa equipe técnica é formada por especialistas em bases geodemográficas, incluindo um mestre em Demografia pela Universidade de Campinas (Unicamp).
Conheça alguns temas estudados no mestrado que são instrumentos para nossas metodologias:
- Questões Demográficas atuais - apresentação da diversidade de abordagens interdisciplinares da Demografia
- Análise Demográfica - levantamento, validação e normalização de fontes de dados
- Laboratório de análise Demográfica - tópicos como fecundidade e mortalidade, mobilidade e migração populacional
- Estudos sobre família e nupcialidade - atualização do conceito de família a partir de dados
- Geoprocessamento aplicado às Ciências Sociais
- Políticas de população - como os governos usam a demografia para desenhar políticas públicas
- Tópicos avançados em Demografia - questões de saúde e gênero, história das populações e sua heterogeneidade
- Metodologia Quantitativa Aplicada à População
- Bancos de dados em Demografia
- Projeção populacional com uso de modelos matemáticos - métodos matemáticos para a demografia moderna, modelagem de fertilidade, mortalidade, migração e projeções demográficas
Data as a Service
As plataformas de Geomarketing se enquadram na categoria de Software como Serviço (SaaS), mas oferecemos mais que sistemas, você recebe informações de mercado, populacionais e econômicas.
Portanto, também oferecemos bases de dados como serviços, uma vez que fazemos toda a gestão das informações, desde sua estrutura básica até a leitura e interpretação no sistema (Data as a Service).
Existem inúmeros meios para se fazer um sistema de computador, diferentes linguagens de programação, bancos de dados, interfaces.
Já pelo lado das informações, não existem tantas possibilidades, havendo um padrão-ouro formado por metodologias continuamente validadas e consagradas.
Entenda um pouco mais sobre a metodologia de projeção e comparação
Vamos pensar num município que tivesse 1.000 habitantes e 300 domicílios contados no Censo de 2010.
Para facilitar, vamos imaginar que os principais grupos etários e de renda estejam divididos em quartis, que são blocos de 25% cada.
Então teríamos 25% de crianças e adolescentes, ou seja 250 crianças e adolescentes, 25% de jovens, 25% de adultos e meia idade e 25% de idosos.
Também teríamos 25% de renda muito baixa, ou seja, 75 famílias de renda muito baixa, 25% de renda baixa, 25% de renda média, 25% de renda alta.
Passados 5 anos do Censo 2010, decidimos atualizar essas informações na projeção.
Para isso, usamos uma série de fontes de dados, que são validadas e normalizadas bem na linha do que foi ensinado no curso de Análise Demográfica.
Digamos que as fontes de dados indiquem que a população cresceu 2% e agora contam-se 1.020 habitantes.
Como alocar esses 20 novos habitantes entre os domicílios?
Na ocasião do Censo 2010, tínhamos 1000 habitantes residindo em 300 domicílios, uma média 3,3 moradores por domicílio.
Desafios:
Devemos alocar os novos habitantes nos mesmos 300 domicílios, aumentando a média de moradores por domicílio para 3,4 ou devemos aumentar a quantidade de domicílios para acomodá-los mantendo a média de 3,3?
Esses 1020 habitantes são os mesmos 1000 contatos antes com a adição de 20 novos ou ocorreram mortes, nascimentos e migrações neste período?
O crescimento dos habitantes ocorre em todos os grupos etários ou existem alguns onde ele é mais ou menos representativo?
Podemos manter a distribuição de classes de renda ou ela se alterou, talvez com mais domicílios migrando de renda média para renda baixa?
Agora que você viu o perigo, é capaz de entender, talvez melhor que muita gente que se diz especialista, que não dá para usar regra de três em Demografia.
A metodologia correta vai trabalhar com:
Pesos amostrais e analíticos
Informações provenientes de levantamentos entre Censos, amostras com tamanhos reduzidos, mas proporcionalmente semelhante ao todo, sendo capazes de espelhar suas características e assim expandir a informação da amostra para o universo.
Essa expansão embute um tremendo risco, de representar demasiadamente um fenômeno enquanto sub-representa outros, tal erro pode passar despercebido por sistemas de análise de dados, levando à falsa impressão de que o modelo é representativo da realidade.
A fim de evitar este cenário, o especialista vai aplicar uma contra-medida, que são os pesos analíticos, que definem os limites de expansão.
Tendo estabelecido estes ajustes, podemos processar diversos modelos, cenários e sobreposições, até encontrarmos um padrão composto por todas as variáveis que nos permita estimar as flutuações possíveis, respeitando as dinâmicas locais e regionais.
Somente assim estabelecer quem são e onde estão os 20 novos habitantes e todas as mudanças com os demais 1000.
Seguindo adiante, digamos que as informações de um novo Censo sejam liberadas
Elas dão conta de 980 habitantes neste mesmo município, uma queda de 4% em relação à última projeção.
Tendo visto a metodologia, você vai aplicar os modelos e chegar a uma distribuição.
Mas essa informação não é, nem pode ser chamada de novo Censo.
Trata-se apenas de uma atualização da projeção do Censo de 2010 com algumas informações do novo Censo, ainda em estruturas do Censo 2010.
Uma das empresas alegou ter montado um relatório comparativo entre o Censo 2010 e o Censo 2022 😱
Afora a comparação entre População e Domicílios, que foram as únicas disponibilizadas pelo IBGE na ocasião, e estão aqui caso você queira dar uma olhada, qualquer outra comparação seria entre o Censo 2010 e suas projeções.
O uso de algum dado do novo Censo na projeção não justifica dizer que é uma atualização para o novo Censo.
Censo é Censo, projeção é projeção, OK?
Comparando Censos
Lembra das áreas minimamente comparáveis no tempo?
Vamos usá-las aqui.
Em primeiro lugar temos uma vantagem, se entre os Censos de 1872 e o de 2010 o número de municípios cresceu quase 9 vezes, a variação entre 2010 e 2022 foi mínima.
Então o principal desafio vai estar na escala intramunicipal, comparar bairros com bairros, quarteirões com quarteirões em momentos tão diferentes quanto 2010 e 2022.
Esse é o principal movimento técnico que estamos fazendo agora, migrando a base de informações mais granulares, os Setores Censitários de 2010 para os Setores Censitários de 2022.
O Censo 2010 organizou suas informações em 314 mil Setores, enquanto o Censo 2022 foi dividido em 450 mil Setores, um aumento de 40%.
Eis o primeiro desafio, migrar informações de uma base de 314 mil Setores Censitários para outra 40% mais fragmentada.
Portanto, as informações que estamos atualizando na plataforma são uma Projeção do Censo 2010 com informações do Censo 2022 e apresentadas na nova estrutura de Setores Censitários.
Essa metodologia foi adotada em antecipação à chegada dos dados completos por Setores Censitários do novo Censo, que será o momento mais importante para nós nos últimos anos e que permanecerá importante pelos próximos 10 anos.
Estamos muito animados com a chegada desse recurso valiosíssimo.
Também estamos realizados por termos guardado a metodologia, mantido a firmeza enquanto concorrentes acusavam¹ nossa base de estar "desatualizada".
Agora nos está reservado o reconhecimento de que nossas informações estão no mais elevado patamar.
--------------
(1)