Serviços O conteúdo desse portal pode ser acessível em Libras usando o VLibras

Dataset Coorte 100M SINASC-SIM

GCE em 3 de Abril de 2018

O CIDACS está participando da chamada GCE Brasil como provedor de dados, disponibilizando  a Coorte de 100M SINASC-SIM.

A Coorte 100M SINASC-SIM é uma base de dados (dataset) para pesquisa em saúde. É um dos produtos gerados pelo Cidacs através da vinculação (linkage) de dados de indivíduos do Cadastro Único (CadÚnico) com dados dos mesmos indivíduos no Programa Bolsa Família (PBF), no Sinasc e no SIM (veja fontes de dados abaixo). O CadÚnico é um cadastro nacional de indivíduos elegíveis para programas sociais do governo federal. O PBF é um programa nacional de transferência de renda condicional que transfere dinheiro para famílias pobres quando cumprem condições relacionadas à saúde e à educação. Indivíduos na base de dados do PBF devem estar registrados no CadÚnico. Sinasc é o cadastro de certificados de nascimento. SIM é o cadastro de certificados de óbito.

A Coorte 100M SINASC-SIM é constituída por 114 milhões de indivíduos pertencentes a famílias de baixa renda (que recebem renda per capta de menos de 3 salários mínimos) que são elegíveis para programas sociais do governo federal, representando cerca de 55% da população brasileira. Para esta população existem informações socioeconômicas, demográficas, de moradia, saneamento, remuneração e trabalho, despesas, escolaridade, composição familiar, nascimentos, dados do recém-nascido, dados de gravidez e parto da mãe, e dados de óbitos. Esta Coorte fomenta pesquisas científicas sobre a saúde da mulher e da criança.

Acesse o dicionário de dados

Acesse a relação de dados semi-identificadores

Conheça a Condição para Publicação dos Produtos do GCE

 

Plataforma

No Cidacs, criou-se uma plataforma de dados para uso em pesquisa em saúde. Esta plataforma habilita o recebimento, armazenamento, processamento, preservação e disponibilização de grandes volumes de dados (bigdata). Esta inovação propicia agilidade na produção científica, cujas evidencias podem ser obtidas mais rapidamente, com baixos custos. Essa agilidade tem o potencial de impactar de forma decisiva na orientação de intervenções em saúde e em politicas públicas sociais, melhorando as condições de vida da população brasileira. Nesta plataforma, dados administrativos governamentais são processados e vinculados resultando em bases prontas para responder a questões científicas de saúde. Isto significa em aplicar procedimentos de limpeza, padronização e harmonização aos dados, integrando-os de forma longitudinal para acompanhamento dos indivíduos ao longo do tempo.

Produção

A população do Coorte de 100M SINASC-SIM foi obtida a partir do Cadastro Único, instrumento do governo federal que cadastra e caracteriza as famílias de baixa renda. Considerou-se como critério de inclusão, a data de cadastro do indíviduo. A extração de dados foi obtida por meio do nome do indivíduo, nome da mãe, data de nascimento, número de identificação social (NIS) e a data de cadastro das famílias no Cadastro Único. Assim, foram identificados 114.001.661 indivíduos e 40.542.929 famílias. Para constituir as informações longitudinais foram extraídos os dados atualizados entre o período de 2006-2015. As atualizações cadastrais ocorrem para os beneficiários de programas sociais e para os indivíduos com alteração na composição familiar.

Em seguida, foram vinculados os dados das famílias beneficiárias do Programa Bolsa Família (PBF) por meio do NIS, a fim de obter informações sobre: número de pessoas na família, número máximo e mínimo de pessoas na família por quadrimestre, valor total recebido, valor recebido por quadrimestre e anual, tempo de recebimento do beneficio, início e final do recebimento por ano. Os dados sobre os beneficiários do PBF foram extraídos das folhas de pagamento do programa (2004-2015) considerando os titulares. Por fim, dados do SINASC (2001-2015) e SIM (2000-2015) foram vinculados a esta população. Esta vinculação foi realizada utilizando os seguintes atributos: nome do indíviduo, nome da mãe, data de nascimento, sexo e município de residência. Os dados do Sinasc incluem informação sobre a saúde do recém-nascido, gestação, gravidez, parto e consultas de pré-natal da mãe. Foram vinculados à população da Coorte, 100% dos registros de famílias beneficiárias do PBF, cerca de 68% dos nascidos vivos (Curva Roc= 0,95%) e 50% dos óbitos menores de 5 anos.

 

Fontes de Dados

Uma descrição das fontes de dados que deram origem a coorte pode ser encontrada nos links abaixo.

Download
NewsletterNovidades Cidacs