Serviços   O conteúdo desse portal pode ser acessível em Libras usando o VLibras

Ciência de Dados: a integração do conhecimento a favor da saúde

Escrito por Karina Costa  em 20 de setembro de 2022

Passados 7 anos da epidemia de Zika, como será que estão as crianças que nasceram àquela época? Será que aumentando a renda das pessoas, elas irão aderir melhor a um tratamento de hanseníase ou ainda, vão estar mais protegidas do suicídio? É possível responder a essas perguntas e muitas outras, sem precisar aplicar questionários com cada um dos envolvidos. Tudo isso porque o Brasil dispõe de centenas de base de dados de saúde e dados sociais, como o Cadastro Único. Mas a grande questão da ciência é como fazer, e é aí que Centro de Integração de Dados e Conhecimentos para Saúde (Cidacs/Fiocruz Bahia) conforma sua atuação científica.

O Cidacs trabalha reutilizando um grande volume de dados sociais e de saúde coletados para fins administrativos e reúne profissionais com saberes de diversas ciências, da vida, exatas, da Terra e humanísticas, a fim de gerar novas pesquisas para observações populacionais na ordem de milhões, o que não há precedentes. Esse ineditismo, por vezes, esbarra em desafios como as dificuldades de encontrar recursos humanos que sejam capazes de trabalhar nesse contexto desafiante da ciência de dados. É nesse contexto que o Cidacs participa do Programa de Formação Técnica em Ciência, Tecnologia e Inovação em Saúde (Profortec – Saúde) e integrou em seu quadro duas pessoas para se formarem cientistas de dados voltadas para a saúde.

Foi então, há um ano, que a técnica em eletrônica, Anne Tamura, e a técnica em Petróleo e Gás, Edineia de Jesus, foram selecionadas no edital promovido pela do Diretoria de Ensino do Instituto Gonçalo Moniz (IGM/Fiocruz Bahia). Promovido pela Fundação Oswaldo Cruz (Fiocruz), o edital adaptado para o Cidacs oferece uma formação que vai desde a compreensão básica da epidemiologia até o entendimento das bases de dados e como essa área pode contribuir para melhorias da saúde pública. As aulas são presenciais e on-line, com bolsa de pesquisa, e, daqui a seis meses sairão, com um diploma técnico de cientistas de dados.

“É algo totalmente novo para mim, eu não sabia da aplicação dos dados dessa forma na saúde”, comenta a cientista de dados em formação, Edineia de Jesus, que já era licenciada em Química e estava pós-graduação em ensino de ciências e matemática quando decidiu participar da seleção. Para ela, o campo da saúde era de enfermeira, técnicos de enfermagem, médicos e não havia espaço para quem vem da Tecnologia da Informações, ou áreas semelhantes.

Ciência de Dados no Cidacs

O cientista de dados é alguém capaz de trabalhar essas informações que parecem apenas centenas de planilhas, ou recuperar informações dos sistemas de informação, deixando esses dados prontos para as diversas possibilidades de análise. A ciência de dados permite a tomada de decisão baseada em evidências científicas, oferecendo a gestores a oportunidade de direcionar os recursos da melhor forma.

No Cidacs, os setores operacionais que atuam com ciência de dados estão reunidos na Plataforma de Dados, que faz a governança desses dados, transforma as bases criadas para gestão pública em datasets que podem ser utilizados para responder perguntas científicas – .

Inicialmente, os profissionais da Plataforma recebem as bases de dados cedidas ao Centro, identificando todas as variáveis que cada base apresenta e como está descrita no dicionário que vem com cada uma. Além disso, ele documenta, registra e aponta todas os riscos que cada um desses conjuntos de informações apresenta. Essa é a parte do trabalho dos cientistas de dados que atuam na Curadoria. É com esse setor que os pesquisadores definem quais são as informações importantes para responder suas questões de pesquisa, preenchendo um plano de dados.

Já quando chega ao Núcleo de Produção de Dados (NPD), essas bases passam por um longo processo de tratamento e harmonização, ou seja, colocá-las em um padrão de compatibilidade único. Logo depois, os profissionais do Núcleo rodam algoritmos para integração dos dados, avaliam a validade desse resultado e entrega esse conjunto de dados tratados (dataset), já anonimizados e acessíveis apenas em ambiente controlado, para o grupo de pesquisa demandante.

E é esse dataset que vai permitir que, com os conhecimentos multidisciplinares de cada área, nossos cientistas encontrem os métodos apropriados para identificar as respostas para suas questões e então descobrir associações que impactam sobre os desfechos das crianças da Zika, dos tratamentos de hanseníase ou de suicídio, entre muitos outros temas de estudos.

Outra potencialidade do trabalho do cientista de dados é a construção de painéis de visualização, como foi feito no Índice Brasileiro de Privação (IBP) ou Índice de Desigualdades Sociais para Covid-19 (IDS-COVID-19). Durante a fase já inicial da pandemia, por exemplo, a equipe de cientistas de dados construiu o Painel Coronavírus, um dos primeiros do país e que depois originou um mais específico para Salvador. Em uma construção de visualização de dados, além de um conhecimento de estatística intenso e linguagem de programação, é preciso também saberes multidisciplinares uma vez que a visualização requer entendimento de comunicação.

Para se ter ideia, o caso do Painel Coronavírus, as mais de 5 mil secretarias municipais brasileiras repassam os dados todos os dias e os cientistas de dados criam sistemas para receber essas informações, atualizar durante todo o dia. Depois que recebe esses dados, eles passam a dar cor mais intensa ou clara aos mapas,  são  associados aos modelos matemáticos, realizam os desenhos dos gráficos e ajudam aso gestores de saúde a fazerem “previsões”.

Com licenciatura em matemática e formação técnica em eletrônica, Anne Tamura diz que a multidisciplinaridade a “fez ter interesse em saber como isso podia acontecer, como chegava a uma conclusão com os dados e quais dados eram necessários, curiosidade despertou esse interesse”. Ela relata que conheceu o Cidacs pelas redes sociais e que ao ver os materiais divulgados decidiu que “queria estar nesse lugar”.

E o SUS? 

Quando se pergunta como sua formação pode contribuir para o Sistema Único, ela responde que “o SUS possui inúmeras lacunas que precisam ser estudadas para melhorar o sistema. Um cientista pode propor melhorias com base nos dados disponibilizados pelo Sistema, construindo dessa forma maneiras de alcançar índices que diminuam essas lacunas”.

Para entender o que Anne e Edineia estão aprendendo, é preciso compreender um pouco do que já foi feito usando conhecimentos de dados no Cidacs. As aplicações do uso de dados podem ser teóricas, quando se faz uma avaliação de política pública. Dessa forma é possível perceber quais ações foram mais bem-sucedidas e quais merecem uma revisão, tudo com informações que já existem nas bases de dados do Sistema de Saúde ou de Políticas Sociais. É possível desenvolver aplicativos, identificar áreas em que o recurso confira maior retorno.

A Plataforma de Dados do Cidacs além de ter atuado para responder de forma segura e ética, as perguntas de pesquisa, garantindo a privacidade dos usuários dos sistemas públicos, também já esteve presente no desenvolvimento de tecnologias e inovações para o SUS, sendo parte de um projeto piloto na cidade de Camaçari, na Atenção Básica, criando estruturas para uso de tecnologias móveis para os Agente Comunitários de Saúde (ACS). As possibilidades são muitas e as formas responder aquelas perguntas lá do começo e as muitas outras são diversas, é questão de convergir e integrar conhecimentos. É o que se espera de um cientista de dados.

Como são as aulas?

As estudantes têm aulas expositivas e práticas ministradas por tutoras e tutores. No Módulo de Introdução à Metodologia Científica, o primeiro contato delas foi com a leitura de artigos científicos para que as estudantes possam entender a finalidade e se ambientarem com a escrita científica. Em seguida, elas tiveram o Módulo de Segurança da Informação, começando a compreender como funciona a segurança e anonimização, a importância do sigilo das informações e o motivo da segurança dos dados. Com esses saberes, os profissionais podem iniciar em uma carreira que atua na proteção de dados pessoais, por exemplo, como evitar que dados de um hospital, de um cadastro de doenças fiquem expostos ou sejam identificáveis.

Passados os primeiros blocos, elas estudaram temas relacionados à Epidemiologia em materiais de nível básico, que descreve os principais tipos de estudos e cálculos realizados, além das formas como são feitas as observações.  E no quarto momento, elas tiveram contatos com dados administrativos do Departamento de Informática do SUS (DataSUS) e realizaram atividades práticas de extração e análise das informações.  Agora, estão iniciando os estudos em ciências de dados, com as técnicas e possibilidades da área. Assim, elas poderão compreender a pesquisa em saúde em que estão inseridas, os aspectos envolvidos, e dessa forma desenvolver melhor ou aplicar as técnicas adequadas.

A formação de cientistas de dados não atende apenas uma lacuna do Cidacs, mas de diversas instituições de pesquisa e por isso foi preciso repassar os conhecimentos já criados aqui. “É também uma forma de devolvermos à sociedade o que construímos até hoje em áreas afins com a Ciência de Dados, além de oportunizar conhecimentos de Curadoria, Segurança da informação, Epidemiologia, entre outros”, explica o supervisor do Programa, o pesquisador do Cidacs/Fiocruz Carlos Teles. Aqui elas “aprendem desde os princípios básicos de como desenvolver uma pesquisa, passando pelas questões de segurança da informação, boas práticas no ambiente de trabalho com base na LGPD, qualificação e cuidado com o dado e tratamento, mediante aplicação de metodologias de Ciência de dados em um contexto de Saúde e Big data”, detalha o professor. Ele antecipa que a nova seleção do Profortec deve acontecer no final de 2023. Inicialmente, previsão de conclusão do curso em andamento é maio de 2023.

Por ter uma Plataforma de Dados, que reúne os núcleos de Produção de Dados (NPD), Tecnologia da Informação (NTI) e a Segurança da Informação (NSI) e uma Curadoria de Dados, as cientistas em formação podem compreender sobre todo o ciclo de vida dos dados, desde como eles chegam, como essas bases de dados podem ser tratadas e como podem ser úteis para responder demandas das ciências.

 

 

 

 

Pesquisador(es): Karina Costa.

NewsletterNovidades Cidacs