O Centro de Integração de Dados e Conhecimentos para Saúde (Cidacs) é uma instituição vinculada ao Instituto Gonçalo Moniz (Fiocruz Bahia), que realiza estudos e pesquisas com base em projetos interdisciplinares originados na integração de grande volume de dados. O Centro tem a missão de contribuir com a produção de conhecimentos científicos inovadores para auxiliar e apoiar a tomada de decisões em políticas públicas em benefício da sociedade.
Atualmente, os datasets produzidos pela equipe do Cidacs são disponibilizados exclusivamente para projetos vinculados às plataformas ou em colaboração com centro. Contudo, o Cidacs está alinhado com a Política de Dados Abertos e visa, em breve, disponibilizar a solicitação para obtenção dos dados produzidos, assegurando a preservação da privacidade, por meio de técnicas de anonimização e rígidos padrões de segurança da informação.
Dados vinculados são gerados a partir do processo de Record Linkage (vinculação de registros, em tradução livre) entre duas ou mais bases de dados, em que informações sobre as mesmas entidades são integradas. Aplica-se um algoritmo de vinculação que usa o método determinístico (quando há um identificador único, como o Número de Identificação Social existente nas bases de dados de programas sociais), ou por similaridade (por meio de atributos comuns, como nome, data de nascimento, nome da mãe, sexo e município de residência).
Datasets extraídos para cada projeto de pesquisa só poderão ser acessados no ambiente de análises de modo remoto através de VPN, conforme as normas de privacidade e segurança de dados do Cidacs/ Fiocruz-Ba. Não é permitida a saída de dados do ambiente de análises do Centro.
Três ferramentas open-source estarão disponíveis a pedido, exemplarmente: Spark, R e Python.
Os pesquisadores devem se comprometer com o uso ético e responsável dos dados, que inclui utilizar os dados somente para a finalidade da pesquisa estabelecida e minimizar os riscos de acesso aos dados por pessoas não autorizadas. Deverá também assinar os devidos termo de responsabilidade, de acesso e de uso.
Esses dados se tornarão um novo produto do Cidacs/ Fiocruz-Ba. Assim, você ou um novo pesquisador poderá reutilizar esse novo produto de dados através da submissão de um novo projeto de pesquisa ao Cidacs/Fiocruz-Ba.
Não. O projeto a ser apresentado ao Cidacs/FiocruzBa deverá ser o mesmo projeto submetido ao Comitê de Ética em Pesquisa (Plataforma Brasil). Sugerimos que siga as orientações do CEP indicado por sua instituição de origem. Lembramos que a estrutura padrão de projetos submetidos ao CEP geralmente contempla: introdução/justificativa, objetivos gerais e específicos, metodologia/materiais/métodos, resultados esperados, análise crítica dos riscos e benefícios aos participantes do estudo, composição da equipe do projeto com respectivas filiações institucionais e responsabilidades, orçamento financeiro, cronograma e referências bibliográficas. No caso do processo para obtenção do Termo de Consentimento Livre e Esclarecido (TCLE), se for utilizar exclusivamente os dados do Cidacs/ Fiocruz-Ba, solicitar dispensa informando que os dados anonimizados estritamente necessários para responder aos objetivos do estudo serão acessados em ambiente seguro e controlado do Cidacs/FiocruzBa, presencialmente ou via VPN. Sobre a aprovação no Comitê de Ética, é importante ressaltar que antes do pesquisador/instituição aplicar o projeto ao Comitê, a coordenação do Cidacs deve ser contatada afim de disponibilizar a declaração de anuência de acesso às bases de dados.
O Cidacs realiza estudos e pesquisas, em projetos interdisciplinares originados na análise de grande volume de dados, no âmbito das suas seis plataformas: Coorte de 100 Milhões de Brasileiros; Plataforma Zika; Tecnologias e Inovações para o SUS; Equidade e Sustentabilidade Urbana; Bioinformática e Epidemiologia Genética (Epigen).
As pesquisas desenvolvidas no Cidacs utilizam, principalmente, a vinculação de bancos de dados governamentais para gerar conhecimentos inovadores. Para tanto, os dados cedidos para o Centro são recebidos, armazenados e preservados com base em procedimentos de Curadoria Digital. Esses dados são processados em um ambiente computacional de alto desempenho, constituído pelo supercomputador Omolú e outros clusters computacionais situados no Centro de Supercomputação do Senai-Cimatec. Os dados abrigados no Omolú são acessados através de um ambiente monitorado, sem conexão à internet, com protocolos de segurança e controles de acesso restritos.
Todas as bases originais recebidas no Cidacs/ Fiocruz-Ba passam por um pré-processamento que inclui padronização e harmonização dos dados
Detalhes sobre o método de linkage utilizado no Cidacs/Fiocruz-Ba podem ser encontrados neste artigo. Sobre a avaliação deste processo em bases de dados, o catálogo de metadados de cada um dos datasets cadastrados conterá suas medidas de qualidade, incluindo curva ROC, sensibilidade e especificidade
A configuração dos recursos do ambiente de análise (VM) é dimensionado de acordo com: volume das bases disponibilizadas, tipo da análise, ferramentas a serem utilizadas e número de usuários. Uma configuração comum entre nossos usuários é, por exemplo: 128GB RAM, 20 vCPUs cores, 300GB disco
Sim, mas como não são ferramentas open-source, devem ser compradas pelo pesquisador com posterior instalação pelo setor de suporte do Cidacs/Fiocruz-Ba, responsável por acompanhar o processo junto ao pesquisador. O suporte a essas ferramentas (para além da instalação) também será de responsabilidade do pesquisador.
A base de dados derivada da análise passará a ser preservada pelo Cidacs/Fiocruz-Ba, reconhecendo o direito dos cocriadores para primeira utilização. Após término do período de embargo (específico para cada caso), ficará disponível para reuso levando em consideração aspectos éticos, regulatórios e de interesse público.
O Cidacs/Fiocruz-Ba será o único guardião dos dados derivados da análise da pesquisa ao final do projeto. Os metadados desse novo produto deverão especificar a sua origem.
Solicitamos que encaminhe o projeto ao Cidacs/ Fiocruz-Ba antes da submissão na Plataforma Brasil para que seja viabilizada a redação e o fornecimento do Termo de Anuência de Acesso e Uso da Base de Dados, de acordo com o Plano de Dados apresentado e aprovado. O referido Termo deverá ser apresentado ao Comitê de Ética como um dos documentos comprobatórios da existência de condições para o desenvolvimento da pesquisa. No Termo fornecido pelo Cidacs/Fiocruz-Ba constará o título do projeto, responsável pelo projeto e descrição da base de dados que será acessada no Cidacs a partir da Plataforma de Dados Integrados. Sugerimos que o Cidacs seja mencionado na metodologia como provedor de acesso controlado aos dados.
O Centro de Integração de Dados e Conhecimentos para Saúde (Cidacs) é uma instituição vinculada ao Instituto Gonçalo Moniz (Fiocruz Bahia), que realiza estudos e pesquisas com base em projetos interdisciplinares originados na integração de grande volume de dados. O Centro tem a missão de contribuir com a produção de conhecimentos científicos inovadores para auxiliar e apoiar a tomada de decisões em políticas públicas em benefício da sociedade.
O Cidacs realiza estudos e pesquisas, em projetos interdisciplinares originados na análise de grande volume de dados, no âmbito das suas seis plataformas: Coorte de 100 Milhões de Brasileiros; Plataforma Zika; Tecnologias e Inovações para o SUS; Equidade e Sustentabilidade Urbana; Bioinformática e Epidemiologia Genética (Epigen).
As pesquisas desenvolvidas no Cidacs utilizam, principalmente, a vinculação de bancos de dados governamentais para gerar conhecimentos inovadores. Para tanto, os dados cedidos para o Centro são recebidos, armazenados e preservados com base em procedimentos de Curadoria Digital. Esses dados são processados em um ambiente computacional de alto desempenho, constituído pelo supercomputador Omolú e outros clusters computacionais situados no Centro de Supercomputação do Senai-Cimatec. Os dados abrigados no Omolú são acessados através de um ambiente monitorado, sem conexão à internet, com protocolos de segurança e controles de acesso restritos.
Atualmente, os datasets produzidos pela equipe do Cidacs são disponibilizados exclusivamente para projetos vinculados às plataformas ou em colaboração com centro. Contudo, o Cidacs está alinhado com a Política de Dados Abertos e visa, em breve, disponibilizar a solicitação para obtenção dos dados produzidos, assegurando a preservação da privacidade, por meio de técnicas de anonimização e rígidos padrões de segurança da informação.
Todas as bases originais recebidas no Cidacs/ Fiocruz-Ba passam por um pré-processamento que inclui padronização e harmonização dos dados
Dados vinculados são gerados a partir do processo de Record Linkage (vinculação de registros, em tradução livre) entre duas ou mais bases de dados, em que informações sobre as mesmas entidades são integradas. Aplica-se um algoritmo de vinculação que usa o método determinístico (quando há um identificador único, como o Número de Identificação Social existente nas bases de dados de programas sociais), ou por similaridade (por meio de atributos comuns, como nome, data de nascimento, nome da mãe, sexo e município de residência).
Detalhes sobre o método de linkage utilizado no Cidacs/Fiocruz-Ba podem ser encontrados neste artigo. Sobre a avaliação deste processo em bases de dados, o catálogo de metadados de cada um dos datasets cadastrados conterá suas medidas de qualidade, incluindo curva ROC, sensibilidade e especificidade
Datasets extraídos para cada projeto de pesquisa só poderão ser acessados no ambiente de análises de modo remoto através de VPN, conforme as normas de privacidade e segurança de dados do Cidacs/ Fiocruz-Ba. Não é permitida a saída de dados do ambiente de análises do Centro.
A configuração dos recursos do ambiente de análise (VM) é dimensionado de acordo com: volume das bases disponibilizadas, tipo da análise, ferramentas a serem utilizadas e número de usuários. Uma configuração comum entre nossos usuários é, por exemplo: 128GB RAM, 20 vCPUs cores, 300GB disco
Três ferramentas open-source estarão disponíveis a pedido, exemplarmente: Spark, R e Python.
Sim, mas como não são ferramentas open-source, devem ser compradas pelo pesquisador com posterior instalação pelo setor de suporte do Cidacs/Fiocruz-Ba, responsável por acompanhar o processo junto ao pesquisador. O suporte a essas ferramentas (para além da instalação) também será de responsabilidade do pesquisador.
Os pesquisadores devem se comprometer com o uso ético e responsável dos dados, que inclui utilizar os dados somente para a finalidade da pesquisa estabelecida e minimizar os riscos de acesso aos dados por pessoas não autorizadas. Deverá também assinar os devidos termo de responsabilidade, de acesso e de uso.
A base de dados derivada da análise passará a ser preservada pelo Cidacs/Fiocruz-Ba, reconhecendo o direito dos cocriadores para primeira utilização. Após término do período de embargo (específico para cada caso), ficará disponível para reuso levando em consideração aspectos éticos, regulatórios e de interesse público.
Esses dados se tornarão um novo produto do Cidacs/ Fiocruz-Ba. Assim, você ou um novo pesquisador poderá reutilizar esse novo produto de dados através da submissão de um novo projeto de pesquisa ao Cidacs/Fiocruz-Ba.
O Cidacs/Fiocruz-Ba será o único guardião dos dados derivados da análise da pesquisa ao final do projeto. Os metadados desse novo produto deverão especificar a sua origem.
Não. O projeto a ser apresentado ao Cidacs/FiocruzBa deverá ser o mesmo projeto submetido ao Comitê de Ética em Pesquisa (Plataforma Brasil). Sugerimos que siga as orientações do CEP indicado por sua instituição de origem. Lembramos que a estrutura padrão de projetos submetidos ao CEP geralmente contempla: introdução/justificativa, objetivos gerais e específicos, metodologia/materiais/métodos, resultados esperados, análise crítica dos riscos e benefícios aos participantes do estudo, composição da equipe do projeto com respectivas filiações institucionais e responsabilidades, orçamento financeiro, cronograma e referências bibliográficas. No caso do processo para obtenção do Termo de Consentimento Livre e Esclarecido (TCLE), se for utilizar exclusivamente os dados do Cidacs/ Fiocruz-Ba, solicitar dispensa informando que os dados anonimizados estritamente necessários para responder aos objetivos do estudo serão acessados em ambiente seguro e controlado do Cidacs/FiocruzBa, presencialmente ou via VPN. Sobre a aprovação no Comitê de Ética, é importante ressaltar que antes do pesquisador/instituição aplicar o projeto ao Comitê, a coordenação do Cidacs deve ser contatada afim de disponibilizar a declaração de anuência de acesso às bases de dados.
Solicitamos que encaminhe o projeto ao Cidacs/ Fiocruz-Ba antes da submissão na Plataforma Brasil para que seja viabilizada a redação e o fornecimento do Termo de Anuência de Acesso e Uso da Base de Dados, de acordo com o Plano de Dados apresentado e aprovado. O referido Termo deverá ser apresentado ao Comitê de Ética como um dos documentos comprobatórios da existência de condições para o desenvolvimento da pesquisa. No Termo fornecido pelo Cidacs/Fiocruz-Ba constará o título do projeto, responsável pelo projeto e descrição da base de dados que será acessada no Cidacs a partir da Plataforma de Dados Integrados. Sugerimos que o Cidacs seja mencionado na metodologia como provedor de acesso controlado aos dados.