Serviços   O conteúdo desse portal pode ser acessível em Libras usando o VLibras

Perguntas e Respostas Frequentes - GCE

GCE em 3 de Abril de 2018

1. Qual é a qualidade dos dados dos datasets do Cidacs?

Todas as bases originais recebidas no CIDACS foram pré-processadas, incluindo limpeza, padronização e harmonização dos dados.

2. O que significa dados vinculados (Linkage)?

Dados vinculados são gerados a partir do processo de Record Linkage (vinculação de registros, em tradução livre) entre duas bases de dados, em que informacoes sobre os mesmos indivíduos são integradas. Aplica-se um algoritmo que calcula a similaridade entre os dados identificadores do indivíduo, seja de forma determinística (quando há uma identificação única, como nos cadastros sociais que utilizam o Número de Identificação Social), ou de forma probabilística (por meio de informações variadas, como nome, data de nascimento e nome da mãe).

3. Onde posso obter informação sobre o linkage?

O documento de metadados da base de dados contém as medidas de qualidade do linkage, incluindo sensibilidade, especificidade, acurácia e ponto de corte.

4. Eu posso levar datasets para casa ou para o trabalho?

De acordo com as normas de privacidade e segurança de dados do CIDACS, não é permitida a saída de dados do ambiente de análises do Centro. Deste modo, datasets só poderão ser acessados remotamente através de VPN no ambiente de análises.

5. Que ferramentas estarão disponíveis para análise de dados?

Ferramentas open-source estarão disponíveis a pedido, por exemplo Spark (R, Python).

6. É possível usar versões livres de R ou Python para analisar os datasets?

Testes anteriores com bases semelhantes (número grande de registros e variáveis) indicam que extrações da Coorte 100M são muito grandes para a maioria dos algoritmos de distribuições básicas livres de R e Python.

7. É possível usar STATA para analisar os dados da Coorte?

Sim, mas como não é uma ferramenta open-source, deve ser comprada pelo pesquisador e solicitar a instalação. Alguns modelos de análise no Stata, como o PSM parecem não suportar big-data.

8. Quais são os procedimentos de segurança de acesso aos dados?

Os pesquisadores devem se comprometer ao uso ético e seguro dos dados, que inclui utilizar os dados somente para a finalidade da pesquisa estabelecida, não distribuir os dados a terceiros, e minimizar os riscos de acesso aos dados por pessoas não autorizadas. Deverá também assinar os devidos termo de responsabilidade, acesso e uso.

9. Ao final do projeto, posso ter uma cópia da base de dados derivada da análise da pesquisa?

Não. A base de dados derivada da análise se tornará um novo produto do Cidacs, reconhecendo o direito dos co-criadores para primeira utilização. Após 12 meses do término do projeto, ficará disponível para reuso levando em consideração aspectos éticos, regulatórios e de interesse público.

10. Posso permitir o reuso da base de dados derivada da análise da pesquisa, ao final do projeto?

Esses dados se tornarão um novo produto do Cidacs. Assim, você ou um novo pesquisador poderá reutilizar esse novo produto de dados através da submissão de um novo projeto de pesquisa ao Cidacs.

11. Quem será guardião da base de dados derivada da análise da pesquisa, ao final do projeto?

O Cidacs será o único guardião dos dados derivados da análise da pesquisa ao final do projeto. Os metadados desse novo produto deverão especificar a sua origem.

12. Existe um modelo/template para o projeto de pesquisa?

Não existe um modelo/template. O projeto a ser apresentado ao Cidacs deverá ser o mesmo projeto submetido ao Comitê de Ética em Pesquisa (Plataforma Brasil). Sugerimos que siga as orientações do CEP indicado por sua instituição de origem. Lembramos que a estrutura padrão de projetos submetidos ao CEP geralmente contempla: introdução/justificativa, objetivos geral e específicos, metodologia/materiais/métodos, resultados esperados, análise crítica dos riscos e benefícios aos participantes do estudo, processo para obtenção de TCLE, composição da equipe do projeto com respectivas filiações institucionais e responsabilidades, orçamento financeiro, cronograma e referências.

Veja um exemplo em: http://www.cep.ics.ufba.br/documentos.html

Tendo em vista que o CEP analisa possíveis implicações ou repercussões éticas decorrentes das opções metodológicas adotadas, ressaltamos que pela natureza dos dados utilizados – dados secundários vinculados e anonimizados disponibilizados pelo Cidacs sob termos e condições de acesso e uso que levam em consideração aspectos éticos, legais e de segurança da informação, os riscos de identificação dos participantes serão mínimos, e que não haverá necessidade de obtenção de TCLE pela impossibilidade de obtê-lo.

13. Sobre a aprovação no comitê de ética, devemos mencionar o Cidacs como participantes na cessão/fornecimento de dados?

Solicitamos que encaminhe o projeto ao Cidacs antes da submissão na Plataforma Brasil para que seja viabilizada a redação e o fornecimento do Termo de Anuência de Acesso e Uso da Base de Dados, de acordo com o Plano de Dados apresentado e aprovado. O referido Termo deverá ser aprovado ao Comitê de Ética como um dos documentos comprobatórios da existência de condições para o desenvolvimento da pesquisa. No Termo fornecido pelo Cidacs constará o título do projeto, responsável pelo projeto e descrição da base de dados que será acessada no Cidacs a partir da Plataforma Coorte de 100 Milhões de Brasileiros. Sugerimos que o Cidacs seja mencionado na metodologia como provedor de acesso controlado aos dados.

NewsletterNovidades Cidacs