Origens e marcos históricos da ciência aberta
A Ciência Aberta tem suas origens nas últimas décadas, impulsionadas por iniciativas de colaboração científica e pelo avanço tecnológico. No cenário internacional, os movimentos de softwares e de informação de livre acesso, emergidos nos Estados Unidos em meados da década de 1980, foram pioneiros desse paradigma.[1,2] A convenção de Santa Fé em 1999 representou um dos primeiros eventos que inauguraram a discussão sobre o Acesso Aberto, delineando estratégias como arquivamento, repositórios digitais e bases de dados. Foram propostos padrões para que documentos eletrônicos, softwares e bases de dados estivessem em conformidade com a Open Archives Initiative (OAI), visando a disponibilização de um maior número de documentos eletrônicos e a promoção do uso de softwares de acesso livre para estabelecer interoperabilidade entre os sistemas e, assim, permitir uma disseminação da informação mais abrangente.[3]
A Declaração de Budapeste de 2002 (Budapest Open Access Initiative — BOAI) introduziu o conceito e as estratégias para o acesso livre a publicações científicas, fortaleceu o Movimento do Acesso Aberto e a sua aplicação aos resultados de pesquisas científicas e aos documentos científicos por meio da internet.[4,5] Em 2003, as Declarações de Bethesda e de Berlim apresentaram, em seus textos, os atributos para uma obra ser considerada de acesso livre, alinhando-se às propostas da Declaração de Budapeste, que ainda traz orientações sobre a necessidade de publicar material revisado pelos pares para assegurar a qualidade dos artigos. Trouxeram uma definição importante sobre a noção de “publicação de acesso aberto”, caracterizando-a em função da autoria que cede o acesso gratuito de suas publicações, permitindo sua ampla divulgação digital ou analógica. A Declaração de Berlim distinguiu-se pela ênfase no uso da internet como principal ferramenta para atingir os objetivos do Movimento.[6,7] A Declaração de Haia (2014) é um documento que especifica a visão da comunidade acadêmica europeia sobre o grande volume circulante de dados em meio digital e o envolvimento das partes interessadas, como bibliotecas, empresas, editores, cientistas e cidadãos. Essa declaração trouxe à tona a discussão sobre dados abertos por meio da questão digital, abordando tecnologias de Big Data e mineração de dados e como as diferentes competências podem promover desigualdade de acesso aos dados e seu potencial de uso. Foi enfatizada a necessidade de liberdade dos pesquisadores para que não houvesse coerção de modo a restringir os acessos potencializados pela internet. Ademais, a Declaração de Haia trouxe estratégias de ação, apresentando novas preocupações no âmbito do Acesso Aberto, que transcende as fontes primárias de informação, incluindo dados abertos.[8]
No Brasil, o lançamento da Scientific Electronic Library Online (SciELO) em 1998, com a oferta de uma plataforma de periódicos científicos revisados por pares, disponível de forma aberta pela internet para toda a sociedade, e o manifesto do Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT) em 2005, em prol do acesso aberto, marcaram o início da trajetória nacional rumo à Ciência Aberta.[9]
Ciência Aberta
Em sua essência, a Ciência Aberta, ou Open Science, defende o princípio de que o conhecimento científico deve ser livre para uso, reutilização e distribuição, sem restrições legais, democratizando o acesso à informação.[10] Configura-se como um movimento global de instituições, que transcende a mera acessibilidade à informação científica. Ela representa um ecossistema dinâmico que engloba diversos movimentos em prol da abertura e do compartilhamento do conhecimento científico, tanto pela comunidade científica internacional quanto pela sociedade em geral. Preconiza a transparência em todas as etapas da pesquisa, desde a concepção metodológica, a gestão de dados, a utilização de softwares abertos.[11] Essa abordagem visa fomentar a disseminação do conhecimento, a reutilização de dados e o acesso à informação em todos os níveis sociais, impulsionando o avanço e a inovação científica.
“Ao tornar o conhecimento científico mais acessível, a ciência aberta pode ajudar a reduzir as desigualdades de acesso à informação, especialmente em países em desenvolvimento.”
Ao garantir a disponibilidade e a usabilidade sem barreiras de acesso às publicações, dados, metodologias e códigos, a Ciência Aberta promete tornar a ciência mais eficiente, confiável e socialmente responsiva, com a participação ativa de diversos atores sociais como, pesquisadores, investidores, empresários, formuladores de políticas e cidadãos. Não é apenas um movimento para tornar o acesso e os processos científicos disponíveis para todos, mas deve ser visto como um campo de pesquisa emergente onde a cooperação, a liberdade acadêmica, a integridade e a qualidade científica são essenciais.[11,12]
A disponibilização aberta, o compartilhamento e a colaboração trazem uma série de vantagens e benefícios significativos para a ciência, os pesquisadores e a sociedade como um todo.[13] Podemos citar exemplos no âmbito da ciência, pesquisadores e sociedade.
Na Ciência temos: (A) Validação dos processos e resultados científicos. A abertura dos dados permite que outros pesquisadores examinem e verifiquem os processos e resultados, aumentando a confiabilidade e a robustez da pesquisa científica. Há também a verificação por pares, que permite que as pesquisas sejam publicadas de modo mais robusto e com correções independentes; (B) Promoção da reprodutibilidade: possibilita a reprodução de pesquisas, a validação de descobertas e o avanço do conhecimento científico; (C) Preservação digital e sustentabilidade: O compartilhamento de dados em repositórios adequados garante sua preservação e integridade a longo prazo, para serem acessíveis e utilizáveis para futuras pesquisas e pesquisadores; (D) Redução de desigualdades: Ao tornar o conhecimento científico mais acessível, a ciência aberta pode ajudar a reduzir as desigualdades de acesso à informação, especialmente em países em desenvolvimento e, (E) Novos métodos e procedimentos: A grande quantidade de dados acessíveis requer e incentiva a colaboração, a criação de novos métodos, ferramentas e procedimentos computacionais, métodos estatísticos e conhecimentos multidisciplinares para coleta, armazenamento, organização, análise e proteção de dados.
Para os Pesquisadores temos: (A) Aumento da colaboração: A ciência aberta estimula e facilita a colaboração entre pesquisadores, permitindo que eles compartilhem dados, métodos e resultados de forma mais eficiente; (B) Economia de recursos: O reuso de dados existentes pode reduzir a necessidade de novas coletas de dados, economizando tempo, verba e outros recursos valiosos; (C) Novas análises: O acesso a dados de diferentes fontes e contextos permite que os pesquisadores realizem novas análises e interpretações, gerando novos insights. A possibilidade de ligar e cruzar conjuntos de dados de várias fontes melhora a precisão das descobertas científicas e a identificar novos alvos para investigação; (D) Transparência na Aplicação de recursos: O compartilhamento de dados e resultados aumenta a transparência na utilização de recursos e financiamento, promovendo a prestação de contas e a confiança na pesquisa; (E) Visibilidade e colaboração: A disponibilização de resultados aumenta a visibilidade dos pesquisadores, resultando em maior número de citações, convites para colaboração e ampliação das redes de pesquisa; (F) Transparência e reprodutibilidade: Ao tornar os dados e métodos de pesquisa acessíveis, a ciência aberta melhora a transparência e a reprodutibilidade dos estudos, o que é essencial para validar descobertas científicas; (G) Integridade acadêmica: Manter a integridade acadêmica é essencial. Isso inclui garantir que os dados sejam precisos, completos e não manipulados e, (H) Inovação e desenvolvimento: A disponibilização de dados e informações promove a inovação, ao permitir que novos pesquisadores utilizem esses recursos para desenvolver novas tecnologias e soluções.
Para a Sociedade temos: (A) Acesso ao conhecimento: acesso aberto a artigos científicos e dados permite que estudantes, pesquisadores e o público tenham acesso ao conhecimento mais recente beneficiando a educação, inovação e desenvolvimento social; (B) Visibilidade das atividades de pesquisa: o compartilhamento de dados e resultados aumenta a transparência das atividades de universidades, centros e institutos de pesquisa, demonstrando o impacto e a relevância da ciência para a sociedade e, (C) Engajamento público: a ciência aberta favorece a conscientização e o entendimento das pesquisas científicas por parte da sociedade.
Bioética aplicada à ciência aberta
O conceito de dados abertos não implica necessariamente que os dados em si possam ou devam ser totalmente disponibilizados a toda e qualquer pessoa de forma irrestrita. Devem ser consideradas antecipadamente as questões de ética, de privacidade e de propriedade intelectual.
O compartilhamento de dados deve ser pautado pela responsabilidade ética em todas as suas etapas, desde a coleta até a disseminação e curadoria dos dados; assim como respeitar os preceitos legais e as legislações locais de compartilhamento de dados como a Lei Geral de Proteção de Dados (LGPD) e as Resoluções do Conselho Nacional de Saúde sobre Pesquisa com Seres Humanos, no Brasil. A Lei Geral de Proteção de Dados (LGPD, lei n.º 13.709/2018), elaborada com objetivo de proteger o direito de liberdade e de privacidade dos dados e dos indivíduos associados a eles, estabelece diretrizes para a coleta, uso, processamento e armazenamento de dados pessoais no Brasil. Ela tem jurisdição sobre os processos associados aos dados, desde a coleta e processamento em território nacional até resultados na oferta de produtos ou serviços a indivíduos situados no Brasil. Apresenta dois artigos determinando a necessidade de consentimento informado explícito, o Termo de consentimento Livre e Esclarecido (TCLE), para compartilhamento de dados e a anonimização de dados sensíveis e de identificação. Ainda, estabelece requisitos de segurança, boas práticas e de governança de dados como proteção ao direito à privacidade.[14, 15]
A partir dos quatro pilares básicos da Ciência Aberta identificados por Bronner et al. (2022),[16] sendo eles, a qualidade e a integridade, os benefícios coletivos, a equidade e a justiça e a diversidade e a inclusão, temos então a interface entre o livre acesso aos dados e a bioética. A bioética é definida como a ciência que busca indicar os limites da intervenção humana sobre a vida, identificar valores de referência que possam ser racionalmente propostos e avaliar os riscos das possíveis aplicações. Teve seu surgimento na década de 1970 incitado pelo intenso desenvolvimento tecnológico e por movimentos socioculturais quanto a questões de igualdade e direitos individuais. Seus quatro princípios básicos são a autonomia, a beneficência, a não-maleficência e a equidade.[17,18] Esses princípios, que devem então ser justapostos à ciência aberta a fim de garantir eticidade do compartilhamento de dados para todos os envolvidos; participantes, pesquisadores e sociedade. Dessa forma, seguem os passos que visam garantir esses princípios básicos associados à geração e publicação de dados científicos. (Figura 1)

Figura 1. Os pilares da Ciência Aberta conectam acesso livre aos dados com bioética: qualidade, equidade, benefícios coletivos e inclusão
(Foto: Marcos Santos/USP Imagens. Reprodução)
- Autonomia
- Consentimento Informado: consentimento em linguagem adequada, de forma clara e transparente para coleta, armazenamento, processamento e compartilhamento de dados
- Privacidade: anonimização de dados de modo a não expor informações pessoais ou sensíveis que podem de modo direto ou indireto quebrar o sigilo e à privacidade.
- Beneficência
- Direito e Participação: “Todo ser humano tem o direito de participar livremente da vida cultural da comunidade, de fruir as artes e de participar do progresso científico e de seus benefícios.” Declaração Universal do Direitos Humanos.[19]
- Compromisso Social: as universidades e instituições de pesquisa devem retornar à sociedade o conhecimento produzido.
- Solidariedade: colaboração para o avanço da ciência.
- Não Maleficência
- Proteção de Dados: adequado armazenamento, gestão e compartilhamento dos dados de modo a proteger informações sensíveis e pessoais. Implementação de medidas de segurança para proteger os dados contra acesso não autorizado e uso indevido.
- Discriminação e Uso Indevido de Dados: garantir que os dados não sejam utilizados para discriminação de qualquer condição; seja étnica, racial, de gênero, econômica, política ou outra.
- Conformidade Legal: a Lei Geral de Proteção de Dados (LGPD) no Brasil e as Resoluções do CNS sobre Pesquisas com Seres Humanos estabelecem diretrizes sobre como os dados devem ser coletados, armazenados e compartilhados.
- Propriedade Intelectual: garantir os direitos de propriedade intelectual dos pesquisadores mesmo que seus dados e resultados sejam abertamente compartilhados.
- Equidade
- Acesso: acesso igualitário aos dados e benefícios da ciência aberta.
- Transparência: a transparência em todos as etapas da pesquisa garante a integridade acadêmica, a confiabilidade dos dados e a possibilidade de reprodutibilidade.
- Inclusão: facilitadores para que pesquisadores e instituições diversas tenham a possibilidade de publicar seus dados e trabalhos sem barreiras financeiras.
Relevância do compartilhamento de dados no âmbito internacional
A necessidade do compartilhamento de dados genômicos e de saúde para o progresso da ciência e o bem-estar da humanidade são amplamente reconhecidas no cenário internacional. Organizações como a Global Alliance for Genomics and Health (GA4GH) têm se dedicado a estabelecer diretrizes e ferramentas para viabilizar o compartilhamento ético desses dados.[20, 21] Embora o novo paradigma científico seja pautado na colaboração e na democratização do acesso a dados, métodos e conhecimentos por meio de tecnologias digitais, pesquisadores e suas instituições enfrentam desafios contextuais que podem tanto potencializar quanto dificultar a abertura e o compartilhamento de informações.[22]
A transição para um modelo de ciência aberta implica em mudanças nos paradigmas tradicionais da pesquisa, desafiando valores como autonomia e reconhecimento, além de demandar soluções normativas e tecnológicas complexas. Dentre os desafios, destacam-se as disputas por prioridade de descoberta, o consentimento, a necessidade de preservação de dados para pesquisas futuras, a proteção da propriedade intelectual e a salvaguarda de dados sensíveis. São desafios a serem vencidos, por exemplo, a qualificação de profissionais especialistas na governança de banco de dados abertos e os modelos de publicação científica. Dessa forma, se torna necessário a capacitação de profissionais para curadoria de banco de dados abertos com adequado armazenamento, gerenciamento e processamento de dados tanto em relação à necessidade de estruturas computacionais para bancos de dados robustos e complexos, quanto em capacitação para as questões éticas e legais como acesso, utilização, anonimização de dados, direitos autorias e sustentabilidade.[23] Os modelos de publicação em revistas internacionais de alto impacto possuem Taxas de Processamento de Artigos (APCs) elevadas principalmente para pesquisadores de países estrangeiros podendo, por exemplo, variar entre US $ 2.000 a US $ 12.000, dependendo do tipo de artigo, quantidade de figuras e tabelas, formato digital ou impresso e formato com cores ou preto/branco.[24]
“O conceito de dados abertos não implica necessariamente que os dados em si possam ou devam ser totalmente disponibilizados a toda e qualquer pessoa de forma irrestrita.”
No âmbito nacional e internacional, a abertura de dados tornou-se uma exigência nas políticas de agências de fomento à pesquisa, visando tanto a disponibilização da produção científica para a sociedade em geral quanto a promoção da transparência na aplicação de recursos, sejam públicos, privados ou mistos. Iniciativas como a Research Data Alliance, estabelecida em 2013 com o apoio da Comissão Europeia e dos governos Americano e Australiano, trazem como missão desenvolver a infraestrutura técnica e social necessária para o compartilhamento e reutilização de dados de pesquisa.[25] Já o regulamento que institui o Espaço Europeu de Dados de Saúde (EHDS), aprovado pelo Parlamento Europeu em abril de 2023, configura uma iniciativa de grande envergadura com o propósito de fomentar o intercâmbio de dados de saúde na União Europeia (UE). Essa medida visa atingir os seguintes objetivos: (A) Garantir o empoderamento dos pacientes, proporcionando aos cidadãos maior autonomia na gestão de seus dados de saúde eletrônicos, facilitando o acesso e o controle sobre as informações; (B) Otimizar os cuidados de saúde, permitindo que profissionais de saúde acessem, com o consentimento do paciente, seus dados em todo o território da UE, visando aprimorar a qualidade do tratamento e do acompanhamento médico (utilização primária dos dados) e, (C) Fomento à pesquisa e inovação, possibilitando o compartilhamento de dados de saúde anonimizados ou pseudonimizados para fins de pesquisa científica, inovação tecnológica e formulação de políticas públicas. [26]
A Organização Mundial de Saúde (OMS), considerando os aspectos técnico, legal e ético, possui um guia para orientar sua política e prática de reuso e compartilhamento para pesquisa de dados de saúde coletados nos programas técnicos, requerendo o compartilhamento de dados de todas as pesquisas ao término da mesma.[27] A Organização das Nações Unidas para a Educação, a Ciência e a Cultura (Unesco), reconhecendo a importância da Ciência Aberta, publicou em 2021 uma recomendação sobre o tema, buscando fornecer um marco internacional para políticas e práticas que promovam a abertura, a transparência e a colaboração na ciência, considerando as particularidades disciplinares e regionais, a liberdade acadêmica e os desafios específicos de diferentes países. A Unesco definiu o conhecimento científico aberto como o acesso irrestrito a publicações, dados, metadados, recursos educacionais, softwares, códigos-fonte e hardwares, disponibilizados em domínio público ou sob licenças abertas, permitindo o acesso, a reutilização, a adaptação e a distribuição em condições específicas, de forma gratuita e imediata a todos os atores, independentemente de sua localização ou características individuais.[13,28]
Iniciativas brasileiras no compartilhamento de dados científicos
O Brasil nos últimos anos apresentou relevante crescimento e envolvimento ativo nas atividades de colaboração e disseminação do conhecimento nos princípios da Ciência Aberta, com diversas iniciativas, principalmente através de instituições de ensino e pesquisa. Em 2021, o grupo de trabalho da Rede Brasileira de Repositórios Institucionais de Dados de Pesquisa (RDP Brasil), uma parceria de cooperação técnico científica para promover a ascensão da Ciência Aberta no Brasil entre a Rede Nacional de Ensino e Pesquisa (RNP), o IBICT e o Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) resultou em produções que auxiliaram pesquisadores e instituições brasileiras no desenvolvimento e implementação de repositórios de dados de pesquisa, em seus aspectos de governança e sustentabilidade. Favoreceu a incubação de repositórios como: LattesData do CNPq, Redape da Embrapa, e ArcaDados da Fiocruz.[9, 29] A Rede de Repositórios de Dados Científicos do Estado de São Paulo (dezembro de 2019), foi lançada para o compartilhamento de dados científicos desenvolvidos em todas as áreas do conhecimento incluindo seis universidades públicas do estado de São Paulo, o Instituto Tecnológico de Aeronáutica (ITA) e a Embrapa Informática Agropecuária (CNPTIA/Embrapa).[30] A Universidade Estadual de Campinas (Unicamp) está inserida nessa rede através do Repositório de Dados de Pesquisa da Unicamp (REDU), um repositório criado para todas as pesquisas da universidade com os preceitos da Ciência Aberta.[30,31] (Figura 2)

Figura 2. O Brasil avança na Ciência Aberta com colaborações e iniciativas em ensino e pesquisa.
(Foto: CNPq. Reprodução)
O CNPq criou em março de 2022 o CoNCienciA, um acordo de cooperação para fomentar a criação e governança de repositórios de dados de pesquisa no território nacional com práticas de colaboração científica. A democratização da ciência através desse projeto seria com base nos preceitos da Ciência Aberta, com aceitação e visibilidade internacional. Em parceria com o IBICT, criou-se o LattesData, que tem o intuito de servir como depósito de dados provindos de pesquisas fomentadas pelo CNPq. Entre as instituições integrantes do consórcio estão a Fiocruz, Embrapa e o Centro Brasileiro de Pesquisas Físicas (CBPF).[32]
A Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes) publicou, em 30 de abril de 2024, a Portaria n.° 120/2024 que define as regras de pagamento de APCs para publicações em acesso aberto como parte do Programa de Apoio à Disseminação de Informação Científica e Tecnológica (Padict). Para as editoras selecionadas, o contrato e o pagamento de taxas são estabelecidos diretamente entre editora e Capes, sem envolvimento ou repasse de verbas para o pesquisador, de modo a favorecer a oportunidade de publicação e divulgação da produção cientifica brasileira em periódicos internacionais de alto impacto na comunidade científica.[33,34]
“A transição para um modelo de ciência aberta implica em mudanças nos paradigmas tradicionais da pesquisa, desafiando valores como autonomia e reconhecimento”
No Brasil, podemos citar dois exemplos de repositórios públicos com informações genômicas. O primeiro, o Brazilian Initiative of Brazilian Medicine (BIPMed), foi criado em 2015 em colaboração entre cinco centros da Unicamp com apoio da Fundação de Amparo à Pesquisa de São Paulo (Fapesp) e é primeiro banco de dados público da América Latina de informações genéticas, genômicas e biomédicas da população brasileira implementado com a intenção de disseminação de conhecimento científico assim como capacitação de profissionais envolvidos na área da saúde. A iniciativa está alinhada com as diretrizes estabelecidas pela GA4GH que elabora e dissemina de diretrizes, políticas e parâmetros para o compartilhamento e o processamento de dados de saúde e dados genômicos de maneira ética e democrática.[35,36] O banco de dados possui atualmente dados de indivíduos-referência e dados de indivíduos acometidos por doenças específicas, totalizando 8 bancos de dados com mais de mil SNP arrays. O segundo é o Arquivo Brasileiro Online de Mutações (ABraOM), que possui 1171 dados genotípicos sumarizados de uma população idosa do Sudeste do Brasil, coletados entre 2010 e 2012 e gerou dados importantes acerca dos genomas desses indivíduos, contribuindo com mais de 2.000 novas variantes em inserção de elementos móveis e 140 novos alelos no gene HLA que não haviam sido descritos anteriormente.
Considerações finais
A Ciência Aberta, um movimento que defende a livre circulação do conhecimento científico, experimenta um crescimento exponencial nas últimas décadas. Impulsionada pelo avanço tecnológico e pela necessidade de colaboração global, representa o caminho mais promissor para democratizar o acesso ao conhecimento científico, estimulando a colaboração entre pesquisadores, a inovação e a sustentabilidade das atividades de pesquisa. Contudo, é fundamental manter constante vigilância sobre os aspectos bioéticos e legais, tanto ao nível internacional quanto no âmbito de cada comunidade, visando preservar a privacidade, a autonomia e a equidade de todos os participantes, sejam eles pesquisadores, instituições ou membros da sociedade civil. No entanto, a transição para o modelo de Ciência Aberta enfrenta desafios, como a necessidade de capacitação dos agentes envolvidos, a criação de infraestruturas adequadas para o armazenamento e compartilhamento de dados, e a garantia da proteção da propriedade intelectual e de dados sensíveis e de identificação pessoal.
Conflito de interesse dos autores
Os autores declaram não haver conflito de interesse.
Agradecimentos e suporte financeiro
Agradecemos a Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) pelo apoio através do CEPID-BRAINN (processo número: 2013/07559-3). TCO recebe apoio da FAPESP (processo número: 2021/15030-9). IL-C recebe apoio do Conselho Nacional de Pesquisa (CNPq, processo número: 311923/2019-4) e Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES, processo número: 001).