Re: [okfn-br] relação entre a abertura de dados e a Reprodutibilidade em Ciências

Daniela Brauner Thu, 25 Feb 2016 09:59:41 -0800

Oi Peter

Sim. O uso de metadados é oq sugiro. Obrigada pelos links. Em instituições
grandes, vale investir em catálogos de metadados internos (ou algum tipo de
documentação compartilhada sobre os metadados utilizados), assim um
departamento sabe do outro. Metacat
<https://knb.ecoinformatics.org/knb/docs/index.html>é bem interessante pra
esse fim.


Abs
Dani

Em 12 de setembro de 2015 08:39, Peter Krauss <[email protected]> escreveu:

> Olá Daniela,
>
> Na minha visão o JATS em OpenAccess  já é uma iniciativa revolucionária de
> dados abertos (!).
> Claro, sempre há potencial para fazer mais, porém há necessidade de seguir
> passo-a-passo a evolução, consolidar as coisas... consolidar a cultura.
>
> O SciELO SPS
> <http://docs.scielo.org/projects/scielo-publishing-schema/pt_BR/1.2-branch/> é
> como um "JATS ABNT", ou seja, é de fato o padrão brasileiro para registrar
> artigos científicos.
>  PS: as editoras e o governo (ex. FAPESP) já vem investindo nisso desde
> 2013.
>
> Comentei do *Material Suplementar* pois ele faz parte desse padrão, e os
> recursos oficiais (esquema de "depósito legal
> <https://en.wikipedia.org/wiki/Legal_deposit>" do artigo científico),
> como o acervo SciELO, permitem o depósito casado do artigo com o seu
> material suplementar.
> ... Este artigo da descoberta das cores do camaleão
> <http://dx.doi.org/10.1038/ncomms7368> tem bons exemplos de material
> suplementar, e está também disponível no repositório PubMed Central
> <http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4366488/> (para obter o JATS
> ver links FTP
> <http://www.ncbi.nlm.nih.gov/pmc/utils/oa/oa.fcgi?id=PMC4366488>)...
> Exemplo de revista rica em tabelas e materiais suplementares JATS, tem a PLOS
> ONE <http://www.ncbi.nlm.nih.gov/pmc/journals/440/> e a brasileira GMB
> <http://www.ncbi.nlm.nih.gov/pmc/journals/1440/>.
>
> O incrível, que chama atenção, é que a cultura das revistas e dos autores
> é uma barreira: não existem barreias técnicas atualmente, pelo contrário
> (!).  É preciso ensinar a comunidade científica a usar os recursos mais
> simples, nem sequer o mais simples vem sendo usado.
>   PS: as estatísticas de uso de material suplementar nas revistas são
> baixíssimas (inferior a 1% dos artigos com tabelas), e editores brasileiros
> insistem em publicar tabelas de dados imensas em PDF ao invés de focar no
> conteúdo (ex. tabelas com estatísticas e sumarizações), e exigir que
> autores usem o recurso do material suplementar.
>
> Enfim, JATS XML é o que temos de melhor e de mais amplamente usado nos
> dias de hoje para "Compartilhar dados científicos"...
> É ainda um  "compartilhar" restrito à publicação de artigos científicos
> (conteúdo, metadados do conteúdo, e dados suplementares do artigo).
>
> Perceba o quanto isso é importante, e o quanto ainda estamos patinando na 
> *barreira
> cultural*...
> Veja o exemplo dos seus slides
> <http://www.slideshare.net/DanielaBrauner/apresentacao-forumrnp-2015-daniela-brauner>:
> não posso copiar/colar trechos de texto, não posso seguir links, pois estão
> no formato imagem... É um conteúdo aberto, mas com apenas uma estrela
> <http://5stardata.info/en/>. A aderência a uma "nova cultura" precisa ser
> ampla...
>
>  - - -
>
> Já o compartilhamento de dados em bancos de dados eu vejo como uma
> evolução, que dependeria um pouco de termos essa cultura mais sólida.
> De qualquer forma, como iniciativa, os *bancos de dados compartilhados* correm
> em paralelo,
> não podem ser confundidos como uma "obrigação do pesquisador"
> (ao contrário do JATS que hoje é uma exigência do SciELO, do PubMed
> Central e diversos outros repositórios sérios).
>
> Algumas áreas possuem padrões, ferramentas, etc. que permitem o uso de
> bancos de dados compartilhados e *big data*: OpenStreetMaps
> <http://www.openstreetmap.org/> é um exemplo onde cientistas e pessoas
> comuns compartilham dados...
> A cada área (física de partículas, genética, análise climática, etc. etc.)
> pode ou não haver oportunidade de uso de grandes bancos de dados. A maior
> parte ainda não tem seu *big data* padronizado e compartilhado.
>
> Além do *big data*, existem os casos intermediários, entre "material
> suplementar" (ex. planilhas em formato CSV) e o banco de dados, que são os
> chamados *datasets*, promovidos pela OKFN no projeto *Data Packaged Core
> Datasets* <https://github.com/datasets/>.
>
> Esses bancos de dados (dos *datasets* ao *big data*), para terem sucesso,
> exigem uma certa democracia para que sejam de fato atrativos, confiáveis,
> transparentes.... É o que chamam de *curadorias digitais*.  Além disso o
> critério de *veracidade* (inerente à questão da reprodutibilidade
> científica) de cada área do conhecimento requer uma certa "intuição
> coletiva", que só uma curadoria ampla e igualmente aberta pode assegurar.
> No Brasil ainda estão nascendo as curadorias e as bases de dados
> compartilhadas... são pouquíssimos os exemplos pois, novamente, há uma
> cultura acadêmica arraigada do "meus dados", como você bem lembrou.
>
>
> (respondendo *inline* os detalhes)
>
> Em 11 de setembro de 2015 11:05, Daniela Brauner <[email protected]>
>  escreveu:
>
>> Oi Peter e amigos
>>
>> Pois então.... As editoras, agências de financiamento e quem sabe até as
>> próprias universidades e outros, que obtém resultados de P&D, deveriam ter
>> repositórios ou exigir que os dados utilizados em artigos fossem
>> compartilhados de forma aberta.
>>
>
> tentei expressar acima, fique a vontade para replicas ;-)
>
>
>> Já existem plataformas que permitem isso como o Dataverse criado em
>> Harvard.
>>
>>
> Dei uma olhada mas nunca havia usado... Existem exemplos brasileiros? Qual
> a vantagem em relação a uma base especializada, ou em relação aos
> repositórios JATS genéricos?
>
>
>> Mas temos alguns desafios importantes para resolver para garantir o reuso
>> a longo prazo desse tipo de dados (IDs persistentes das coleções,
>> proveniência etc. Coisas que sabemos como fazer basta colocar em prática).
>>
>
> Bem lembrado, e acredito que "identificar" é o primeiro passo para
> qualquer iniciativa... Conheço a fundo três exemplos de IDs persistentes,
>
> * *DOI*: de longe o mais difundido, apesar do custo não ser irrisório.
>
> * *ISSN*: difundido apenas para revistas, mas poderia estar acoplado ao
> DOI (além de igualmente custoso), é mau usado nesse sentido, tenho um
> projeto OKBr para isso, https://github.com/okfn-brasil/ISSN-L-Resolver
>
> * LexML e as *URNs LEX*: o único exemplo 100% brasileiro, sem custo,  e
> transparente. Gosto muito dele, ver http://www.lexml.gov.br/     Para
> apoiar outros usos tem o projeto OKBr
> https://github.com/okfn-brasil/getlex
>
>
>
>> Existe uma variedade muito grande de formatos, tipos e metadados, que
>> dificultam a interoperabilidade mas acredito que as barreiras culturais
>> ainda são o maior impedimento... "Os MEUS dados".
>>
>>
> Discuti acima a solução que se consolidou em artigos científicos: *JATS*
> (e CSV para materiais suplementares).
>
>
>
>> Fiz uma apresentação sobre isso outro dia onde tentei listar os desafios
>> e falei sobre uma iniciativa que apoia discussões sobre compartilhamento e
>> reuso de dados científicos, chamada RDA.
>>
>> Checkout:
>> http://www.slideshare.net/DanielaBrauner/apresentacao-forumrnp-2015-daniela-brauner
>>  Apresentacao
>> ForumRNP 2015 - Daniela Brauner
>>
>>
> Parece muito boa (!), tem como nos passar em formato aberto?
> ;-)
>
>
>
>
>> Abs
>> Daniela
>>
>>
>
>
>
>>
>> Em 11/09/2015, às 06:14, Peter Krauss <[email protected]> escreveu:
>>
>> Um dos pilares do método científico e do "fazer Ciência" é a
>> Reprodutibilidade <https://en.wikipedia.org/wiki/Reproducibility>...
>>
>> Quando falamos de *publicações científicas* abertas (muito da produção
>> brasileira está hoje concentrada nos acervos do SciELO
>> <https://en.wikipedia.org/wiki/SciELO>),
>> ou seja, de OpenAccess <https://en.wikipedia.org/wiki/Open_access>,
>> esquecemos da relação que isso tem com o conceito de *reprodutibilidade
>>  *-- e não só com *transparência* e *direito de acesso ao conhecimento*.
>>
>> Um bom exemplo de aplicação prática do conceito é a publicação de tabelas
>> em artigos.
>> A *reprodutibilidade* é o que de fato explica o porquê, quando o
>> pesquisador publica seu artigo científico numa revista,
>> de *não* ser recomendado publicar *tabelas* em formato imagem (!), e de
>> não ser suficiente a revista oferecer apenas o PDF do artigo:
>>
>> * o ideal é enviar como materal suplementar
>> <http://jats.nlm.nih.gov/publishing/tag-library/1.1d3/element/supplementary-material.html>
>>  uma tabela CSV <http://www.w3.org/standards/techs/csv#w3c_all> ou
>> planilha aberta, (um "conteudo pelo menos 4 estrelas
>> <http://5stardata.info/en/>") para que *outros pesquisadores
>> possam reproduzir as contas*, reutilizando operacionalmente a  tabela
>> publicada.
>>
>> * o correto, dentro dos padrões atuais, é a tabela estar expressa em
>> HTML, com dados linha a linha
>> <http://jats.nlm.nih.gov/publishing/tag-library/1.1d3/chapter/tag-tables.html>
>>  para
>> podermos copiar/colar do acervo online para uma  planilha.
>>
>> As revistas dos principais acervos, como SciELO e PubMed Central, são
>> obrigadas hoje a entregar cada artigo, enquanto obra e documento oficial,
>> em ambos formatos, PDF e XML JATS
>> <https://en.wikipedia.org/wiki/Journal_Article_Tag_Suite> -- é o XML que
>> dá origem à indexação, ao HTML, EPUB, etc. automaticamente.
>>
>> - - -
>> O link abaixo veio de uma dica da Carol aqui na Lista (desculpem perdi o
>> *thread* de onde cliquei o bookmark essa semana),
>> muito bom, sobre esse assunto de "reprodutibilidade dos resultados do
>> pesquisador",
>>
>>
>> http://www.ibtimes.com/scrutinizing-scientific-method-researchers-massive-open-access-study-fail-replicate-2071483
>>
>> *A publicação científica* se torna de fato *conhecimento* depois dos
>> pares terem *reproduzido*, que na prática é uma auditoria ;-)
>> não é muito diferente das contas públicas do governo.
>>
>> _______________________________________________
>> okfn-br mailing list
>> [email protected]
>> https://lists.okfn.org/mailman/listinfo/okfn-br
>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>>
>>
>> _______________________________________________
>> okfn-br mailing list
>> [email protected]
>> https://lists.okfn.org/mailman/listinfo/okfn-br
>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>>
>>
> _______________________________________________
> okfn-br mailing list
> [email protected]
> https://lists.okfn.org/mailman/listinfo/okfn-br
> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>
>

_______________________________________________
okfn-br mailing list
[email protected]
https://lists.okfn.org/mailman/listinfo/okfn-br
Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br

Re: [okfn-br] relação entre a abertura de dados e a Reprodutibilidade em Ciências

Responder a