Oi Peter Sim. O uso de metadados é oq sugiro. Obrigada pelos links. Em instituições grandes, vale investir em catálogos de metadados internos (ou algum tipo de documentação compartilhada sobre os metadados utilizados), assim um departamento sabe do outro. Metacat <https://knb.ecoinformatics.org/knb/docs/index.html>é bem interessante pra esse fim.
Abs Dani Em 12 de setembro de 2015 08:39, Peter Krauss <[email protected]> escreveu: > Olá Daniela, > > Na minha visão o JATS em OpenAccess já é uma iniciativa revolucionária de > dados abertos (!). > Claro, sempre há potencial para fazer mais, porém há necessidade de seguir > passo-a-passo a evolução, consolidar as coisas... consolidar a cultura. > > O SciELO SPS > <http://docs.scielo.org/projects/scielo-publishing-schema/pt_BR/1.2-branch/> é > como um "JATS ABNT", ou seja, é de fato o padrão brasileiro para registrar > artigos científicos. > PS: as editoras e o governo (ex. FAPESP) já vem investindo nisso desde > 2013. > > Comentei do *Material Suplementar* pois ele faz parte desse padrão, e os > recursos oficiais (esquema de "depósito legal > <https://en.wikipedia.org/wiki/Legal_deposit>" do artigo científico), > como o acervo SciELO, permitem o depósito casado do artigo com o seu > material suplementar. > ... Este artigo da descoberta das cores do camaleão > <http://dx.doi.org/10.1038/ncomms7368> tem bons exemplos de material > suplementar, e está também disponível no repositório PubMed Central > <http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4366488/> (para obter o JATS > ver links FTP > <http://www.ncbi.nlm.nih.gov/pmc/utils/oa/oa.fcgi?id=PMC4366488>)... > Exemplo de revista rica em tabelas e materiais suplementares JATS, tem a PLOS > ONE <http://www.ncbi.nlm.nih.gov/pmc/journals/440/> e a brasileira GMB > <http://www.ncbi.nlm.nih.gov/pmc/journals/1440/>. > > O incrível, que chama atenção, é que a cultura das revistas e dos autores > é uma barreira: não existem barreias técnicas atualmente, pelo contrário > (!). É preciso ensinar a comunidade científica a usar os recursos mais > simples, nem sequer o mais simples vem sendo usado. > PS: as estatísticas de uso de material suplementar nas revistas são > baixíssimas (inferior a 1% dos artigos com tabelas), e editores brasileiros > insistem em publicar tabelas de dados imensas em PDF ao invés de focar no > conteúdo (ex. tabelas com estatísticas e sumarizações), e exigir que > autores usem o recurso do material suplementar. > > Enfim, JATS XML é o que temos de melhor e de mais amplamente usado nos > dias de hoje para "Compartilhar dados científicos"... > É ainda um "compartilhar" restrito à publicação de artigos científicos > (conteúdo, metadados do conteúdo, e dados suplementares do artigo). > > Perceba o quanto isso é importante, e o quanto ainda estamos patinando na > *barreira > cultural*... > Veja o exemplo dos seus slides > <http://www.slideshare.net/DanielaBrauner/apresentacao-forumrnp-2015-daniela-brauner>: > não posso copiar/colar trechos de texto, não posso seguir links, pois estão > no formato imagem... É um conteúdo aberto, mas com apenas uma estrela > <http://5stardata.info/en/>. A aderência a uma "nova cultura" precisa ser > ampla... > > - - - > > Já o compartilhamento de dados em bancos de dados eu vejo como uma > evolução, que dependeria um pouco de termos essa cultura mais sólida. > De qualquer forma, como iniciativa, os *bancos de dados compartilhados* correm > em paralelo, > não podem ser confundidos como uma "obrigação do pesquisador" > (ao contrário do JATS que hoje é uma exigência do SciELO, do PubMed > Central e diversos outros repositórios sérios). > > Algumas áreas possuem padrões, ferramentas, etc. que permitem o uso de > bancos de dados compartilhados e *big data*: OpenStreetMaps > <http://www.openstreetmap.org/> é um exemplo onde cientistas e pessoas > comuns compartilham dados... > A cada área (física de partículas, genética, análise climática, etc. etc.) > pode ou não haver oportunidade de uso de grandes bancos de dados. A maior > parte ainda não tem seu *big data* padronizado e compartilhado. > > Além do *big data*, existem os casos intermediários, entre "material > suplementar" (ex. planilhas em formato CSV) e o banco de dados, que são os > chamados *datasets*, promovidos pela OKFN no projeto *Data Packaged Core > Datasets* <https://github.com/datasets/>. > > Esses bancos de dados (dos *datasets* ao *big data*), para terem sucesso, > exigem uma certa democracia para que sejam de fato atrativos, confiáveis, > transparentes.... É o que chamam de *curadorias digitais*. Além disso o > critério de *veracidade* (inerente à questão da reprodutibilidade > científica) de cada área do conhecimento requer uma certa "intuição > coletiva", que só uma curadoria ampla e igualmente aberta pode assegurar. > No Brasil ainda estão nascendo as curadorias e as bases de dados > compartilhadas... são pouquíssimos os exemplos pois, novamente, há uma > cultura acadêmica arraigada do "meus dados", como você bem lembrou. > > > (respondendo *inline* os detalhes) > > Em 11 de setembro de 2015 11:05, Daniela Brauner <[email protected]> > escreveu: > >> Oi Peter e amigos >> >> Pois então.... As editoras, agências de financiamento e quem sabe até as >> próprias universidades e outros, que obtém resultados de P&D, deveriam ter >> repositórios ou exigir que os dados utilizados em artigos fossem >> compartilhados de forma aberta. >> > > tentei expressar acima, fique a vontade para replicas ;-) > > >> Já existem plataformas que permitem isso como o Dataverse criado em >> Harvard. >> >> > Dei uma olhada mas nunca havia usado... Existem exemplos brasileiros? Qual > a vantagem em relação a uma base especializada, ou em relação aos > repositórios JATS genéricos? > > >> Mas temos alguns desafios importantes para resolver para garantir o reuso >> a longo prazo desse tipo de dados (IDs persistentes das coleções, >> proveniência etc. Coisas que sabemos como fazer basta colocar em prática). >> > > Bem lembrado, e acredito que "identificar" é o primeiro passo para > qualquer iniciativa... Conheço a fundo três exemplos de IDs persistentes, > > * *DOI*: de longe o mais difundido, apesar do custo não ser irrisório. > > * *ISSN*: difundido apenas para revistas, mas poderia estar acoplado ao > DOI (além de igualmente custoso), é mau usado nesse sentido, tenho um > projeto OKBr para isso, https://github.com/okfn-brasil/ISSN-L-Resolver > > * LexML e as *URNs LEX*: o único exemplo 100% brasileiro, sem custo, e > transparente. Gosto muito dele, ver http://www.lexml.gov.br/ Para > apoiar outros usos tem o projeto OKBr > https://github.com/okfn-brasil/getlex > > > >> Existe uma variedade muito grande de formatos, tipos e metadados, que >> dificultam a interoperabilidade mas acredito que as barreiras culturais >> ainda são o maior impedimento... "Os MEUS dados". >> >> > Discuti acima a solução que se consolidou em artigos científicos: *JATS* > (e CSV para materiais suplementares). > > > >> Fiz uma apresentação sobre isso outro dia onde tentei listar os desafios >> e falei sobre uma iniciativa que apoia discussões sobre compartilhamento e >> reuso de dados científicos, chamada RDA. >> >> Checkout: >> http://www.slideshare.net/DanielaBrauner/apresentacao-forumrnp-2015-daniela-brauner >> Apresentacao >> ForumRNP 2015 - Daniela Brauner >> >> > Parece muito boa (!), tem como nos passar em formato aberto? > ;-) > > > > >> Abs >> Daniela >> >> > > > >> >> Em 11/09/2015, às 06:14, Peter Krauss <[email protected]> escreveu: >> >> Um dos pilares do método científico e do "fazer Ciência" é a >> Reprodutibilidade <https://en.wikipedia.org/wiki/Reproducibility>... >> >> Quando falamos de *publicações científicas* abertas (muito da produção >> brasileira está hoje concentrada nos acervos do SciELO >> <https://en.wikipedia.org/wiki/SciELO>), >> ou seja, de OpenAccess <https://en.wikipedia.org/wiki/Open_access>, >> esquecemos da relação que isso tem com o conceito de *reprodutibilidade >> *-- e não só com *transparência* e *direito de acesso ao conhecimento*. >> >> Um bom exemplo de aplicação prática do conceito é a publicação de tabelas >> em artigos. >> A *reprodutibilidade* é o que de fato explica o porquê, quando o >> pesquisador publica seu artigo científico numa revista, >> de *não* ser recomendado publicar *tabelas* em formato imagem (!), e de >> não ser suficiente a revista oferecer apenas o PDF do artigo: >> >> * o ideal é enviar como materal suplementar >> <http://jats.nlm.nih.gov/publishing/tag-library/1.1d3/element/supplementary-material.html> >> uma tabela CSV <http://www.w3.org/standards/techs/csv#w3c_all> ou >> planilha aberta, (um "conteudo pelo menos 4 estrelas >> <http://5stardata.info/en/>") para que *outros pesquisadores >> possam reproduzir as contas*, reutilizando operacionalmente a tabela >> publicada. >> >> * o correto, dentro dos padrões atuais, é a tabela estar expressa em >> HTML, com dados linha a linha >> <http://jats.nlm.nih.gov/publishing/tag-library/1.1d3/chapter/tag-tables.html> >> para >> podermos copiar/colar do acervo online para uma planilha. >> >> As revistas dos principais acervos, como SciELO e PubMed Central, são >> obrigadas hoje a entregar cada artigo, enquanto obra e documento oficial, >> em ambos formatos, PDF e XML JATS >> <https://en.wikipedia.org/wiki/Journal_Article_Tag_Suite> -- é o XML que >> dá origem à indexação, ao HTML, EPUB, etc. automaticamente. >> >> - - - >> O link abaixo veio de uma dica da Carol aqui na Lista (desculpem perdi o >> *thread* de onde cliquei o bookmark essa semana), >> muito bom, sobre esse assunto de "reprodutibilidade dos resultados do >> pesquisador", >> >> >> http://www.ibtimes.com/scrutinizing-scientific-method-researchers-massive-open-access-study-fail-replicate-2071483 >> >> *A publicação científica* se torna de fato *conhecimento* depois dos >> pares terem *reproduzido*, que na prática é uma auditoria ;-) >> não é muito diferente das contas públicas do governo. >> >> _______________________________________________ >> okfn-br mailing list >> [email protected] >> https://lists.okfn.org/mailman/listinfo/okfn-br >> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br >> >> >> _______________________________________________ >> okfn-br mailing list >> [email protected] >> https://lists.okfn.org/mailman/listinfo/okfn-br >> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br >> >> > _______________________________________________ > okfn-br mailing list > [email protected] > https://lists.okfn.org/mailman/listinfo/okfn-br > Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br > >
_______________________________________________ okfn-br mailing list [email protected] https://lists.okfn.org/mailman/listinfo/okfn-br Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
