O número de repositórios que aceitam dados de pesquisa em um amplo espectro de disciplinas está subindo. Aqui, relato os resultados da condução de um experimento no qual os dados de modelagem química foram depositados em seis desses repositórios e comparando a riqueza dos metadados que descrevem as propriedades essenciais dos seis depoimentos.
Os repositórios são os seguintes:
- FigShare Como um repositório information de 2012. O conjunto de dados de química computacional utilizado foi enviado manualmente. A maior parte dos metadados foi inserida manualmente por operações de copiar/colar e incluiu três palavras -chave que compreendiam a tecla Inchi para a molécula, a corda Inchi correspondente e a energia Gibbs calculada obtida a partir das frequências vibracionais calculadas.
- Zenodo começou em 2013 e foi atualizado várias vezes desde então. Os mesmos dados e metadados foram usados como para a FigShare, incluindo as mesmas palavras -chave, mas com a diferença de que o add não period guide, mas automatizado usando a API Zenodo, conforme implementado no novo portal computacional descrito no submit anterior (doi: 10.14469/hpc/9010). A publicação aqui foi um clique simples de botão e, portanto, é um processo muito mais curto do que o da FigShare.‡
- A versão authentic de 2006 do Repositório de Dados da School Imperial foi baseada no DSPACE e atualizada para a versão 2 em 2016 com código inteiramente novo. Também é preenchido por publicação do mesmo portal como usado para Zenodo.
- Mendeley Knowledge, lançado em 2015 e agora parte da família Digital Commons Repository.
- Harvard Dataverse, que começou por volta de 2006.
- SciencedB, um produto do Centro de Informações de Rede, Academia Chinesa de Ciências. A deposição requer revisão por pares, um processo que leva ~ 2-3 semanas.
- Datadryad. Este repositório cobra US $ 120 por deposição e não foi avaliado aqui (As isenções são concedidas para envios originários de pesquisadores baseados em países classificados pelo Banco Mundial como economias de baixa renda ou baixa renda média)
Cada deposição resulta na geração de um doi, e estes, juntamente com o hyperlink que permite o acesso aos metadados associados pode ser visto na tabela abaixo.
Observaria que a deposição guide pode ser dependente de quão estranha o depositante é e de como eles interpretam as palavras -chave descritivas que o FigShare e o Zenodo aceitam. A deposição automatizada é um processo mais controlado, no qual as palavras -chave necessárias são uma propriedade programada para a ferramenta de portal de envio. Esse processo também permite que os metadados descrevam relacionamentos entre diferentes conjuntos de dados, como uma coleção de dados, e é herdado do descritor do projeto no portal. Além disso, o processo automatizado pode ser aumentado pela edição guide do registro de metadados, como por exemplo, a adição do DOI para esta postagem descritiva que pode ser adicionada aos registros de metadados retrospectivamente. No caso de por exemplo Zenodo, alterações retrospectivas no registro de metadados exigem que um novo DOI seja gerado para refletir as alterações.†
Você pode inspecionar os resultados desses três depoimentos, baixando os respectivos registros de metadados e visualizando o arquivo baixado usando um texto simples ou editor XML.
- Todos os três primeiros repositórios contêm o orcídio do depositante, como por exemplo de figshare:
Rzepa, Henry S. Henry S. Rzepa https://orcid.org/0000-0002-8635-8390 A adição generalizada do identificador exclusivo do pesquisador Orcid é muito bem -vindo.
- O componente mais interessante é palavra -chave Metadados, povoados manualmente no FigShare e usando a API automatizada nos outros dois repositórios.
- Abaixo está a entrada dos metadados da figura, que exibe as categorias atribuídas (de uma lista controlada) no
recipiente: Computational Chemistry Natural Chemistry FOS: Chemical sciences O contexto dessas palavras -chave é claramente definido pelo valor do SubjectScheme (ciências químicas) Mas esse termo é muito amplo e não se relaciona muito especificamente aos dados depositados. As próprias palavras -chave mais quimicamente específicas são exibidas apenas na página de destino para a entrada, como mostrado abaixo e são não expresso em qualquer contêiner de metadados, o que significa que eles não são indexados e, portanto, pesquisáveis usando o armazenamento de metadados do datacite.
- Zenodo interpreta isso de maneira diferente, com as palavras -chave agora incluídas no
recipiente. -1705.490787 InChI=1S/C25H39NO9/c1-6-26-20-24-13-9-12-14(31-2)10-23(29,16(13)17(12)33-4)25(26,30)19(34-5)18(24)22(11-27,21(28)35-20)8-7-15(24)32-3/h12-20,27,29-30H,6-11H2,1-5H3/t12-,13-,14+,15+,16-,17+,18-,19+,20+,22+,23-,24+,25+/m1/s1 VELNVPXNOKVVTC-VJKZSTDTSA-N No entanto, você pode estar se perguntando o que a palavra -chave -1705.490787 é tudo sobre. Simplificando, nesta forma de expressão, não tem absolutamente nenhum contexto. EU anteriormente explicado Por que pode ser útil se o contexto for adicionado, sendo um identificador persistente para (alguns) cálculos químicos quânticos na forma de uma energia whole calculada corrigida termicamente em uma energia de Gibbs.♥ A persistência neste caso é adquirida não por registro com uma agência, mas geração por um algoritmo. Esse algoritmo, por sua vez, exigiria metadados adicionais para sua especificação, mas isso é algo que não abordarei nesta postagem. De qualquer forma, porque faz parte do registro de metadados, é habilitado para pesquisa na versão Zenodo.
- Imperial segue a abordagem de Zenodo, com uma adição adicional de contexto:
-1705.490787 InChI=1S/C25H39NO9/c1-6-26-20-24-13-9-12-14(31-2)10-23(29,16(13)17(12)33-4)25(26,30)19(34-5)18(24)22(11-27,21(28)35-20)8-7-15(24)32-3/h12-20,27,29-30H,6-11H2,1-5H3/t12-,13-,14+,15+,16-,17+,18-,19+,20+,22+,23-,24+,25+/m1/s1 VELNVPXNOKVVTC-VJKZSTDTSA-N O contexto é adicionado pela adição dos atributos SubjectScheme, Schemuri e valueuri. O contexto de nível superior é a definição fornecida pelo IUPAC Gold Ebook, e a implementação actual do algoritmo é descrita no web site gaussiano (embora o algoritmo não seja explícito em um sentido implementável da máquina). Essas adições permitem uma pesquisa indexada não apenas do valor numérico (como uma string simples e não como um número de ponto flutuante), mas que pode ser restringido, especificando o valor de por exemplo O SubjectScheme para que qualquer outro número aleatório especificado como uma palavra -chave que não tenha esse atributo seja excluído. Isso também permite uma pesquisa em que o número do ponto flutuante é substituído por curingas
- Abaixo está a entrada dos metadados da figura, que exibe as categorias atribuídas (de uma lista controlada) no
- que então recuperaria qualquer energia de Gibbs relatada, que por sua vez poderia ser restringida pela natureza da molécula expressa usando Inchi. O aspecto closing dos metadados analisados aqui é o RelatedIdentifier registro. Isso é cada vez mais reconhecido como um componente essential para a construção do chamadoGráficos PID
- que são gerados para revelar conexões entre entidades no cenário de pesquisa, como dados, pessoas, organizações, financiadores, publicações e qualquer outro objeto que seja atribuído a um PID registrado (como talvez nos futuros dados conectados às suas origens de um grande instrumento). Então, aqui estão esses registros para os três repositórios:
- Embora a página de destino para o registro da FigShare tenha três dessas entradas, incluindo ponteiros para os outros dois depoimentos que estão sendo discutidos aqui, eles não são propagados para o registro de metadados e, portanto, não podem participar de nenhum gráfico PID gerado.
10.5281/zenodo.5511965 Zenodo tem o seguinte registroque se refere a uma versão anterior dos metadados para esta entrada.
- †
https://information.hpc.imperial.ac.uk/resolve/?ore=9031 https://information.hpc.imperial.ac.uk/resolve/?doi=9031&file=1 https://information.hpc.imperial.ac.uk/resolve/?doi=9031&file=2 https://information.hpc.imperial.ac.uk/resolve/?doi=9031&file=3 https://information.hpc.imperial.ac.uk/resolve/?doi=9031&file=4 10.5281/zenodo.5511966 10.6084/m9.figshare.16685497 10.14469/hpc/9158 O registro imperial é: onde um grande número de PIDs relacionados resultaria em um rico gráfico PID. Essas entradas incluem RelationType = ”HasMetadata” que é um ponteiro para metadados adicionais expressos usando um esquema diferente (minério) e que fornece um manifesto avaliado pela máquina para os arquivos presentes, especificando o Tipos de mídia de cada arquivo e um método de máquina para acessá -los. RelationType = ”Haspart” Fornece um URL de acesso para cada merchandise específico no conjunto de arquivos. RelationType = “Referências” é o análogo das entradas de figuras acima, citando os outros dois repositórios que estamos discutindo aqui e finalmente RelationType = ”ISPartof” indica que a deposição faz parte de uma coleção maior (neste caso, a coleção gerada para este weblog) e que também pode corresponder a por exemplo
- que são gerados para revelar conexões entre entidades no cenário de pesquisa, como dados, pessoas, organizações, financiadores, publicações e qualquer outro objeto que seja atribuído a um PID registrado (como talvez nos futuros dados conectados às suas origens de um grande instrumento). Então, aqui estão esses registros para os três repositórios:
Um projeto compreendendo vários pesquisadores em várias instituições ou diz uma dissertação de doutorado contendo vários capítulos. A natureza extensa desta lista de identificadores significa que o gráfico PID revelaria muitas conexões.
Eu apenas cobri em detalhes apenas três repositórios aqui; Mais poderia ser adicionado à lista e analisado para seus registros de metadados. A linha inferior é que, geralmente, quanto mais metadados são adicionados, mais ricos os serviços e análises resultantes baseados em PIDs podem se tornar. Só se espera que esse aspecto da operação dos repositórios proceed a melhorar com o tempo e, eventualmente, a maioria transmitia metadados muito ricos, inclusive no nível do assunto muito específico. Isso deve enriquecer as paisagens de pesquisa, especialmente no nível de assunto de granulação finamente. No próximo submit, Vou analisar os resultados das pesquisas
ativado por este metadado.‡ O FigShare também possui uma API disponível, que não foi implementada na versão atual deste portal.†As políticas referentes à edição de metadados variam. Alguns repositórios de edição de atualizações para o registro mantido pelo Datacite contra o DOI existente. Outros exigem a geração de um novo DOI para cada nova versão dos metadados, por menor que seja uma mudança ( por exemplo erros de ortografia no título and so on).♥ Um problema não resolvido nos metadados do datacite são os tipos de dados e unidades. Esta entrada é um tipo de dados de ponto flutuante, com unidades de Hartree. Como essa informação pode ser adicionada ainda está sendo discutida.♠ A Autoridade de Registro é obtida usando a sintaxe https://doi.org/ra/10.11922/sciencedb.01522
que revela que é a China Istic (http://dx.chinadoi.cn/10.11922/sciencedb.01522). Estou tentando descobrir como usar essa agência de registro para recuperar metadados, usando um serviço equivalente a por exemplo, https://api.crossref.org/ ou https://api.datacite.org/ Este submit tem doi:
10.14469/hpc/9159
Relacionado Esta entrada foi publicada na terça -feira, 28 de setembro de 2021 às 9h21 e é arquivada emQuímico . Você pode seguir qualquer resistência a esta entrada através do RSS 2.0 alimentar. Você podeDeixe uma resposta ou trackback
do seu próprio web site.