Enriquecimento semântico para a disponibilização de dados abertos: teoria e prática

Autores

DOI:

https://doi.org/10.5007/1518-2924.2020.e67991

Palavras-chave:

Dados abertos, Ligação de dados, Enriquecimento semântico

Resumo

Objetivo: Apresentar o processo de formalização necessário à disponibilização de dados abertos no contexto do linked open data, utilizando-se, neste caso, dados que estão no contexto da pesquisa científica.  

Método: Para a elaboração do estudo, foram selecionados três datasets, dois disponíveis no portal Dados Abertos CAPES e o terceiro, consiste dos dados do Open Researcher and Contributor ID (ORCID). Como procedimentos metodológicos foram utilizados a pesquisa bibliográfica para embasamento teórico-conceitual do estudo e a pesquisa descritiva para explorar e fornecer informações quanto ao processo de enriquecimento de dados abertos.

Resultado: Apresenta como resultado a descrição do processo necessário à disponibilização de um conjunto de dados enriquecido, a partir da modelagem e estruturação, pronto para a conversão ferramental e recuperação.

Conclusões: A partir desse estudo, é possível visualizar como ocorre o processo de enriquecimento semântico de dados no contexto do linked open data, abarcando a seleção, análise, processamento e preparação visando a disponibilização, o uso e o reuso.

Biografia do Autor

Emanuelle Torino, Universidade Tecnológica Federal do Paraná (UTFPR); Universidade Estadual Paulista - Unesp

Doutoranda em Ciência da Informação. Programa de Pós-Graduação em Ciência da Informação, Universidade Estadual Paulista - Unesp, Marília, Brasil

Gustavo Lunardelli Trevisan, Universidade Estadual Paulista - Unesp

Doutorando em Ciência da Informação. Programa de Pós-Graduação em Ciência da Informação, Universidade Estadual Paulista - Unesp, Marília, Brasi

Caio Saraiva Coneglian, Universidade Estadual Paulista - Unesp

Doutorando em Ciência da Informação. Programa de Pós-Graduação em Ciência da Informação, Universidade Estadual Paulista - Unesp, Marília, Brasil

Leonardo Castro Botega, Centro Universitário Eurípedes de Marília (UNIVEM)

Doutor em Ciência da Computação

Docente do Centro Universitário Eurípedes de Marília (UNIVEM). Marília, Brasil.

Docente do Programa de Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista – Unesp, Marília, Brasil.

José Eduardo Santarem Segundo, Universidade de São Paulo (USP)

Docente. Universidade de São Paulo (USP). Departamento de Educação, Informação e Comunicação, Ribeirão Preto, Brasil.

Silvana Aparecida Borsetti Gregorio Vidotti, Universidade Estadual Paulista - Unesp

Docente. Universidade Estadual Paulista - Unesp, Departamento de Ciência da Informação. Programa de Pós-Graduação em Ciência da Informação, Marília, Brasil

Referências

ARAKAKI, F. Linked data: ligação de dados bibliográficos. 2016. Dissertação (Mestrado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2016. Disponível em: https://repositorio.unesp.br/handle/11449/147979. Acesso em: 1 maio 2018.

BERNERS-LEE, T. Linked data. 2006. Disponível em: http://www.w3.org/DesignIssues/LinkedData.html. Acesso em: 4 jun. 2018.

BERNERS-LEE, T.; CONNOLLY, D. Notation3 (n3): a readable RDF syntax. 2011. Disponível em: https://www.w3.org/TeamSubmission/n3/. Acesso em: 4 jun. 2018.

BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic web. Scientific American, v. 284, n. 5, p. 34-43, 2001. Disponível em: http://www.jstor.org/stable/26059207. Acesso em: 6 jun. 2018.

BIZER, C.; HEATH, T.; BERNERS-LEE, T. Linked data: the story so far. International Journal on Semantic Web and Information Systems, v. 5, n. 3, p. 1-22, 2009. Disponível em: http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf. Acesso em: 4 jun. 2018.

BRASIL. Lei nº 12.527, de 18 de novembro de 2011. Diário Oficial da União, Brasília, DF, 18 nov. 2011. Disponível em: http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/l12527.htm. Acesso em: 1 maio 2018.

DADOS abertos CAPES. Disponível em: https://dadosabertos.capes.gov.br/dataset/producao-intelectual-de-programas-de-pos-graduacao-2013-a-2016/resource/61218c67-b6ba-47cf-8234-2e190b846daf. Acesso em: 7 maio 2019.

DURASPACE. VIVO-ISF Ontology v1.6 overviews: classes. Beaverton: DuraSpace, 2014. Disponível em: https://wiki.duraspace.org/display/VTDA/VIVO-ISF+Ontology+v1.6+Overview%3A+Classes. Acesso em: 3 dez. 2019.

HAUSENBLAS, M. Exploiting linked data to build web applications. IEEE Internet Computing, v. 13, p. 68-73, jul./aug. 2009. Disponível em: http://doi.ieeecomputersociety.org/10.1109/MIC.2009.79. Acesso em: 4 jun. 2018.

HOOLAND, S.; VERBORGH, R. Linked data for libraries, archives and museums: how to clean, link and publish your metadata. Chicago: Neal-Schuman, 2014.

LÓSCIO, B. F.; BURLE, C.; CALEGARI, N. (Ed.). Data on the web best practices. 2017. Disponível em: https://www.w3.org/TR/dwbp/. Acesso em: 26 abr. 2018.

MURRAY-RUST, P. Open data in science. Serials Review, v. 34, n. 1, p. 52-64, 2008. Disponível em: https://openresearch-repository.anu.edu.au/bitstream/1885/46791/7/npre20081526-1%5B1%5D.pdf. Acesso em: 1 jun. 2018.

OPEN KNOWLEDGE INTERNATIONAL. The open data handbook. Disponível em: http://opendatahandbook.org/. Acesso em: 10 maio 2018.

SANTAREM SEGUNDO, J. E. Web semântica: fluxo para publicação de dados abertos e ligados. Informação em Pauta, Fortaleza, v. 3, n. esp., nov. 2018. Disponível em: http://www.periodicos.ufc.br/informacaoempauta/article/view/39721. Acesso em: 26 abr. 2018.

SANTAREM SEGUNDO, J. E. Web semântica: introdução a recuperação de dados usando SPARQL. Encontro Nacional de Pesquisa em Ciência da Informação, v. 15, 2014. Disponível em: http://www.brapci.inf.br/index.php/article/view/0000015784/2c3210137bae1fd29171ee96d39d888b/. Acesso em: 26 abr. 2018.

SANTAREM SEGUNDO, J. E.; CONEGLIAN, C. S.; LUCAS, E. R. de O. Conceitos e tecnologias da web semântica no contexto da colaboração acadêmico-científica: um estudo da plataforma Vivo. Transinformação, Campinas, v. 29, n. 3, p. 297-309, dez. 2017. Disponível em: http://www.scielo.br/pdf/tinf/v29n3/0103-3786-tinf-29-03-00297.pdf. Acesso em: 3 jun. 2018.

SAYÃO, L. F.; SALES, L. F. Dados abertos de pesquisa: ampliando o conceito de acesso livre. Revista Eletrônica de Comunicação, Informação & Inovação em Saúde, v. 8, n. 2, p. 76-92, jun. 2014. Disponível em: https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/611/1252. Acesso em: 1 jun. 2018.

SPARQLIFY. Sparqlification Mapping Language (SML). Disponível em: http://sparqlify.org/wiki/SML. Acesso em: 1 jun. 2018.

Publicado

2020-04-13

Edição

Seção

Artigo