Sistemas de Indexação automática por atribuição: uma análise comparativa
DOI:
https://doi.org/10.5007/1518-2924.2020.e70740Palabras clave:
Indexação Automática, Indexação Automática por Atribuição, Sistema de Indexação Automática, Processamento de Linguagem Natural, Recuperação da InformaçãoResumen
Objetivo: Analisa comparativamente dois sistemas de indexação automática por atribuição multilíngue: SISA e MAUI. O SISA (Sistema de Indexação Semiautomático) foi desenvolvido na Espanha, sendo inicialmente proposto para a área de Biblioteconomia e Documentação. Trata-se de um sistema especialista que indexa de forma automática seguindo um tesauro e regras predeterminadas de indexação com base na frequência e posição dos termos. O MAUI (Multi-purpose Automatic Topic Indexing) é um sistema de origem neozelandesa que apresenta a especificidade de utilização de um tesauro e algoritmo de aprendizagem de máquina para gerar modelo a partir de resultados da indexação intelectual, sendo os termos representados por características estatísticas.
Método: A pesquisa se classifica como exploratória e bibliográfica, onde o método utilizado para construção deste trabalho foi o estudo comparativo baseado na análise de conteúdo das publicações científicas contendo relatos de experiência na aplicação dos sistemas. As etapas da pesquisa consistiram em descrever e comparar as características de cada sistema, levantando informações acerca de como são processados os documentos, como é feita a extração e seleção dos termos que resulta nos descritores propostos por cada sistema, e contextos de aplicação.
Resultado: Como resultados aponta-se as abordagens, as principais operações, os recursos utilizados por cada sistema durante o processamento da indexação automática, bem como os contextos de uso e qualidade alcançada nos resultados.
Conclusões: O trabalho contribui para os estudos na temática indexação automática no aprofundamento da discussão sobre características descritivas e comparativas associadas aos métodos e técnicas implementadas nos sistemas analisados.
Descargas
Citas
BAEZA-YATES, R.; RIBEIRO-NETO, B. Recuperação de informação: conceitos e tecnologia das máquinas de busca. 2. ed. Porto Alegre: Bookman, 2013.
BANDIM, M. A. S.; CORREA, R. F. Indexação automática por atribuição de artigos científicos em português da área de Ciência da Informação. Transinformação, v. 31, p. 1-12, 2019.
BANDIM, M. A. S; CORRÊA, R. F. A consistência na indexação automática por atribuição de artigos científicos na área de Ciência da Informação. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, Florianópolis, v. 23, n. 53, p. 64-77, set. 2018.
BORKO, H.; BERNIER, C. Indexing concepts and methods. New York: Academic Press, 1978.
CAJUEIRO, R. L. P. Manual para elaboração de trabalhos acadêmicos: guia prático do estudante. 3. ed. Petrópolis: Vozes, 2015. 110 p.
CERVO, A. L.; BERVIAN, P. A.; SILVA, R. Metodologia científica. 6. ed. São Paulo: Pearson Prentice Hall, 2007. 162 p.
CINTRA, A. M. M. Elementos de lingüística para estudos de indexação. Ciência da Informação, v. 12, n. 1, 1983.
FUJITA, M. S. L. A identificação de conceitos no processo de análise de assunto para indexação. Revista Digital de Biblioteconomia e Ciência da Informação. Campinas, v. 1, n. 1, p. 60-90, jul/dez. 2003.
FUJITA, M. S. L. A leitura documentária do indexador: aspectos cognitivos e linguísticos influentes na formação do leitor profissional. 2003. 21 f. Tese (Livre-Docência em Análise Documentária e Linguagens Documentárias Alfabéticas) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2003.
FUJITA, M. S. L.; GIL-LEIVA, I. As linguagens de indexação em bibliotecas nacionais, arquivos nacionais e sistemas de informação na América Latina. Rio de Janeiro: Universidade Federal do Rio de Janeiro, 2010.
GIL LEIVA, I. La automatización de la indización de documentos. Gijón: Trea, 1999.
GIL LEIVA, I. Manual de indización: teoría y práctica. Gijón: Trea, 2009.
GIL LEIVA, I. SISA – Automatic indexing system for scientific articles: Experiments with location heuristics rules versus TF-IDF Rules. Knowledge Organization, v.44, n. 3, p. 139-162, 2017.
HJØRLAND, B. Automatic Indexing. In: Lifeboat for Knowledge Organization, 2008.
KIM, S. N.; MEDELYAN, O.; KAN, M.Y.; BALDWIN, T. Automatic Keyphrase extraction from Scientific Articles. In: Language Resources and Evaluation (2013) v. 47, n. 3, p. 723-742, Springer. December 2012.
LANCASTER, F. W. Indexação e resumos: teoria e prática. 2. ed. Brasília: Briquet de Lemos Livros, 2004. 452p.
LIMA, V. N. M. A.; BOCCATO, V. R. C. O desempenho terminológico dos descritores em ciência da informação do vocabulário controlado do sibi/usp nos processos de indexação manual, automática e semi-automática. Perspectivas em Ciência da Informação, v. 14, n. 1, p. 131-151, 2009.
MEDELYAN, O. Human-competitive automatic topic indexing. PhD Thesis. University of Waikato, New Zealand, 2009. Disponível em: https://hdl.handle.net/10289/3513 . Acesso em: 26/06/2019.
MEDELYAN, O.; FRANK, E.; WITTEN, I.H. Human-competitive tagging using automatic keyphrase extraction. In: Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing, 2009.
MOREIRO GONZÁLEZ. J. A. El contenido de los documentos textuales: su análiis y representacíon mediante el lenguaje natural. Gijón (Astúrias): Trea, 2004. 291 p.
NARUKAWA, C. M. Estudo de Vocabulário Controlado na Indexação Automática: Aplicação no Processo de Indexação do Sistema de Indización Semiautomatica (SISA). 2011. 222 f. Dissertação (Mestrado) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2011.
NARUKAWA, C. M.; GIL LEIVA, I.; FUJITA, M. S. L. Indexação Automatizada de Artigos de Periódicos Científicos: análise da aplicação do software SISA com uso da terminologia DeCS na área de Odontologia. Informação e Sociedade: Estudos, João Pessoa, v.19, n.2, p. 99-118, 2009.
ROBREDO, J. Documentação de hoje e de amanhã: uma abordagem revisitada e contemporânea da Ciência da Informação e de suas aplicações biblioteconômicas, documentárias, arquivísticas e museológicas. 4. ed. rev. e ampl. Brasília DF: Edição de autor, 2005.
ROBREDO, J. Indexação automática de textos: uma abordagem otimizada e simples. Ciência da Informação, v. 20, n. 2, 1991.
SILVA, M.R.; FUJITA, M.S.L. A prática de indexação: análise da evolução de tendências teóricas e metodológicas. Campinas: Transinformação. V. 16(2), p. 133-161, maio/ago. 2004.
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2020 Sâmela Rouse de Brito Silva, Renato Fernandes Correa
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
El autor debe garantizar:
que existe un consenso total de todos los coautores para aprobar la versión final del documento y su presentación para su publicación.
que su trabajo es original, y si se han utilizado el trabajo y / o las palabras de otras personas, estos se han reconocido correctamente.
El plagio en todas sus formas constituye un comportamiento editorial poco ético y es inaceptable. Encontros Bibli se reserva el derecho de utilizar software o cualquier otro método para detectar plagio.
Todas las presentaciones recibidas para su evaluación en la revista Encontros Bibli: revista electrónica de biblioteconomía y ciencias de la información pasan por la identificación del plagio y el auto-plagio. El plagio identificado en los manuscritos durante el proceso de evaluación dará como resultado la presentación de la presentación. En el caso de identificación de plagio en un manuscrito publicado en la revista, el Editor en Jefe llevará a cabo una investigación preliminar y, si es necesario, la retractará.
Esta revista, siguiendo las recomendaciones del movimiento de Acceso Abierto, proporciona su contenido en Acceso Abierto Completo. Por lo tanto, los autores conservan todos sus derechos, permitiendo a Encontros Bibli publicar sus artículos y ponerlos a disposición de toda la comunidad.
Los contenidos de Encontros Bibli están licenciados bajo Licencia Creative Commons 4.0.
Cualquier usuario tiene derecho a:
- Compartir: copiar, descargar, imprimir o redistribuir material en cualquier medio o formato
- Adaptar: mezclar, transformar y crear a partir del material para cualquier propósito, incluso comercial.
De acuerdo con los siguientes términos:
- Atribución: debe otorgar el crédito apropiado, proporcionar un enlace a la licencia e indicar si se han realizado cambios. Debe hacerlo bajo cualquier circunstancia razonable, pero de ninguna manera sugeriría que el licenciante lo respalde a usted o su uso.
- Sin restricciones adicionales: no puede aplicar términos legales o medidas tecnológicas que restrinjan legalmente a otros de hacer cualquier cosa que permita la licencia.