Sistemas de Indexação automática por atribuição: uma análise comparativa

Autores

DOI:

https://doi.org/10.5007/1518-2924.2020.e70740

Palavras-chave:

Indexação Automática, Indexação Automática por Atribuição, Sistema de Indexação Automática, Processamento de Linguagem Natural, Recuperação da Informação

Resumo

Objetivo: Analisa comparativamente dois sistemas de indexação automática por atribuição multilíngue: SISA e MAUI. O SISA (Sistema de Indexação Semiautomático) foi desenvolvido na Espanha, sendo inicialmente proposto para a área de Biblioteconomia e Documentação. Trata-se de um sistema especialista que indexa de forma automática seguindo um tesauro e regras predeterminadas de indexação com base na frequência e posição dos termos. O MAUI (Multi-purpose Automatic Topic Indexing) é um sistema de origem neozelandesa que apresenta a especificidade de utilização de um tesauro e algoritmo de aprendizagem de máquina para gerar modelo a partir de resultados da indexação intelectual, sendo os termos representados por características estatísticas.  

Método: A pesquisa se classifica como exploratória e bibliográfica, onde o método utilizado para construção deste trabalho foi o estudo comparativo baseado na análise de conteúdo das publicações científicas contendo relatos de experiência na aplicação dos sistemas. As etapas da pesquisa consistiram em descrever e comparar as características de cada sistema, levantando informações acerca de como são processados os documentos, como é feita a extração e seleção dos termos que resulta nos descritores propostos por cada sistema, e contextos de aplicação. 

Resultado: Como resultados aponta-se as abordagens, as principais operações, os recursos utilizados por cada sistema durante o processamento da indexação automática, bem como os contextos de uso e qualidade alcançada nos resultados. 

Conclusões: O trabalho contribui para os estudos na temática indexação automática no aprofundamento da discussão sobre características descritivas e comparativas associadas aos métodos e técnicas implementadas nos sistemas analisados.

Biografia do Autor

Sâmela Rouse de Brito Silva, Universidade Federal de Alagoas

Mestre em Ciência da Informação pela Universidade Federal de Pernambuco. Bibliotecária na Universidade Federal de Alagoas.

Renato Fernandes Correa, Universidade Federal de Pernambuco

Doutor em Ciência da Computação. Docente no Programa de Pós-Graduação em Ciência da Informação e no Departamento de Ciência da Informação da Universidade Federal de Pernambuco.

Referências

BAEZA-YATES, R.; RIBEIRO-NETO, B. Recuperação de informação: conceitos e tecnologia das máquinas de busca. 2. ed. Porto Alegre: Bookman, 2013.

BANDIM, M. A. S.; CORREA, R. F. Indexação automática por atribuição de artigos científicos em português da área de Ciência da Informação. Transinformação, v. 31, p. 1-12, 2019.

BANDIM, M. A. S; CORRÊA, R. F. A consistência na indexação automática por atribuição de artigos científicos na área de Ciência da Informação. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, Florianópolis, v. 23, n. 53, p. 64-77, set. 2018.

BORKO, H.; BERNIER, C. Indexing concepts and methods. New York: Academic Press, 1978.

CAJUEIRO, R. L. P. Manual para elaboração de trabalhos acadêmicos: guia prático do estudante. 3. ed. Petrópolis: Vozes, 2015. 110 p.

CERVO, A. L.; BERVIAN, P. A.; SILVA, R. Metodologia científica. 6. ed. São Paulo: Pearson Prentice Hall, 2007. 162 p.

CINTRA, A. M. M. Elementos de lingüística para estudos de indexação. Ciência da Informação, v. 12, n. 1, 1983.

FUJITA, M. S. L. A identificação de conceitos no processo de análise de assunto para indexação. Revista Digital de Biblioteconomia e Ciência da Informação. Campinas, v. 1, n. 1, p. 60-90, jul/dez. 2003.

FUJITA, M. S. L. A leitura documentária do indexador: aspectos cognitivos e linguísticos influentes na formação do leitor profissional. 2003. 21 f. Tese (Livre-Docência em Análise Documentária e Linguagens Documentárias Alfabéticas) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2003.

FUJITA, M. S. L.; GIL-LEIVA, I. As linguagens de indexação em bibliotecas nacionais, arquivos nacionais e sistemas de informação na América Latina. Rio de Janeiro: Universidade Federal do Rio de Janeiro, 2010.

GIL LEIVA, I. La automatización de la indización de documentos. Gijón: Trea, 1999.

GIL LEIVA, I. Manual de indización: teoría y práctica. Gijón: Trea, 2009.

GIL LEIVA, I. SISA – Automatic indexing system for scientific articles: Experiments with location heuristics rules versus TF-IDF Rules. Knowledge Organization, v.44, n. 3, p. 139-162, 2017.

HJØRLAND, B. Automatic Indexing. In: Lifeboat for Knowledge Organization, 2008.

KIM, S. N.; MEDELYAN, O.; KAN, M.Y.; BALDWIN, T. Automatic Keyphrase extraction from Scientific Articles. In: Language Resources and Evaluation (2013) v. 47, n. 3, p. 723-742, Springer. December 2012.

LANCASTER, F. W. Indexação e resumos: teoria e prática. 2. ed. Brasília: Briquet de Lemos Livros, 2004. 452p.

LIMA, V. N. M. A.; BOCCATO, V. R. C. O desempenho terminológico dos descritores em ciência da informação do vocabulário controlado do sibi/usp nos processos de indexação manual, automática e semi-automática. Perspectivas em Ciência da Informação, v. 14, n. 1, p. 131-151, 2009.

MEDELYAN, O. Human-competitive automatic topic indexing. PhD Thesis. University of Waikato, New Zealand, 2009. Disponível em: https://hdl.handle.net/10289/3513 . Acesso em: 26/06/2019.

MEDELYAN, O.; FRANK, E.; WITTEN, I.H. Human-competitive tagging using automatic keyphrase extraction. In: Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing, 2009.

MOREIRO GONZÁLEZ. J. A. El contenido de los documentos textuales: su análiis y representacíon mediante el lenguaje natural. Gijón (Astúrias): Trea, 2004. 291 p.

NARUKAWA, C. M. Estudo de Vocabulário Controlado na Indexação Automática: Aplicação no Processo de Indexação do Sistema de Indización Semiautomatica (SISA). 2011. 222 f. Dissertação (Mestrado) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2011.

NARUKAWA, C. M.; GIL LEIVA, I.; FUJITA, M. S. L. Indexação Automatizada de Artigos de Periódicos Científicos: análise da aplicação do software SISA com uso da terminologia DeCS na área de Odontologia. Informação e Sociedade: Estudos, João Pessoa, v.19, n.2, p. 99-118, 2009.

ROBREDO, J. Documentação de hoje e de amanhã: uma abordagem revisitada e contemporânea da Ciência da Informação e de suas aplicações biblioteconômicas, documentárias, arquivísticas e museológicas. 4. ed. rev. e ampl. Brasília DF: Edição de autor, 2005.

ROBREDO, J. Indexação automática de textos: uma abordagem otimizada e simples. Ciência da Informação, v. 20, n. 2, 1991.

SILVA, M.R.; FUJITA, M.S.L. A prática de indexação: análise da evolução de tendências teóricas e metodológicas. Campinas: Transinformação. V. 16(2), p. 133-161, maio/ago. 2004.

Downloads

Publicado

2020-07-07

Edição

Seção

Artigo