IA generativa na extração de metadados arquivísticos: um estudo baseado na norma ISAD(G)
DOI:
https://doi.org/10.5007/1518-2924.2025.e103505Palavras-chave:
Descrição Arquivística, Automação, ISAD(G), Inteligência artificial, Machine Learning, ChatGPTResumo
Objetivo: Realizar um diagnóstico buscando analisar o uso de inteligência artificial, especificamente do ChatGPT, na descrição de documentos arquivísticos segundo a Norma Geral Internacional de Descrição Arquivística.
Método: A pesquisa é de natureza exploratória e aplicada, útil em estudos inovadores onde o objetivo é explorar possibilidades, identificar padrões e formular hipóteses futuras para estudos mais detalhados.
Resultados: Os principais resultados mostraram que o ChatGPT atingiu uma taxa média de acerto de 92,04% no preenchimento quantitativo de metadados, com variabilidade mínima entre os testes. No entanto, inconsistências foram observadas em metadados considerados constantes, como Procedência e Condições de Acesso, que não mantiveram a precisão e consistência esperada. Metadados como Dimensão e Suporte, e Âmbito e Conteúdo, apresentaram maior dificuldade de padronização, sugerindo a necessidade de melhorias e ajustes no modelo.
Conclusões: Os resultados sugerem que, embora o ChatGPT tenha demonstrado eficiência na maioria dos campos analisados, os desafios permanecem em metadados com pouca padronização. Os resultados indicam que o ChatGPT é capaz de manter um alto grau de completude dos metadados, mas enfrenta desafios em relação à precisão e consistência, especialmente em campos mais complexos. Ajustes no treinamento do modelo, juntamente com a supervisão humana contínua, podem melhorar a qualidade das descrições geradas. Apesar das limitações, a IA se mostra uma ferramenta promissora, capaz de impulsionar avanços significativos no campo da Arquivologia digital
Downloads
Referências
ARRUDA, H. M.; BAVARESCO, R. S.; KUNST, R.; BUGS, E. F.; PESENTI, G. C.; BARBOSA, J. L. V. Data Science Methods and Tools for Industry 4.0: A Systematic Literature Review and Taxonomy. Sensors, 2023, v. 23, n. 11, p. 5010. DOI: https://doi.org/10.3390/s23115010. Disponível em: https://www.mdpi.com/1424-8220/23/11/5010. Acesso em: 05 jun. 2025. DOI: https://doi.org/10.3390/s23115010
BRUCE, T. R.; HILLMANN, D. I. The continuum of metadata quality: Defining, expressing, exploiting. In: Metadata in Practice. ALA Editions, 2004. p. 238-256.
CHAKA, C. Generative AI Chatbots - ChatGPT versus YouChat versus Chatsonic: Use Cases of Selected Areas of Application. 2023. DOI: https://doi.org/10.26803/ijlter.22.6.1
CONSELHO INTERNACIONAL DE ARQUIVOS (CIA). ISAD(G): Norma geral internacional de descrição arquivística. 2. ed. Rio de Janeiro. 2000. Disponível em: https://www.gov.br/conarq/pt-br/centrais-de-conteudo/publicacoes/isad_g_2001.pdf. Acesso em: 14 jun. 2024.
CONSELHO NACIONAL DE ARQUIVOS (CONARQ). ISAAR (CPF): Norma Internacional sobre Registros de Autoridade Arquivística para Entidades Coletivas, Pessoas e Famílias. tradução de Vitor Manoel Marques da Fonseca. 2. ed., Rio de Janeiro: Arquivo Nacional, 2004. Disponível em: https://www.gov.br/conarq/pt-br/centrais-de-conteudo/publicacoes/isaar_cpf.pdf. Acesso em: 14 jun. 2024.
FRONTONI, E. Appearance-Based Archival Science. In: DURANTI, L.; ROGERS, C. (Ed.). Artificial Intelligence and Documentary Heritage. SCEaR Newsletter 2024 - Special Issue 2024. Paris: UNESCO, 2024. p. 49-53. Disponível em: https://unesdoc.unesco.org/ark:/48223/pf0000389844. Acesso em: 05 jun. 2025.
JAIN, N.; TAYAL, A. PANDAS AI: A Step Towards GEN AI. International Journal of Scientific Research in Engineering and Management (IJSREM), v. 7, n. 7, p. 1-9, 2023. DOI: https://doi.org/10.55041/IJSREM24506
LEMIEUX, V. Balancing Act: Navigating the Nexus of AI, Privacy, and Accessibility in Archives. In: DURANTI, L.; ROGERS, C. (Ed.). Artificial Intelligence and Documentary Heritage. SCEaR Newsletter 2024 - Special Issue 2024. Paris: UNESCO, 2024. p. 39-42. Disponível em: https://unesdoc.unesco.org/ark:/48223/pf0000389844. Acesso em: 05 jun. 2025.
LIKERT, R. A technique for the measurement of attitudes. Archives of Psychology, v. 22, n. 140, p. 1-55, 1932.
PACHECO, A.; SILVA, C. G. da; FREITAS, M. C. V de. A metadata model for authenticity in digital archival descriptions. Archival Science, v. 23, p. 629–673, 2023. DOI: https://doi.org/10.1007/s10502-023-09422-w. Disponível em: https://link.springer.com/article/10.1007/s10502-023-09422-w. Acesso em: 05 jun. 2025. DOI: https://doi.org/10.1007/s10502-023-09422-w
ROCKEMBACH, M. AI Literacy: A Must for Records Management and Archival Professionals. In: DURANTI, L.; ROGERS, C. (Ed.). Artificial Intelligence and Documentary Heritage. SCEaR Newsletter 2024 - Special Issue 2024. Paris: UNESCO, 2024. p. 90-95. Disponível em: https://unesdoc.unesco.org/ark:/48223/pf0000389844. Acesso em: 05 jun. 2025.
SANTOS, V. B. Preservação de documentos arquivísticos digitais. Ciência da Informação, [s. l.], v. 41, n. 1, 2012. DOI: https://doi.org/10.18225/ci.inf.v41i1.1357. Disponível em: https://revista.ibict.br/ciinf/article/view/1357. Acesso em: 05 jun. 2025.
SANTAREM SEGUNDO, J. E. Disciplina “Data Science e Inteligência Artificial: um olhar pela Ciência da Informação”. [Slides da aula 02]. PPGCI/UNESP, 1º sem. 2024.
STANČIĆ, H.; TRBUŠIĆ, Z. Annotation of Digitised Archival Materials Supported by AI. In: DURANTI, L.; ROGERS, C. (Ed.). Artificial Intelligence and Documentary Heritage. SCEaR Newsletter 2024 - Special Issue 2024. Paris: UNESCO, 2024.p. 73-78. Disponível em: https://unesdoc.unesco.org/ark:/48223/pf0000389844. Acesso em: 05 jun. 2025.
ZHA, D.; BHAT, Z. P.; LAI, K.; YANG, F.; JIANG, Z.; ZHONG, S.; HU, X. Data-centric Artificial Intelligence: a survey. arXiv:2303.10158v3 [cs.LG]. 2023.
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2025 Tatiana Canelhas Pignataro, Manoel Pedro de Souza Neto, José Carlos Abbud Grácio, Telma Campanha de Carvalho Madio, José Eduardo Santarem Segundo

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
O autor deve garantir:
- que haja um consenso completo de todos os coautores em aprovar a versão final do documento e sua submissão para publicação.
- que seu trabalho é original, e se o trabalho e/ou palavras de outras pessoas foram utilizados, estas foram devidamente reconhecidas.
Plágio em todas as suas formas constituem um comportamento antiético de publicação e é inaceitável. Encontros Bibli reserva-se o direito de usar software ou quaisquer outros métodos de detecção de plágio.
Todas as submissões recebidas para avaliação na revista Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação passam por identificação de plágio e autoplágio. Plágios identificados em manuscritos durante o processo de avaliação acarretarão no arquivamento da submissão. No caso de identificação de plágio em um manuscrito publicado na revista, o Editor Chefe conduzirá uma investigação preliminar e, caso necessário, fará a retratação.
Esta revista, seguindo as recomendações do movimento de Acesso Aberto, proporciona seu conteúdo em Full Open Access. Assim os autores conservam todos seus direitos permitindo que a Encontros Bibli possa publicar seus artigos e disponibilizar pra toda a comunidade.
Os conteúdos de Encontros Bibli estão licenciados sob uma Licença Creative Commons 4.0 by.

Qualquer usuário tem direito de:
- Compartilhar — copiar, baixar, imprimir ou redistribuir o material em qualquer suporte ou formato
- Adaptar — remixar, transformar, e criar a partir do material para qualquer fim, mesmo que comercial.
De acordo com os seguintes termos:
- Atribuição — Você deve dar o crédito apropriado, prover um link para a licença e indicar se mudanças foram feitas. Você deve fazê-lo em qualquer circunstância razoável, mas de maneira alguma que sugira ao licenciante a apoiar você ou o seu uso.
- Sem restrições adicionais — Você não pode aplicar termos jurídicos ou medidas de caráter tecnológico que restrinjam legalmente outros de fazerem algo que a licença permita.


















