Bilinguismo jurídico chinês-português em Macau: análise e alinhamento de corpus com IA
DOI:
https://doi.org/10.5007/2175-7968.2025.e108423Palavras-chave:
Bilinguismo jurídico, Macau, Tradução jurídica, Linguística de corpus, Calques linguísticosResumo
O artigo explora o bilinguismo jurídico em Macau, uma região administrativa especial da China que adota o princípio “um país, dois sistemas”. A análise desenvolvida se concentra na coexistência do chinês e do português na legislação local, destacando a hierarquia linguística e os desafios de tradução jurídica. Com base em uma metodologia robusta, o estudo compila e anota corpora paralelos de textos jurídicos em português e chinês, empregando ferramentas avançadas de inteligência artificial como Bertalign para alinhamento automatizado e spaCy para anotações linguísticas. Devido aos sistemas de escrita distintos entre as línguas, o alinhamento exigiu soluções baseadas em inteligência artificial para superar limitações dos alinhadores convencionais desenvolvidos para línguas românicas. A análise destaca a influência significativa do português na terminologia jurídica em chinês, com uma alta prevalência de calques linguísticos. O estudo também aborda os desafios de tokenização da língua chinesa e da tradução automática, propondo soluções práticas e comparando o desempenho de diferentes ferramentas de tradução, como LLMs (modelos de linguagem) e TANs (sistemas de tradução automática neural). A exploração detalhada dos corpora, incluindo análises de n-grams e padrões sintáticos, oferece insights valiosos para a linguística de corpus e a tradução jurídica. As ferramentas computacionais do Sketch Engine possibilitam, através de exemplos práticos extraídos deste corpus alinhado, o estudo dos aspectos específicos da tradução jurídica macauense. O artigo contribui significativamente para o campo da linguística de corpus, especialmente em contextos jurídicos multilíngues, e oferece recursos metodológicos e analíticos valiosos para pesquisadores e profissionais da tradução jurídica.
Referências
Anthony, L. (2024a). Antconc (Version 4.0) [Software].
Anthony, L. (2024b). AntPconc (Version 1.2.1) [Software].
Anthony, L. (2024c). TagAnt [Software]
bfsujason. (2022). Bertalign (versão 0.1.0) [Software]. GitHub.
Boletim Oficial (B.O.) de Macau. (1988). Declaração Conjunta do Governo da República Portuguesa e do Governo da República Popular da China sobre a Questão de Macau [com Anexos I e II]. https://bo.io.gov.mo
Boletim Oficial (B.O.) de Macau. (1993). Lei Básica da Região Administrativa Especial de Macau da República Popular da China, de 31 de março de 1993, Promulgada pelo Decreto n.º 3 do Presidente da República Popular da China. https://bo.io.gov.mo
Cheng, L., & Sun, Y. (2021). Terminology translation in socio-legal contexts: A corpus-based exploration. In S. Li & W. Hope (Eds.), Terminology Translation in Chinese Contexts: Theory and Practice (pp. 27–39). Routledge.
Claude AI. (2024). Claude AI [Software].
Deepseek. (2023). Deepseek [Software].
Gao, Z.-M. (2021). Automatically compiling bilingual legal glossaries based on Chinese-English parallel corpora. In S. Li & W. Hope (Eds.), Terminology Translation in Chinese Contexts: Theory and Practice (p. 164–179). Routledge. http://doi.org/10.4324/9781003006688-14
Imprensa Oficial (IO) do Governo da Região Administrativa Especial de Macau. (2025). Página inicial. io.gov.mo.
Lefer, M.-A. (2020). Parallel corpora. In M. Paquot & S. T. Gries (Eds.), A Practical Handbook of Corpus Linguistics (p. 257–282). Springer Nature.
Leong, S. M. (2012). Divergências linguísticas e interpretação correcta da Lei Básica. Revista de Estudos de “Um País, Dois Sistemas”, 4, 183–193.
Liu, L., & Zhu, M. (2022). Bertalign: Improved word embedding-based sentence alignment for Chinese–English parallel corpora of literary texts. Digital Scholarship in the Humanities, 38(2), 621–634. https://doi.org/10.1093/llc/fqac089
Miroir, J.-C. (2024a). Compilação e exploração de material de apoio à tradução de textos jurídicos normativos: o caso da versão do português para o francês (AntPconc). In F. C. C. L. Arraes, A. R. de Oliveira Harden & C. Roscoe-Bessa (Eds.), Tradução em contextos específicos: conhecimentos e habilidades (pp. 13–49). Pontes Editores.
Miroir, J.-C. (2024b). Processamento de linguagem natural multilíngue com spaCy e análises avançadas de corpora anotados com Antconc (versão 4). In Encontro de Linguística de Corpus & Escola Brasileira de Linguística Computacional ELC/EBRALC, Universidade de Brasília, 21–24 de Outubro, 2024. [Workshop handout]. Departamento de Línguas Estrangeiras e Tradução, Instituto de Letras, Universidade de Brasília. https://doi.org/10.13140/RG.2.2.24082.67520
Miroir, J.-C. (2025). Tradução jurídica em contexto (TraJeC): Bilinguismo jurídico chinês-português em Macau [Data set]. Figshare Datacite. https://figshare.com/projects/TraJeC
Newman, J., & Cox, C. (2020). Corpus Annotation. In M. Paquot & S. T. Gries (Eds.), A Practical Handbook of Corpus Linguistics (pp. 24–48). Springer Nature Switzerland AG. https://doi.org/10.1007/978-3-030-46216-1_2
Paquot, M., & Gries, S. T. (Eds.). (2020). A Practical Handbook of Corpus Linguistics. Springer Nature Switzerland AG.
Sardinha, T. B. (2000). Lingüística de Corpus: histórico e problemática. DELTA, 16(2). https://doi.org/10.1590/S0102-44502000000200005
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2025 Cadernos de Tradução

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro, com reconhecimento de autoria e publicação inicial nesta revista).

















































