Bilinguismo jurídico chinês-português em Macau: análise e alinhamento de corpus com IA
DOI:
https://doi.org/10.5007/2175-7968.2025.e108423Palabras clave:
Bilinguismo jurídico, Macau, Tradução jurídica, Linguística de corpus, Calques linguísticosResumen
O artigo explora o bilinguismo jurídico em Macau, uma região administrativa especial da China que adota o princípio “um país, dois sistemas”. A análise desenvolvida se concentra na coexistência do chinês e do português na legislação local, destacando a hierarquia linguística e os desafios de tradução jurídica. Com base em uma metodologia robusta, o estudo compila e anota corpora paralelos de textos jurídicos em português e chinês, empregando ferramentas avançadas de inteligência artificial como Bertalign para alinhamento automatizado e spaCy para anotações linguísticas. Devido aos sistemas de escrita distintos entre as línguas, o alinhamento exigiu soluções baseadas em inteligência artificial para superar limitações dos alinhadores convencionais desenvolvidos para línguas românicas. A análise destaca a influência significativa do português na terminologia jurídica em chinês, com uma alta prevalência de calques linguísticos. O estudo também aborda os desafios de tokenização da língua chinesa e da tradução automática, propondo soluções práticas e comparando o desempenho de diferentes ferramentas de tradução, como LLMs (modelos de linguagem) e TANs (sistemas de tradução automática neural). A exploração detalhada dos corpora, incluindo análises de n-grams e padrões sintáticos, oferece insights valiosos para a linguística de corpus e a tradução jurídica. As ferramentas computacionais do Sketch Engine possibilitam, através de exemplos práticos extraídos deste corpus alinhado, o estudo dos aspectos específicos da tradução jurídica macauense. O artigo contribui significativamente para o campo da linguística de corpus, especialmente em contextos jurídicos multilíngues, e oferece recursos metodológicos e analíticos valiosos para pesquisadores e profissionais da tradução jurídica.
Citas
Anthony, L. (2024a). Antconc (Version 4.0) [Software].
Anthony, L. (2024b). AntPconc (Version 1.2.1) [Software].
Anthony, L. (2024c). TagAnt [Software]
bfsujason. (2022). Bertalign (versão 0.1.0) [Software]. GitHub.
Boletim Oficial (B.O.) de Macau. (1988). Declaração Conjunta do Governo da República Portuguesa e do Governo da República Popular da China sobre a Questão de Macau [com Anexos I e II]. https://bo.io.gov.mo
Boletim Oficial (B.O.) de Macau. (1993). Lei Básica da Região Administrativa Especial de Macau da República Popular da China, de 31 de março de 1993, Promulgada pelo Decreto n.º 3 do Presidente da República Popular da China. https://bo.io.gov.mo
Cheng, L., & Sun, Y. (2021). Terminology translation in socio-legal contexts: A corpus-based exploration. In S. Li & W. Hope (Eds.), Terminology Translation in Chinese Contexts: Theory and Practice (pp. 27–39). Routledge.
Claude AI. (2024). Claude AI [Software].
Deepseek. (2023). Deepseek [Software].
Gao, Z.-M. (2021). Automatically compiling bilingual legal glossaries based on Chinese-English parallel corpora. In S. Li & W. Hope (Eds.), Terminology Translation in Chinese Contexts: Theory and Practice (p. 164–179). Routledge. http://doi.org/10.4324/9781003006688-14
Imprensa Oficial (IO) do Governo da Região Administrativa Especial de Macau. (2025). Página inicial. io.gov.mo.
Lefer, M.-A. (2020). Parallel corpora. In M. Paquot & S. T. Gries (Eds.), A Practical Handbook of Corpus Linguistics (p. 257–282). Springer Nature.
Leong, S. M. (2012). Divergências linguísticas e interpretação correcta da Lei Básica. Revista de Estudos de “Um País, Dois Sistemas”, 4, 183–193.
Liu, L., & Zhu, M. (2022). Bertalign: Improved word embedding-based sentence alignment for Chinese–English parallel corpora of literary texts. Digital Scholarship in the Humanities, 38(2), 621–634. https://doi.org/10.1093/llc/fqac089
Miroir, J.-C. (2024a). Compilação e exploração de material de apoio à tradução de textos jurídicos normativos: o caso da versão do português para o francês (AntPconc). In F. C. C. L. Arraes, A. R. de Oliveira Harden & C. Roscoe-Bessa (Eds.), Tradução em contextos específicos: conhecimentos e habilidades (pp. 13–49). Pontes Editores.
Miroir, J.-C. (2024b). Processamento de linguagem natural multilíngue com spaCy e análises avançadas de corpora anotados com Antconc (versão 4). In Encontro de Linguística de Corpus & Escola Brasileira de Linguística Computacional ELC/EBRALC, Universidade de Brasília, 21–24 de Outubro, 2024. [Workshop handout]. Departamento de Línguas Estrangeiras e Tradução, Instituto de Letras, Universidade de Brasília. https://doi.org/10.13140/RG.2.2.24082.67520
Miroir, J.-C. (2025). Tradução jurídica em contexto (TraJeC): Bilinguismo jurídico chinês-português em Macau [Data set]. Figshare Datacite. https://figshare.com/projects/TraJeC
Newman, J., & Cox, C. (2020). Corpus Annotation. In M. Paquot & S. T. Gries (Eds.), A Practical Handbook of Corpus Linguistics (pp. 24–48). Springer Nature Switzerland AG. https://doi.org/10.1007/978-3-030-46216-1_2
Paquot, M., & Gries, S. T. (Eds.). (2020). A Practical Handbook of Corpus Linguistics. Springer Nature Switzerland AG.
Sardinha, T. B. (2000). Lingüística de Corpus: histórico e problemática. DELTA, 16(2). https://doi.org/10.1590/S0102-44502000000200005
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2025 Cadernos de Tradução

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Declaración de Derecho de Autor
Los autores conservan sus derechos de autor y conceden a la revista el derecho a la primera publicación bajo la Licencia Creative Commons Attribution, que permite que se comparta el trabajo reconociéndose la autoría y publicación inicial en esta revista.
Los autores están autorizados a asumir contratos adicionales por separado para la distribución no exclusiva de la versión del trabajo publicada en esta revista (por ej.: publicar en un repositorio institucional o como capítulo de libro, reconociéndose la autoría y publicación inicial en esta revista).
















































