Reported speech verbs in Portuguese: a corpus based descriptive study motivated by computational linguistics

Authors

  • Bianca Freitas Saburi Costa Pontifícia Universidade Católica do Rio de Janeiro
  • Cláudia Freitas Pontifícia Universidade Católica do Rio de Janeiro

DOI:

https://doi.org/10.5007/1984-8412.2017v14n3p2266

Abstract

In this article, we present the results as well as the procedures of a wide descriptive, corpus-based study on reporting verbs in Portuguese. The motivation for this research comes from a task carried out in Computational Linguistics – quotation extraction. In order to obtain reporting verbs used in Portuguese, our starting point was a list of translations of the verb “said” in literary contexts. Then, by using large monolingual corpora, we searched for lexical-grammatical patterns that characterize this verb class, in an attempt to broaden the list. Through this methodology, we identified 293 reporting verbs and distributed them amongst eight general patterns in which these verbs are typically found. The comparison between our research and other studies in Portuguese, English and French that investigate reporting verbs attests the success of the methodology that was developed.

Author Biographies

Bianca Freitas Saburi Costa, Pontifícia Universidade Católica do Rio de Janeiro

Mestre em Estudos da Linguagem pela Pontifícia Universidade Católica do Rio de Janeiro.

Cláudia Freitas, Pontifícia Universidade Católica do Rio de Janeiro

Cláudia Freitas é Doutora em Letras pela PUC-Rio (2007). Interesses: Processamento computacional da língua portuguesa (PLN/Liguística Computacional); descrição do português com base em grandes corpora; Humanidades Digitais. Análise de opinião/análise de sentimento; discurso relatado; campos lexicais; léxico de emoções e sentimentos; análise e crítica das metalinguagens gramaticais (palavra; classes de palavras e papéis semânticos, dentre outros); relações de sentido entre palavras; extração de informação (dados e opiniões/objetivos e subjetivos/ideologias) em textos. Desde 2007 é colaboradora da Linguateca. Membro da Comissão Especial de Processamento de Linguagem Natural (CE-PLN), comissão especial da SBC, cujo objetivo é promover e representar a área de PLN no Brasil.

Published

2017-09-25

Issue

Section

Article