GOOFRE version 2: voir et traiter 600 milliards de mots

Etienne Brunet; Laurent Vanni

doi:10.5007/1807-9288.2014v10n2p75

GOOFRE version 2: voir et traiter 600 milliards de mots

Autores/as

Etienne Brunet Université de Nice Sophia Antipolis
Laurent Vanni Université de Nice Sophia Antipolis

DOI:

https://doi.org/10.5007/1807-9288.2014v10n2p75

Resumen

Les données de Google Books ont doublé en deux ans, en franchissant le cap des 500 milliards de mots. Un nouveau traitement a repris les images scannées pour en proposer une lecture plus fidèle. Et pour la première fois les textes enregistrés ont bénéficié de la désambiguïsation et de la lemmatisation. Enfin le site Culturomics a fourni les outils nécessaires pour en assurer la diffusion. Il convenait donc de procéder à une nouvelle expertise et de créer une nouvelle base, pourvue de tout l’appareillage statistique qu’exige, en réseau ou en local, l’exploitation des grands corpus.

Biografía del autor/a

Etienne Brunet, Université de Nice Sophia Antipolis

Étienne Brunet is an emeritus professor at the University of Nice Sophia Antipolis, and founder of the Bases, Corpus, Language Laboratory. Brunet researches Computational Linguistics and Textual Statistics, from which he is a pioneer and world reference. He is the designer of the academic software Hyperbase2 with Pierre Guiraud and Charles Muller. Brunet wrote over a hundred articles and a dozen books. One may highlight his reference theoretical and practical work on Literary Lexicometry, Le vocabulaire français de 1789 à nos jours (Genève-Paris, Slatkine-Champion, 1981, 3 volumes, 1824 p.).

Laurent Vanni, Université de Nice Sophia Antipolis

Laurent Vanni is an engineer at the University of Nice Sophia-Antipolis. He is part of the team of the Bases, Corpus, Language Laboratory.

Descargas

PDF/A (Français (Canada))

Publicado

2014-12-16

Número

Vol. 10 Núm. 2 (2014)

Sección

Artigos

Licencia

Autores que publicam nesta revista concordam com os seguintes termos:

Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons - Atribuição 4.0 Internacional que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
A licença Creative Commons - Atribuição 4.0 Internacional permite a cópia e a redistribuição do material em qualquer suporte ou formato, assim como adaptações, para quaisquer fins, inclusive comerciais.
Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.

GOOFRE version 2: voir et traiter 600 milliards de mots

Autores/as

DOI:

Resumen

Biografía del autor/a

Etienne Brunet, Université de Nice Sophia Antipolis

Laurent Vanni, Université de Nice Sophia Antipolis

Descargas

Publicado

Número

Sección

Licencia

Desarrollado por

Idioma