Accesso al corpus: Atheneum           Università degli Studi di Torino
          inizio

DATI

Tipo di corpus: Athenaeum è un corpus di italiano scritto accademico, costruito con testi prodotti dall'Università di Torino; POS-taggati e classificati per argomento e tipo testuale.
Lingua: italiana
Numero di token: 306.927
Numero di type: 32.221
Numero di lemmi: 11.748
POS-tag: 39
POS ricercabili: clicca qui per vederle
Collegamenti utili:
home page del progetto
giudelines del progetto
Altri documenti:
non disponibili

RICERCA

Ricerca linguistica
Ricerca linguistica (modulo sperimentale n.004 - non visualizza pos e lemma)
Ricerca semplice

Il Corpus Query Processor (sviluppato dall'Institute für Maschinelle Sprachverarbeitung - Stuttgart) è l'indicizzatore che abbiamo usato per questo e per gli altri corpora. L'attuale versione del sito presenta una nuova interfaccia di interrogazione che rende facoltativa la conoscenza del linguaggio di CQP; se tuttavia siete interessati ad approfondire la conoscenza del linguaggio, ecco alcuni link utili:

introduzione al linguaggio di interrogazione

manuale di CQP (.ps)
manuale di CQP (.pdf)
manuale di CQP (.html)