DATI
- Tipo di corpus: Athenaeum è un corpus di italiano scritto accademico, costruito con testi prodotti dall'Università di Torino; POS-taggati e classificati per argomento e tipo testuale.
- Lingua: italiana
- Numero di token: 306.927
- Numero di type: 32.221
- Numero di lemmi: 11.748
- POS-tag: 39
- POS ricercabili: clicca qui per vederle
- Collegamenti utili:
home page del progetto
giudelines del progetto
- Altri documenti:
non disponibili
|
|
RICERCA
Ricerca linguistica
Ricerca linguistica (modulo sperimentale n.004 - non
visualizza pos e lemma)
Ricerca semplice
Il Corpus Query Processor (sviluppato dall'Institute für Maschinelle Sprachverarbeitung - Stuttgart) è l'indicizzatore che abbiamo usato per questo e per gli altri corpora. L'attuale versione del sito presenta una nuova interfaccia di interrogazione che rende facoltativa la conoscenza del linguaggio di CQP; se tuttavia siete interessati ad approfondire la conoscenza del linguaggio, ecco alcuni link utili:
introduzione al linguaggio di interrogazione
manuale di CQP (.ps)
manuale di CQP (.pdf)
manuale di CQP (.html)
|
|