CACAO Project CROSS-LANGUAGE ACCESS TO CATALOGUES AND ON-LINE LIBRARIESeurope
  • Contatti | 
  • Cerca | 
  • Mappa del sito
en | de | fr | hu | it | pl | 
  • home
  • Partner del progetto CACAO
  • Introduzione
  • Notizie ed Eventi
  • Demo
  • home
  • Partner del progetto CACAO
  • Introduzione
    • Descrizione del progetto
    • Piano di lavoro
      • Accesso Multilingue (WP1)
      • Risorse Multilingue (WP2)
      • Infrastruttura (WP3)
      • Accesso utente (WP4)
      • Aggregazione (WP5)
      • Analisi e valutazione (WP6)
      • Attività commerciali (WP7)
      • Diffusione e sensibilizzazione (WP8)
    • Risultati
  • Notizie ed Eventi
  • Demo

CACAO è un progetto della durata di 24 mesi co-finanziato dal programma eContentplus della Comunità Europea.

  • CACAO Project » 
  • Introduzione » 
  • Piano di lavoro » 
  • Accesso Multilingue (WP1)

Accesso multilingue (WP1)

Lo scopo di questo work package è la configurazione di un sistema di information retrieval standard (motore di ricerca) che permetta all'utente di digitare alcune parole nella propria lingua e ottenere tutti i libri e i testi rilevanti ai fini della ricerca in tutte le lingue disponibili. Il sistema deve essere in grado di sfruttare tutte le informazioni presenti nei testi e nei cataloghi e non deve confondere l'utente proponendo traduzioni non pertinenti. Il sistema deve essere in grado di individuare i nomi propri in maniera tale da sospendere la traduzione nel caso in cui essi generino ambiguità risultando identici a nomi comuni. Dal punto di vista della infrastruttura, il sistema deve essere facilmente integrabile nei più diffusi OPAC in commercio.

Gli obiettivi saranno raggiunti eseguendo le seguenti operazioni:

  • Arricchimento della query tramite thesauri.
  • Arricchimento della query tramite espansione con corpora linguistici
  • Disambiguazione monolingue tramite identificazione delle parti del discorso / Part Of Speech tagging (POS).
  • Disambiguazione multilingue della traduzione tramite la classificazione indicata nei cataloghi.
  • Identificazione dei nomi propri.

Coordinatore del Work package:

CELI

Deliverables: (in inglese)

  • D 1.1. Configuration of CLIR (first release): M3 [confidential]
  • D 1.2. Definition of the structure and programmatic interfaces for components access: M6 [public report]
  • D 1.3. Integration of CLIR with enrichment/disambiguation/translation/identification modules: M9 [confidential]
  • D 1.4. Fully integrated CLIR system: M12 [confidential]
© 2012 CACAO Project  • Ultimo aggiornamento: 06.10.2009  • Disclaimer • Ipressum • RSS   • Suggerisci link  • Stampa questa pagina