Accesso multilingue (WP1)
Lo scopo di questo work package è la configurazione di un sistema di information retrieval standard (motore di ricerca) che permetta all'utente di digitare alcune parole nella propria lingua e ottenere tutti i libri e i testi rilevanti ai fini della ricerca in tutte le lingue disponibili. Il sistema deve essere in grado di sfruttare tutte le informazioni presenti nei testi e nei cataloghi e non deve confondere l'utente proponendo traduzioni non pertinenti. Il sistema deve essere in grado di individuare i nomi propri in maniera tale da sospendere la traduzione nel caso in cui essi generino ambiguità risultando identici a nomi comuni. Dal punto di vista della infrastruttura, il sistema deve essere facilmente integrabile nei più diffusi OPAC in commercio.
Gli obiettivi saranno raggiunti eseguendo le seguenti operazioni:
- Arricchimento della query tramite thesauri.
- Arricchimento della query tramite espansione con corpora linguistici
- Disambiguazione monolingue tramite identificazione delle parti del discorso / Part Of Speech tagging (POS).
- Disambiguazione multilingue della traduzione tramite la classificazione indicata nei cataloghi.
- Identificazione dei nomi propri.
Coordinatore del Work package:
Deliverables: (in inglese)
- D 1.1. Configuration of CLIR (first release): M3 [confidential]
- D 1.2. Definition of the structure and programmatic interfaces for components access: M6 [public report]
- D 1.3. Integration of CLIR with enrichment/disambiguation/translation/identification modules: M9 [confidential]
- D 1.4. Fully integrated CLIR system: M12 [confidential]



