Többnyelvû hozzáférés (WP1)
Ennek a munkacsomagnak a célja egy olyan standard információvisszakereső rendszer (keresőmotor) létrehozása, amely lehetővé teszi, hogy a felhasználó anyanyelvű lekérdezésére az összes releváns és rendelkezésre álló dokumentum (könyvek, szövegek) találatként megjelenjen, függetlenül a találati dokumentumok nyelvétől. Cél, hogy a rendszer a szövegekben és katalógusokban minden elérhető információhoz hozzáférjen. Fontos továbbá, hogy az oda nem illő fordításokkal ne zavarja össze a felhasználót, így például képes legyen a tulajdonnevek felismerésére és a fordítási folyamat megszakítására, ha a szóban forgó tulajdonnév köznévként is értelmes. Infrastrukturális szempontból fontos, hogy a rendszer könnyen integrálható legyen számos, már forgalomban lévő OPAC-kal (számítógépes katalógussal).
A fenti célokat az alábbi lépések megvalósításával érjük el:
- A keresőkifejezések kibővítése thesaurusok segítségével.
- A keresőkifejezések korpusz-alapú kibővítése.
- Egynyelvű szófaji egyértelműsítés.
- Nyelvek közötti fordítási egyértelműsítés katalógusosztályozás segítségével.
- Tulajdonnév felismerés.
A munkacsomagot vezeti:
Dokumentumok: (angolul)
- D 1.1. Configuration of CLIR (first release): M3
- D 1.2. Definition of the structure and programmatic interfaces for components access: M6
- D 1.3. Integration of CLIR with enrichment/disambiguation/translation/identification modules: M9
- D 1.4. Fully integrated CLIR system: M12
- D 1.1. Configuration of CLIR (first release): M3 [confidential]
- D 1.2. Definition of the structure and programmatic interfaces for components access: M6 [public report]
- D 1.3. Integration of CLIR with enrichment/disambiguation/translation/identification modules: M9 [confidential]
- D 1.4. Fully integrated CLIR system: M12 [confidential]



