Mehrsprachiger Zugang (WP1)
Ziel dieses Arbeitspakets ist es, ein gängiges Information-Retrieval-System (Suchmaschine) so zu konfigurieren, dass der Benutzer eine Suchanfrage in einer Sprache stellt und alle der Anfrage entsprechenden Bücher oder Texte in allen verfügbaren Sprachen als Ergebnis angezeigt bekommt. Dafür muss das System in der Lage sein, alle relevanten Informationen des Katalogs oder (sofern zugänglich) der Texte selbst auszunutzen, ohne dabei den Benutzer mit irrelevanten Übersetzungen zu verwirren. Das System muss Eigennamen erkennen, um überflüssige Übersetzungen zu vermeiden, wenn diese mit einem allgemeinen Nomen übereinstimmen.
Hinsichtlich der Infrastruktur muss das System eine einfache Integration verschiedener kommerzieller OPACs erlauben.
Die Aufgaben beinhalten im Einzelnen:
- Anreicherung der Anfrage über Thesauri.
- Anreicherung der Anfrage über korpusbaisierte Erweiterung.
- Monolinguale Wortarten-Disambiguierung.
- Disambiguierung der Übersetzung mithilfe Katalog-Klassifizierungen.
- Eigennamenerkennung.
Verantwortlich für das Arbeitspaket:
Deliverables: (auf Englisch)
- D 1.1. Configuration of CLIR (first release): M3 [confidential]
- D 1.2. Definition of the structure and programmatic interfaces for components access: M6 [public report]
- D 1.3. Integration of CLIR with enrichment/disambiguation/translation/identification modules: M9 [confidential]
- D 1.4. Fully integrated CLIR system: M12 [confidential]



