CACAO Project CROSS-LANGUAGE ACCESS TO CATALOGUES AND ON-LINE LIBRARIESeurope
  • Kontakt | 
  • Suche | 
  • Seitenübersicht
en | de | fr | hu | it | pl | 
  • Startseite
  • Partner
  • Projektübersicht
  • Nachrichten und Termine
  • Demo
  • Startseite
  • Partner
  • Projektübersicht
    • Projektbeschreibung
    • Arbeitspakete
      • Mehrsprachiger Zugang (WP1)
      • Mehrsprachige Ressourcen (WP2)
      • Infrastruktur (WP3)
      • Benutzerzugang (WP4)
      • Aggregation (WP5)
      • Evaluation und Bewertung (WP6)
      • Geschäftstätigkeit (WP7)
      • Verbreitung und Bewusstseinsbildung (WP8)
    • Ergebnisse
  • Nachrichten und Termine
  • Demo

CACAO ist ein 24 monatiges Projekt unterstützt vom eContentplus Programm der Europäischen Kommission.

  • CACAO Project » 
  • Projektübersicht » 
  • Arbeitspakete » 
  • Mehrsprachiger Zugang (WP1)

Mehrsprachiger Zugang (WP1)

Ziel dieses Arbeitspakets ist es, ein gängiges Information-Retrieval-System (Suchmaschine) so zu konfigurieren, dass der Benutzer eine Suchanfrage in einer Sprache stellt und alle der Anfrage entsprechenden Bücher oder Texte in allen verfügbaren Sprachen als Ergebnis angezeigt bekommt. Dafür muss das System in der Lage sein, alle relevanten Informationen des Katalogs oder (sofern zugänglich) der Texte selbst auszunutzen, ohne dabei den Benutzer mit irrelevanten Übersetzungen zu verwirren. Das System muss Eigennamen erkennen, um überflüssige Übersetzungen zu vermeiden, wenn diese mit einem allgemeinen Nomen übereinstimmen.

Hinsichtlich der Infrastruktur muss das System eine einfache Integration verschiedener kommerzieller OPACs erlauben.

Die Aufgaben beinhalten im Einzelnen:

  • Anreicherung der Anfrage über Thesauri.
  • Anreicherung der Anfrage über korpusbaisierte Erweiterung.
  • Monolinguale Wortarten-Disambiguierung.
  • Disambiguierung der Übersetzung mithilfe Katalog-Klassifizierungen.
  • Eigennamenerkennung.

Verantwortlich für das Arbeitspaket:

CELI

Deliverables: (auf Englisch)

  • D 1.1. Configuration of CLIR (first release): M3 [confidential]
  • D 1.2. Definition of the structure and programmatic interfaces for components access: M6 [public report]
  • D 1.3. Integration of CLIR with enrichment/disambiguation/translation/identification modules: M9 [confidential]
  • D 1.4. Fully integrated CLIR system: M12 [confidential]
© 2012 CACAO Project  • Seite aktualisiert: 06.10.2009  • Disclaimer • Impressum • RSS   • Weitererzählen  • Diese Seite drucken