Unter dem Motto "Information und Wissen: global, sozial und frei?" fand die ISI 2011 vom 9. bis 11. März 2011 an der Universität Hildesheim statt. Eurospider besuchte den zweiten Konferenztag. Hier finden Sie kommentierte Aufzeichnungen der einzelnen Referate des Information Retrieval Track.

Referent: Philipp Schaer
Abstract: Philipp Schaer vom Leibniz Institut GESIS präsentiert die Unterstützung des Retrieval Prozesses mit alternativen Suchtermen, mit der Berücksichtigung von Autorennetzwerken und der Einteilung in Kernzeitschriften, verwandten Zeitschriften und restlichen Zeitschriften (Gesetzes von Bradford). Die Experimente mit knapp 370'000 Termen und nur 10 Testanfragen haben gezeigt, dass diese drei unterstützende Services weitgehend unabhängig sind und somit gut kombiniert werden können. Der Ansatz ist vielversprechend, die erzielten Effektivitätswerte (noch) nicht. Es ist unklar, ob die Daten besser erschlossen, Gewichtungen verbessert oder geeignetere Retrieval-Methoden eingesetzt werden müssen.
ISI 2011: Philipp Schaer

Referentin: Andrea Ernst-Gerlach
Abstract: Andrea Ernst-Gerlach (Uni Duisburg-Essen) zeigt eine Regelgenerierung für das Retrieval von historischen Dokumenten, welche Begriffe enthalten, die heute nicht mehr genutzt werden. Mit einem Korrekturprogramm werden historische Wortformen den modernen Formen zugeordnet und mögliche Transformationsregeln ermittelt. Mit Hilfe von Häufigkeiten werden die Regeln bewertet. Die Regeln können manuell nachgebessert werden. Die Evaluationsresultate sind ermutigend, so dass der Einsatz bei historischen Archiven denkbar ist.
[Andrea Ernst-Gerlach wünscht keine Publikation des Videos]

Referent: Daniela Becks
Abstract: Bei der Präsentation von Daniela Becks (Uni Hildesheim) geht es um Patentrecherchen. Sie verweist auf die Besonderheiten in der Patentdomäne: Verschleierungen und Verallgemeinerungen, um die Ansprüche zu maximieren. Hinzu kommen die vielen Akronyme, spezifischen Fachbegriffe und insbesondere auch die hohen Anforderungen an die Ausbeute. Evaluiert wurde mit einer grossen Testkollektion, welche automatisch generierten Relevanzurteile enthält, die auf Grund von Zitaten ermittelt wurden. Die Resultate sind nicht berauschend. Es wurden verschiedene Problembereiche identifiziert und Lösungsmöglichkeiten vorgeschlagen. Der aktuelle Stand der Technik wurde weder im Vortrag noch im Paper erläutert, obwohl es bei TREC und NTCIR schon einige Erfahrungen in dieser Disziplin gibt.
[Daniela Becks wünscht keine Publikation des Videos]