Kapitel 4: Suchmaschinen, Modellierung für Meta-Suche
In diesem Kapitel werden wir zunächst den Suchindex Apache Solr installieren und kennenlernen. Solr ist eine weit verbreite Software für Volltextsuchmaschinen und quasi Industriestandard, also nichts bibliotheksspezifisches.
Nachdem wir uns mit Solr vertraut gemacht haben, laden wir die Testdaten aus dem vorigen Kapitel als TSV in den Solr-Index. Solr versucht dabei automatisch ein Schema zu bilden, anhand derer die Daten suchbar gemacht werden. Dieses Schema werden wir kontrollieren und so anpassen, dass es für eine Meta-Suche geeignet sind.
Abschließend werden wir weitere Daten mit OpenRefine gemäß des Schemas transformieren und ebenfalls in den Solr-Index laden. So erhalten wir eine Suchmaschine zur Meta-Suche über mehrere Datenquellen.
Bitte nehmen Sie sich für die folgenden Abschnitte insgesamt etwa 8 Stunden Zeit:
- 4.1 Installation von Solr
- 4.2 Tutorial zu Solr
- 4.3 Daten in Solr laden
- 4.4 Konfiguration des Schemas
- 4.5 Weitere Daten indexieren
Beiträge in den Lerntagebüchern der Studierenden:
- Elena Capelli: Solr, warum es mehr ist, als eine fahlschgeschriebene Sonne… und Wir bauen einen Bibliothekskatalog – Teil 3
- Marina Hess: Solr - Unser Suchindex
- Franziska Neuenschwander: Modellierung für Meta-Suche mit Apache Solr
- Moreno Pontoriero: O Solr mio
- Aline Strauss: Suchmaschinen, Modellierung für Meta-Suche 16/11/2017