Solr – Die leistungsstarke Enterprise Suche für Ihre Website

Für TYPO3 und alle anderen Websites, die mit ihrer Suche überzeugen wollen

Die Suche auf einer Website ist besonders wichtig, wenn die Website viele Informationen beinhaltet, die in einem verschachtelten Menü aus Seiten, Unterseiten und Blogbeiträgen mit Texten, Grafiken und Dokumenten geordnet sind. Dabei sind Besucher und Besucherinnen durch Suchmaschinen wie Google gewohnt, blitzschnell perfekte Suchergebnisse zu erhalten – Solr ist eine Search Engine für Websites, die schnell passende Ergebnisse liefert und vielerlei Funktionen in Google-Manier beinhaltet. Und das ist nicht selbstverständlich, denn die Suchfunktion von Websites ist oft wenig hilfreich, ungenau und liefert mitunter keine oder keine passenden Ergebnisse. Das kann für Benutzer und Benutzerinnen sehr frustrierend sein und hat mit Usability wenig zu tun. Im schlimmsten Fall vertreibt man so Kundschaft.

Wenn Sie auf Ihrer (TYPO3) Website eine Suchfunktion anbieten möchten, können Sie auf die bewährte Apache Solr Suchlösung setzen und wir übernehmen die technische Umsetzung für Sie – Sprechen Sie uns einfach an!

Was kann Apache Solr?

Apache Solr ist eine Open Source Software der Apache Software Foundation. Die in Java geschriebene Suchlösung läuft außerhalb der Websites, die sie nutzen, auf einem eigenen Server wie Tomcat oder Jetty. Bei TYPO3 kommuniziert die Instanz über Extensions mit dem Suchmaschinenserver und liefert schnell hochwertige Suchergebnisse.

Solr basiert auf der Lucene Technologie. Die ebenfalls freie Open Source Software Lucene ist eine Software-Bibliothek für Volltextsuche, die in Java geschrieben wurde. Eine Bibliothek fungiert als Archiv für Unterprogramme oder Hilfsmodule, die über Schnittstellen genutzt werden können. Lucene erstellt einen Index aus Dateien und eine geordnete Liste aus Suchergebnissen. Solr beruht auf eben dieser Technologie, ist jedoch eine eigenständige Serverversion von Lucene mit weiteren Funktionen. Solr hat REST-ähnliche Schnittstellen, kommuniziert über HTTP/XML und kann verschiedenste Datenformate erfassen.

So lassen sich mit Solr ansprechende Suchlösungen kreieren, die z. B. in Content Management Systemen wie TYPO3 oder WordPress genutzt werden können. Wir nutzen eine passgenaue Solr Lösung für TYPO3 und können die Suchmaschine ebenfalls in andere CMS und Websites integrieren, wo die Search Engine ist ebenso leistungsfähig und schnell ist. Die Funktionen von Apache Solr sind vielfältig und können den individuellen Bedürfnissen angepasst werden – werfen wir einen kleinen Blick auf die zahlreichen Features, die Solr leisten kann.

Neben den offensichtlichen Vorteilen, die Solr für die Suchenden hat, ist die Suchmaschine auch aus technischer Sicht eine beeindruckende Lösung, die u. A. konfigurierbare und erweiterbare Textanalyse und Cachingfunktionen anbietet. Es gibt eine Verwaltungsoberfläche für Nutzer und Nutzerinnen, Logs, die eingesehen werden können u. v. m. Lesen Sie im nächsten Abschnitt weitere Highlights, die Apache Solr zu bieten hat.

Highlights

Leistungsfähig & Schnell

Solr ist dazu in der Lage, tausende Seiten in Millisekunden zu durchsuchen und passende Ergebnisse zu liefern. Denn Solr nutzt im Gegensatz zur Indexed Search die sogenannte Index-Queue, die die Änderungen schon im Backend beobachtet und nicht auf die aktualisierte Version im Frontend wartet, wodurch eine zeitnahe Indizierung möglich ist. Weiterhin sind große Datenmengen und hohes Traffic-Aufkommen kein Problem für Solr. Um Datenverluste zu vermeiden, werden Transaktionslogs genutzt und um auch bei vielen Suchanfragen gleichzeitig leistungsfähig und schnell zu bleiben, setzt Solr auf Load Balancing. Ohne Frage ist die Apache Solr Search Engine somit besonders für große, umfangreiche Enterprise Websites geeignet, die auch mal bei einem großen Verkehrsaufkommen stabil performen müssen.

Skalierbar

Ein großer Vorteil von Solr zeigt sich in der herausragenden Skalierbarkeit. So kann die Rechenleistung problemlos angepasst werden, während Solr für eine gleichmäßige Verteilung des Netzwerkverkehrs sorgt. Verteilte Systeme lassen sich mit Solr fehlertolerant betreiben und bei Erweiterung der Kapazitäten muss der Inhalt nicht von vorn indiziert werden. Über eine Nutzeroberfläche lässt sich der Überblick über die Architektur behalten. Die Suchlösung von Solr ist modular aufgebaut und lässt sich nahezu durch unendlich viele Server erweitern, womit die Search Engine steigenden Anforderungen an die Suchkapazität mühelos gerecht werden kann. Die flexiblen Einsatzmöglichkeiten machen Solr zu einer perfekten Suchlösung für wachsende Projekte oder Big Data.

Suche für verschiedene Quellen & Formate

Solr kann verschiedenste Formate und Datenquellen durchsuchen und indizieren und so wirklich alle potenziell relevanten Treffer für den Suchenden auflisten. Das hilft beim Aufbrechen von Datengrenzen und beim Kombinieren und Koordinieren von Informationen, wodurch großer Mehrwert entstehen kann. Dateiformate und Quellen für die Solr-Suche können z. B. sein:

  • Webseiten aller Art (normale Seiten, Blogartikel, Produktseiten usw.)
  • Dokumente/Binärdaten (PDFs, PowerPoint, Word, Excel – durch Apache Tika extrahiert)
  • Grafiken (JPEG, PNG usw.)
  • Geodaten
  • Datenbanken

FAQ

Was ist eine Suchmaschine?

Eine Suchmaschine oder engl. Search Engine ist ein Programm oder eine Anwendung, mit der Inhalte aller Art nach einem bestimmten Suchbegriff durchsucht werden. Nach der Suchanfrage werden die Suchergebnisse zumeist in einer Liste aus Verweisen präsentiert. Suchmaschinen gibt es online, die im Browser als eigenständige Website aufgerufen werden können, z. B. Google, DuckDuckGo, Ecosia, in Websites integriert sowie lokal in Programmen oder anderen Offline-Anwendungen.

Die drei wesentlichen Aufgaben einer Suchmaschine sind:

  • Durchsuchen & Indizieren von Inhalten sowie Indexpflege (im Web mit Hilfe von Crawlern)
  • Suchanfragen verarbeiten & Treffer durch einen bestimmten Suchalgorithmus finden
  • Ergebnisse für den Suchenden aufbereiten & darstellen

Was ist eine Volltextsuche?

Eine Volltextsuche berücksichtigt den vollständigen Suchbegriff, ohne dass nur Ergebnisse für einzelne Wörter oder Wortgruppen in der Sucheingabe gelistet werden, es werden zudem alle vorhandenen Inhalte auf der Suche nach Treffern analysiert. Im Gegensatz dazu analysiert die Metasuche nur Metadaten von Dokumenten, was bei gut gepflegten Metadaten genügend Informationen über Inhalte liefern kann und durch die geringere Textgröße ist die Metasuche schneller. Für einen Geschwindigkeitsvorteil nutzen viele Volltextsuchmaschinen einen Index.

Wie funktionieren indexbasierte Suchmaschinen?

Indexbasierte Suchmaschinen bilden die größte Gruppe der Suchmaschinen im Internet, dazu gehören z. B. Google und Bing. Bei diesen Suchmaschine durchsuchen Programme, die Crawler, fortlaufend Webseiten auf ihre Inhalte und erstellen einen Index, der eine Art Inhaltsverzeichnis für Inhalte im Internet ist und mit dem die Suchmaschinen meistens in Millisekunden-Schnelle Suchergebnisse liefern können.

Kontaktieren Sie uns

Auch Sie würden gerne die schnelle und leistungsfähige Solr Suchlösung für Ihren Web-Auftritt nutzen? – Wir helfen Ihnen bei der Umsetzung und Implementierung der Suche auf Ihrer Website. Kontaktieren Sie uns einfach unverbindlich für ein Angebot!