Sprecht Ihr schon fließend RegEx?
Wir zeigen Euch, wieso sich das Lernen der sogenannten regulären Ausdrücke für Online-Marketer und SEOs lohnt
- Was sind RegEx und welche Vorteile haben sie für Euer SEO?
- Wie sieht eine RegEx-Syntax aus?
- Hilfreiche RegEx-SEO-Use-Cases
- Welche RegEx-Testing-Tools könnt Ihr nutzen?
- Fazit zu RegEx
Ihr habt keine Lust, mehr Zeit mit der Datensammlung und -bearbeitung zu verbringen als unbedingt notwendig? In diesem Artikel erfahrt Ihr, wieso und vor allem wie Ihr als SEO-Einsteiger*innen und SEO-Fortgeschrittene mit Regular-Expressions (RegEx) effizienter arbeiten könnt.
Was sind RegEx und welche Vorteile haben sie für Euer SEO?
RegEx könnt Ihr Euch wie eine Art Filter-Funktion vorstellen – nur besser. RegEx sind reguläre Ausdrücke, die Bedingungen beinhalten. Diese geben an, nach welchen Kriterien Daten geprüft werden. Treffen die Bedingungen zu, landen die Datensätze in Eurer Auswertung. Andernfalls werden sie nicht übernommen.
Ihren Ursprung haben die regulären Ausdrücke in der Informatik. Sie kommen aber nicht nur in Programmier-Sprachen wie JavaScript und Python zum Einsatz, sondern auch in Bereichen, die man schon eher mit Online Marketing verbindet. Vielleicht fragt Ihr Euch jetzt: „Warum sollte ich nicht einfach die Filter-Funktionen von Excel und Word anwenden?“ Die kurze Antwort lautet: RegEx kann einfach mehr. Mit Platzhaltern und Modifikatoren könnt Ihr Suchanfragen viel präziser formulieren, als es MS-Office-Anwendungen und die besten SEO-Tools können.
Mittlerweile haben viele Online-Marketer und SEOs den Nutzen der regulären Ausdrücke für ihre Suchmaschinen-Optimierung erkannt. Typische Marketing-Anwendungsfälle sind:
- Überprüfungen von URLs mit dem gleichen Verzeichnis
- Automatische Weiterleitungen von URLs in der .htaccess, die einem bestimmten Muster folgen
- Filtern von Domains und URLs bei der Webseiten-Analyse
- Definieren von Seitentypen in A/B-Testing-Tools (Conversion-Optimierung)
RegEx könnt Ihr in vielen Programmen durchführen. Am häufigsten werden Reguläre Ausdrücke für die Suchmaschinen-Optimierung in diesen Anwendungen eingesetzt:
- Web-Analyse-Tools (z. B. Google Analytics, Google Search Console)
- SEO-Tools (z. B. Seobility, Ryte)
- Webseiten-Crawler (z. B. Screaming Frog)
- Tabellenkalkulations-Programme (z. B. Google-Sheets)
- Text-Editoren (z. B. Notepad++)
Vermutlich fragt Ihr Euch, wieso Ihr RegEx noch nie gesehen habt. Das liegt wahrscheinlich daran, dass die regulären Ausdrücke für Nutzer*innen in der Regel gar nicht sichtbar sind. Ihr habt sie aber bestimmt schon oft unwissentlich genutzt, etwa bei der Vergabe eines neuen Passworts. Softwares mit Password Policys, die Zeichenkombinationen vorgeben, basieren fast immer auf RegEx.
Empfehlenswerte SEO Tools
Weitere empfehlenswerte SEO-Tools kannst du auf OMR Reviews finden und vergleichen. Insgesamt haben wir dort über 150 SEO-Tools (Stand: Dezember 2023) gelistet, die dir dabei helfen können, deinen organischen Traffic langfristig zu steigern. Also schau vorbei und vergleiche die Softwares mithilfe der verifizierten Nutzerbewertungen:
Wie sieht eine RegEx-Syntax aus?
Eine RegEx-Syntax besteht aus Zeichen, die einzelne Funktionen beschreiben. Die Gesamtheit der Zeichen wird auch Pattern genannt. Sie überprüfen einen Text wie ein Nudelsieb. Alles, was nicht passt, wird rausgefischt.
Pattern überprüfen, ob Datensätze entsprechende Kriterien erfüllen. Sowohl positive als auch negative Matches mit Euren Pattern können mit Funktionen verknüpft sein. Häufige Funktionen sind das Suchen und Ersetzen bestimmter Zeichen.
Ihr könnt RegEx beliebig miteinander verknüpfen und so komplexe Anforderungs-Ketten bilden. Die Bindeglieder werden Operatoren genannt.
Das sind die wichtigsten Operatoren:
Das sind die wichtigsten Regulären Ausdrücke (RegEx):
Hilfreiche RegEx-SEO-Use-Cases
Ihr könnt RegEx in verschiedenen Fällen anwenden. Die häufigsten Anwendungsfälle haben wir hier für Euch aufgeführt:
1. Webseiten-Strukturen und -Hierarchien nachvollziehen
Quelle: Seobility
Mit mod_rewrite könnt Ihr eingehende URL-Anfragen auf einen bestimmten Teil Eures Web-Auftritts umleiten. Dabei wird die komplette URL mit ihren Unter-Angaben und Unter-Parametern berücksichtigt.
Das Modul ist für Euer SEO extrem wichtig, weil es komplexe URLs in sogenannte „sprechende URLs“ verwandelt. Diese helfen Nutzer*innen und Suchmaschinen, die Struktur und Hierarchie Eurer Webseite zu verstehen.
Hinterlegt dafür diese Regel in der .htaccess-Datei Eures Web-Servers:
RewriteEngine on
RewriteRule (.*)\.html$ /cgi-bin/script.pl?var=$1
2. In Google Analytics filtern
Mit den einfachen Filter-Funktionen in Google Analytics könnt Ihr Euch einzelne Seiten Eures Reports anzeigen lassen – mit RegEx gleich mehrere Seiten gleichzeitig. Ihr könnt beliebige Seiten filtern, die keine gleichen Merkmale (z. B. Seitenpfad) aufweisen.
Durch einen Hostname-Filter können Euch RegEx vor Spam schützen. Ihr könnt Daten-Ansichten filtern, z. B. Webseiten, die auf mehrere Domains verweisen. Dieser Filter lässt alle Hostnames zu, die einen bestimmten Domain-Namen beinhalten:
.*domain\..*
3. 301-Weiterleitungen mit der .htaccess
Quelle: SEO-Summary.de
Wenn Ihr einen Relaunch durchgeführt habt, könnt Ihr mit RegEx komplexe URLs auf Eure neue URL umleiten:
Redirect 301 ^/jobs/?$ www.domain.de/karriere/
4. Keywords mit niedrigen Klickraten herausfiltern
Quelle: Sistrix
SEO-Tools wie Semrush und Sistrix haben den Vorteil, Euch in Sekundenschnelle mit relevanten Daten zu überschütten. Damit die vielen Daten Nutzer*innen nicht überfordern, bieten SEO-Tools bereits einfache Filter-Funktionen wie „Enthält“ oder „Beginnt mit“ an.
Mit RegEx könnt Ihr Eure Keyword-Recherche-Analyse weiter verfeinern: Wenn Ihr beispielsweise Keyword-Daten von eher unbekannten Marken analysiert, erhaltet Ihr häufig Suchanfragen mit Markennamen. Diese solltet Ihr aussortieren, da die Klickraten eher niedrig ausfallen.
Ein anderer typischer Anfänger-Anwendungsfall ist die Berücksichtigung der üblichen Schreibfehler. Am Beispiel von Edeka könnt Ihr diese RegEx anwenden:
(edeka|edekaa|edeek|edekka)
5. Daten aus gecrawlten Webseiten filtern
Crawler wie der Screaming Frog sind für Eure Suchmaschinen-Optimierung besonders hilfreich. Ihr könnt u. a. Seitentitel, Überschriften und strukturierte Daten aus dem Quelltext extrahieren.
Um noch mehr Informationen zu sammeln, könnt Ihr beim Filtern und Extrahieren der Daten aus den gecrawlten Webseiten RegEx anwenden. So könnt Ihr etwa zählen, wie oft ein bestimmter Ausdruck vorkommt und das Ergebnis mit der Extraktionsfunktion herausfiltern. Beispiele für einen sinnvollen RegEx-Einsatz sind:
- Mit ["'](UA-.*?)["'] Google Analytics ID herausfiltern
- Mit "ratingValue": "(.*?)" Schema.org-Bewertungswert aus JSON-LD herausfiltern
- Mit ["']datePublished["']: *["'](.*?)["'] Schema.org-Publikationsdatum aus JSON-LD herausfiltern
- Mit [a-zA-Z0-9-_.]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+ E-Mail-Adressen herausfiltern
- Mit ["'](GTM-.*?)["'] Google Tag-Manager-ID herausfiltern
6. Seitentitel suchen
RegEx können Euch auch helfen, Seitentitel zu finden. Wenn Ihr beispielsweise Ratgeber-Artikel analysieren möchtet, könnt Ihr nach Seitentiteln suchen, die mit einer Zahl beginnen und Begriffe wie „Tipps“, „How-to“ oder „Tutorial“ beinhalten. Wendet dafür diesen regulären Ausdruck an:
^[0-9].*(tipps|tutorial|how to)
Welche RegEx-Testing-Tools könnt Ihr nutzen?
RegEx anzuwenden ist leichter als es auf den ersten Blick aussehen mag – vorausgesetzt, Ihr habt ein technisches Verständnis und setzt Euch ein wenig mit der Materie auseinander. Für die Einarbeitung empfehlen wir Euch, RegEx-Testing-Tools zu nutzen. Sie warnen Euch, wenn sich Fehler in Eure Regeln einschleichen oder Ihr zu viele Daten herausfiltert bzw. ersetzt. Nutzer*innen haben RegEx-Testing-Tools für Euch bewertet. Ihre Vor- und Nachteile findet Ihr auf OMR Reviews.
Diese RegEx-Testing-Tools sind bei Nutzer*innen besonders beliebt:
- Regular expressions 101
- regexr
- RegEx Tester
- CyrilEx Regex Tester
- Freeformatter
- Site24x7 Regex Tester
- Java in use Online Regex Tester
- DebuggexBeta
- RegexPlanet
- Coding.Tools Regex Tester
Im Netz findet Ihr außerdem einige Videos, die Euch die RegEx-Grundlagen vermitteln. Folgende RegEx-Tutorials sind für den Einstieg in die Welt der regulären Ausdrücke besonders beliebt:
- Programmieren Lernen #71 - RegEx
- RegEx - Schnelleinstieg
- Lerne reguläre Ausdrücke (regular expressions) in 10 Minuten!
- Python Tutorial #41 - Regex
- Einführung in die Regulären Ausdrücke
- Reguläre Ausdrücke (Regex) mit regex101.com
Fazit zu RegEx
Reguläre Ausdrücke (RegEx) zu lernen ist wie das Erlernen einer neuen Fremdsprache. Auf den ersten Blick können sie auf Marketer und SEOs total befremdlich wirken, doch wer genau hinschaut, erkennt, dass sich die Vokabelliste in Grenzen hält. Ob Zahlenmensch oder nicht: Sich in Reguläre Ausdrücke (RegEx) einzuarbeiten, ist definitiv für jede*n von Euch machbar.