Wie du in Data Science dank KI erfolgreich wirst

Pia Heßler 21.12.2023

Wir zeigen dir, wie du durch KI ohne langjährige Coding-Erfahrung zum professionellen Data Scientist wirst

Du betreibst eine Webseite und möchtest tiefer in die Analytics-Welt eintauchen? Du sammelst Daten wie Hänsel und Gretel ihre Brotkrümel im Wald? Wir zeigen dir, dass du kein*e Informatiker*in sein musst, um in der Data Science durchzustarten. Die Wunderwaffe lautet KI. Wie das genau aussieht und warum du nicht darauf verzichten solltest, erfährst du in diesem Artikel. 

Was ist Data Science? 

„Data“ steht für Daten und „Science“ für Wissenschaft. Es geht also um Datenwissenschaft – so weit, so gut. Aber was genau steckt dahinter? Data Science steht für die Gewinnung neuer Informationen aus großen Datenmengen (sogenannte „Big Data“). Der Weg dorthin führt über Mathematik, Statistik und Informatik. Klingt total öde? Keine Sorge. Falls dies der Fall ist, können wir Entwarnung geben: Glücklicherweise gibt es eine Möglichkeit, ganz ohne diesen trockenen Background von Data Science zu profitieren: mit künstlicher Intelligenz im Bereich Data Science.

So unterstützt dich KI in Data Science

Bei der klassischen Webanalyse trackst du als Webseitenbetreiber*in die Daten für deine wichtigsten KPIs (Key Performance Indicators). Das können Kennzahlen wie die Unique Visitors (Besucher*innen), die Bounce Rates (Absprungraten) und die Time-on-Site (Verweildauer) sein. 

Sobald du aber tiefer gehen möchtest, musst du technisch entsprechend ausgestattet sein (z. B. mit einer Statistik-Software) und wirklich etwas auf dem Kasten haben: Du solltest die Programmiersprachen beherrschen und ein Grundverständnis für Clustering & Co. mitbringen und natürlich die Zeit sowie Nerven aufbringen, riesige Datenmengen zu durchforsten.

KI in Data Science kann die geballte Komplexität nicht nur für dich in eine einfache und benutzerfreundliche Oberfläche verwandeln, sondern an der Grenze deiner menschlichen Analysefähigkeiten noch eine Schippe drauflegen. Sie kann sämtliche Kombinationen überprüfen, die z. B. all deine Kanäle, Webseiten, Kampagnen und Endgeräte einbeziehen. Mit ihrer Hilfe identifizierst du in kurzer Zeit Muster, Trends, Anomalien und Zusammenhänge.

Um die Komplexität von Data Science zu umgehen, kannst du deine tiefgehenden Advanced Analytics mit Large Language Models (LLMs) wie ChatGPT durchführen. Per Sprachbefehl (Prompt) erteilst du der KI eine Anweisung, und sie liefert dir schnelle Ergebnisse. 

Das solltest du bei der Umsetzung von KI in Data Science beachten 

Ist es in der Praxis wirklich so einfach? Schauen wir uns das am Beispiel ChatGPT an. Mit diesem Befehl bitten wir ChatGPT um eine Analyse, die Trends und Anomalien aufzeigen soll:

ChatGPT-Prompt.png

Und schon kommt eine Antwort, mit der wir arbeiten können:

KI_Analyse_Chatgpt.png

Das ist wirklich für alle umsetzbar. Eine klassische Cluster-Analyse erfordert (inklusive Briefing, Datenabzug, -aufbereitung und -analyse sowie der Ergebnisaufbereitung) etwa einen Zeitaufwand von elf Stunden. Unabhängig davon, ob du sie selbst durchführst oder Externe damit beauftragst, kann eine nicht unerhebliche Summe zusammenkommen. Dabei muss der reibungslose Datenfluss stets gewährleistet sein. Auf den ersten Blick scheint ChatGPT die effizientere Wahl zu sein. Ein paar Punkte solltest du bei der Nutzung von KI in Data Science dennoch beachten.

  • Datenqualität: Ist der Input Murks, so kann auch der Output nicht besser werden. Eine hohe Datenqualität ist daher der ausschlaggebende Punkt für deine Analyse.
  • Vollständigkeit: Die größte Herausforderung liegt in der Vermeidung von Datenverlusten und -verzerrungen. Diese entstehen unter anderem durch Consent und Tracking-Schutzmaßnahmen wie Blocking.
  • Genauigkeit: KI liefert inzwischen relativ gute und strukturierte Ergebnisse. Der Schein der hohen Datenqualität kann allerdings trügen. Leider sind die Inhalte häufig trivial und oberflächlich – ganz zu schweigen von fehlenden firmenspezifischen Besonderheiten.
  • Kapazitäten: Du kannst nicht unbegrenzt Uploads durchführen. Das schränkt deine Datenmenge und somit die Aussagekraft deiner Auswertungen ein. Aktuell beträgt die Upload-Kapazität 50 MB mit Advanced Analytics.
  • Datenhoheit und Datenschutz: Der Umgang mit sensiblen Daten wird insbesondere über die DSGVO (Datenschutzgrundverordnung) und das TTDSG (Telekommunikation-Telemedien-Datenschutz-Gesetz) geregelt. Wenn du KI-Tools nutzt, muss der Schutz der Daten gewährleistet sein.
  • Fachliche Kompetenz: Eine künstliche Intelligenz kann nur Menschen unterstützen, die kompetent genug sind, um die Ergebnisse zu überprüfen.

Diese Software hilft dir beim Einsatz von KI in Data Science 

Es gibt eine Alternative, mit der du die zuvor genannten Herausforderungen in puncto Datensicherheit, Upload-Begrenzung und Datenqualität wunderbar umgehst. Dafür setzt du entweder neben dem AI-Tool eine weitere Software ein oder du arbeitest direkt in einem Tool mit integrierten KI-Funktionen.

Du kannst dir einfach von einer KI (z. B. ChatGPT) ein Analyse-Skript erstellen lassen. Dann überträgst du damit die Rohdaten automatisch (täglich wiederholend) in eine zweidimensionale Datenstruktur wie „pandas.DataFrame“. Dein Prompt würde in diesem Fall lauten: „Ich benötige ein Python-Script, das …“ Diese Methode eignet sich unter anderem für die Visualisierung, Wahrscheinlichkeitsberechnung und Zeitreihen-Analyse.

Für aussagekräftige Zahlen benötigst du viele Daten. Diese Daten sollten cookie- und consent-unabhängig sein. An diese gelangst du am besten ohne fragwürdige Tricksereien bei der Gestaltung deiner Cookies. Immer mehr Analytics- und BI-Lösungen (Business Intelligence) enthalten KI-Funktionen (z. B. Tableau), die dir eine Datenbasis liefern. Einige KI-Apps wurden speziell für Analytics entwickelt (z. B. Rows). 

Mit All-in-one-Lösungen wie etracker vermeidest du die Einwilligungspflicht und das Tracking Blocking. So kannst du vollkommen legal sämtliche Daten deiner Nutzer*innen erfassen und dich auf die bestmögliche Datenqualität verlassen. Selbst die neuen Consent Modes (Basic und Advanced) von Google Analytics erfordern dagegen eine Einwilligung. Welche gewaltige Auswirkung das auf deine Ergebnisse hat, siehst du anhand dieses Beispiels:

Data Science KI Datenbasis.png

Wie sehen konkrete Abfragen aus?

Mit Softwares kannst du sowohl einfache als auch komplexe Abfragen durchführen. Eine Standardabfrage könnte deine Sessions mit Bestellungen betreffen:

Beispiel Prompt Session mit Bestellungen.png

Aber auch komplexe Zusammenhänge wie die Gründe für die Interaktion deiner Follower auf deinen Social-Media-Kanälen lassen sich mit Software ermitteln: 

Beispiel Prompt Causal Discovery und Clustering.png

Welche Anforderungen soll eine Software für KI in Data Science erfüllen?

Deine Software sollte diese vier entscheidenden Fragen beantworten:

  1. Wie sicherst du deine Datenbasis nachhaltig trotz Ad- und Tracking-Blocker ohne Einwilligung und Cookies?
  2. Wie kommst du mit deinen Rohdaten zu einer 360-Grad-Ansicht?
  3. Woher bekommst du diese wertvollen Daten automatisiert in deine bestehende Systemlandschaft (z. B. für die Durchführung personalisierter Kampagnen)?
  4. Wie müssen Prompts aussehen, damit sie gute Ergebnisse liefern?

Die größten Vorteile mit etracker als KI-Tool in Data Science

  • All-In-One: ein Tool für die gesamte Steuerung deiner Web-, App- und Marketing-Aktivitäten
  • Interaktives Dashboard: die wichtigsten Informationen am PC, Tablet oder Smartphone abrufen
  • Verständliche Reports mit Daten-Visualisierungen: Basis-Reports (Merkmale der Webseitenbesucher*innen und Erfolg der Inhalte), Marketing-Reports (Kampagnen-Erfolg), E-Commerce-Reports (Optimierungspotenziale) und E-Mail-Reportings (automatisierte Reports)
  • Präzision: Detailanalyse deiner Webseite
  • UX-Analyse: detaillierte Auskunft zur Verweildauer deiner Besucher*innen
  • Tag und Consent Management: integrierter Tag und Consent Manager, zusätzliche Anbindungsmöglichkeit an alle gängigen Consent Manager (CMPs)
  • Privacy First App Analytics: Consent-freies und DSGVO-konformes Tracking
  • Rohdatenexporte: (automatisierte) Rohdatenexporte aus BI-Systemen
  • Connectivity: anonymisierte und serverseitige Weiterleitung an deine Marketing-Plattformen
  • Dynamische Segmentierung: mit Drill-Down-Funktion und Segment-Vergleichen
  • Kontrolle: Mandanten- und Nutzerverwaltung

Falls du noch weitere Hintergrundinformationen über das Analysetool erfahren möchtest, sieh dir gerne das folgende YouTube-Video an, in dem eine Livedemo von etracker gezeigt wird.

Fazit: Die besten Daten schnappst du dir mit etracker

Data Science ist ein anspruchsvolles Thema. Dennoch ermöglicht dir etracker, wenn du ein wenig technikaffin bist, mit künstlicher Intelligenz deine Data Science zu perfektionieren. Mit dem Werkzeug für datenschutzfreundliches, client- und serverseitiges Tracking gelangst du zu den hochwertigsten und umfangreichsten Daten. Alles, was du jetzt noch brauchst, ist ein gewisses Grundverständnis an Data Management, Advanced Analytics und der Formulierung von Prompts.

Pia Heßler
Autor*In
Pia Heßler

Pia war mehr als 10 Jahre im Vertrieb und Marketing verschiedenster Unternehmen aktiv. Danach gründete sie ihr eigenes Unternehmen und betreibt dieses zusammen mit ihrer Geschäftspartnerin.

Alle Artikel von Pia Heßler

Im Artikel erwähnte Softwares

Im Artikel erwähnte Software-Kategorien

Ähnliche Artikel

Komm in die OMR Reviews Community & verpasse keine Neuigkeiten & Aktionen rund um die Software-Landschaft mehr.