Wird Glif das "Youtube des KI-Zeitalters"?
Der Berliner Fabian Stelzer will mit namhaften US-Wagniskapitalgebern im Rücken die Entertainment-Plattform der Generation ChatGPT erschaffen.
- Eine Lösung, die ein Problem sucht
- Version 1.0 von Glif war eine Google-Tabelle
- KI-Modelle sind wie Legosteine
- Sandkasten für Workflow-Künstler*innen
- Bereits eine Viertelmillion User
- Bald startet das Bezahlmodell
- Marken als Sponsoren von KI-Workflows
- Herausforderung Content Moderation
- Design-Hustler und virtuelle Tiktok-Avatare
- Das Zeitalter der Wegwerf-Apps
- Erklärtes Ziel ist ein Börsengang
Memes, fantastische Mode, fiktive Filmplakate, Tarot-Karten, eine Action-Figur mit dem eigenen Gesicht,… Auf der Website von Glif lässt sich jede Menge sinnlos-lustiger Content erstellen – mit wenigen Klicks und ohne Ahnung, was da im Hintergrund genau passiert. Doch dort geschieht einiges. Denn das in Berlin und New York beheimatete KI-Startup sammelt mit Fun-Content gerade zwar Aufmerksamkeit. Eigentlich geht es aber um etwas viel größeres. Mit namhaften US-Investoren im Rücken will Glif die kreative Nutzung, Verknüpfung und Personalisierung von KI-Tools radikal vereinfachen. Hochkomplexe Software zu erstellen soll so simpel werden wie das Anlegen einer Smart-Home-Routine bei Amazon Alexa. OMR hat mit Glif-Gründer Fabian Stelzer darüber gesprochen, warum er generative KI als neues Medium versteht, wie sich die Rolle von Kreativen durch die Technologie verändert und womit Glif Geld verdienen will.
Es heißt: Am Beginn der erfolgreichsten Startups stand meist ein persönliches Problem. Und man könnte es problematisch nennen, wenn der Gründer einer IT-Firma, die Entertainment im Web neu definieren will, keinen Schimmer hat, wie man State-of-the-Art-Software entwickelt. "Ich kann so ein bisschen über Programmieren auf einer Party sprechen", sagt Fabian Stelzer. "Es braucht dann eine halbe Stunde, bis jemand checkt, dass ich keine Ahnung habe." Umso erstaunlicher, dass Software in seiner Karriere von Anfang an die zentrale Rolle spielt.
Eine Lösung, die ein Problem sucht
Stelzer war einer der ersten in Deutschland ausgebildeten Kognitionswissenschaftler und gründete nach dem Studium sein erstes Tech-Startup. Eine "Marketing-Machine-Learning-SaaS-Firma", wie er es nennt. Die hatte ein Tool entwickelt, das die Wirksamkeit von Anzeigenmotiven und Websites prognostiziert. Dafür trainierten Stelzer und seine Mitgründer*innen eine KI mit Eye-Tracking-Daten. Kunden konnten ihre Kampagnen checken lassen und bekamen eine Vorhersage, wohin Betrachter*innen vermutlich blicken würden.
"Eine coole wissenschaftliche Solution, die nach einem Problem sucht", nennt Stelzer den Ansatz in der Rückschau. Das Startup sei darum auch kein Homerun gewesen, eher mittelmäßig erfolgreich. Eine Einschätzung, die allerdings etwas nach Understatement klingt. Immerhin standen damals unter anderem Google, Canon, Nike und Oracle auf der Kundenliste.
Version 1.0 von Glif war eine Google-Tabelle
Nach dem Verkauf der Firma gönnte Stelzer sich dann erst einmal eine längere Elternzeit. Die nutze er, um mit den damals aufkommenden Gen-AI-Modellen herumzuspielen. Software, die auf Basis kurzer Kommandos Texte und Bilder produzieren kann, das war neu. Im Frühjahr 2020 erlangte Stelzer einen Beta-Zugang zu GPT3 von Open AI. Er experimentierte mit den Bildgeneratoren Midjourney und Stable Diffusion. Die Möglichkeiten dieser Tools hätten ihn umgehauen, sagt Stelzer. Schnell sei er dann zu dem Punkt gelangt, wo er unterschiedliche Modelle miteinander verknüpfen wollte. Doch da war sein altes Problem: Programmieren. Die Algorithmen-Class im Studium habe er gerade so bestanden, sagt Stelzer. Also sucht er nach einem Workaround.
Generative KI kann mehr als coden. Sie liefert auch Antworten auf bizarre Fragestellungen. Etwa: Wie würde Mode aussehen, wenn sich Karl Lagerfeld oder Balanciaga von Fast-Food inspirieren ließen? Screenshots: OMR
Sein Glück: Anders als er kann GPT3 coden. Also suchte Stelzer sich im Internet Skripte und API-Dokumentationen zusammen und ließ sich eine Software schreiben. Die ermöglichte es, aus einer Google-Tabelle heraus auf diverse KI-Modelle zuzugreifen. Es habe direkt beim ersten Versuch funktioniert, so Stelzer. Es wundert ihn immer noch, dass das so einfach ging. Nun konnte er in der Tabelle einen Prompt – eine Textvorlage – eintippen, der anschließend automatisch von mehren KI-Modellen bearbeitet wurde. "Ich hatte plötzlich ein Tool, mit dem man supergut kleine AI Prototypen bauen konnte"sagt Stelzer. Diese handgestrickte Google-Tabelle, die Promptchains – mehrstufige KI-Workflows – ermöglichte, sei ihm Grunde die erste Version von Glif gewesen.
KI-Modelle sind wie Legosteine
"Aus meiner Sicht sind KI-Modelle Legobausteine", sagt Stelzer. "Die interessanten Anwendungen entstehen erst, wenn man sie verknüpft." Für jemanden, der bereits eine Firma gegründet hatte, war der naheliegende Gedanke darum: Wie macht man daraus ein Business? Zusammen mit seinem Kumpel Jamie Wilkinson aus New York, dem Gründer der Webhumor-Datenbank Know Your Meme, entwickelte Stelzer dann die Idee einer Sandbox für generative KI. Also einen Ort, an dem sich alle Modelle ausprobieren und miteinander verknüpfen lassen. Denn während man einen erfolgreichen Workflow relativ leicht kopieren könne, sei die Plattform, auf der das stattfindet, relativ schnell unangreifbar, so Stelzer.
Zur Sandbox-Idee kam eine Hypothese: Was, wenn diese KI-Workflows nicht einfach nur praktische Tools wären, sondern etwas viel bedeutenderes? Denn – wenn man Künstliche Intelligenz als ähnlich revolutionär wie Buchdruck, Fotografie, Internet betrachtet, müsste sie dann nicht auch analog zu Buch, Foto, Website ein eigenes Medienformat hervorbringen? Stelzer ist davon überzeugt. "Wir hoffen natürlich, dass Glif irgendwann synonym damit wird", sagt er. Und nicht nur das: "Wir wären gerne das Youtube dieses Medienformats."
Sandkasten für Workflow-Künstler*innen
Um den Gedanken etwas weniger abstrakt klingen zu lassen, braucht es an dieser Stelle vielleicht ein paar Beispiele. Stelzer definiert einen Glif als den "Workflow, den jeder bauen kann" und als das Material mit dem "sich Workflow-Künstler kreativ ausleben können". Was das konkret heißt, kann man auf der Website von Glif sehen. Dort tummeln sich diverse KI-Tools. Einige sind praktisch. Die allermeisten aber dienen dazu, unterhaltsamen Content herzustellen. Es gibt diverse Generatoren für bekannte Memes wie Wojak, IQ Bell Curve oder What People think I Do. Andere Glifs dienen dazu, Comic-Charaktere und Prominente zu remixen, Bilder im Look von Papier-Dioramen zu erstellen oder Retro-Cover fiktiver Konsolenspiele.
Lohnt sich das OMR Festival? Das hat Fabian Stelzer den 4Chan-Thread-Generator auf Glif gefragt. Der kompiliert darauf unter Zuhilfenahme mehrerer KI-Modelle einen derben Schlagabtausch. Screenshot OMR
Wie komplex die Glifs sein können, macht vielleicht am besten der 4chan threadshot generator deutlich. Dieses Tool simuliert auf Basis einzelner Stichworte einen Dialog mehrerer Nutzer*innen eines Online-Forums. Wie man es vom berüchtigen Vorbild 4Chan kennt, sind die Posts voller kruder Thesen, mit aus dem Web geklaubten Bildchen garniert und sprachlich derb bis offen beleidigend. Als Prompt genügt ein einziges Wort, um einen umfangreichen 4Chan-Dialog zu generieren.
Bereits eine Viertelmillion User
Der Fokus auf unterhaltsamen Content ist wohlkalkuliert. Diese Inhalte würde nicht nur im Consumer-Bereich sehr gut funktionieren, so Stelzer. "Memes sind cool für uns, weil sie ein Format sind, das schön zum Vorschein bringt, was du mit Glif bauen kannst." Vor allem bringen sie, was ein junges Startup braucht: Reichweite. Die per Glif generierten Wojak-Memes haben laut Stelzer über die diverse Plattformen von Instagram bis Slack bereits hunderte Millionen Impressions erzielt.
Aktuell befindet sich Glif noch in der Alpha-Phase, also in der Diktion der Startup-Welt vor dem offiziellen Start, der in ein paar Wochen ansteht. Dennoch hat die Plattform bereits 250.000 angemeldete User. Jeden Tag kommen um die 2.500 neue dazu, so Stelzer. Darum wurde die Zahl der gestatteten Glif-Nutzungen mittlerweile limitiert. Besonders aktive Creator*innen können sich allerdings um einen unlimitierten Zugang bewerben.
Bald startet das Bezahlmodell
Wie viel das Startup den Anbietern der verwendeten KI-Modelle überweist, mag Stelzer nicht sagen. Mehrere Tausend Dollar im Monat? "Auf jeden Fall", antwortet er und lacht. Millionen? "Kein Kommentar", sagt Stelzer, lacht noch einmal. "Es ist auf jeden Fall nicht ganz günstig." Dazu trägt neben dem Wachstum der User-Zahlen auch der Umstand bei, dass ein Workflow andere Workflows beinhalten kann, erklärt Stelzer. "Du weißt manchmal nicht, was ein Glif kostet, bevor du ihn laufen lässt."
Wie die meisten Gen-AI-Plattformen werde man demnächst ein Credit- oder Abo-Modell einführen, so der Glif-Gründer. Anders als früher, wo in Sachen digitaler Entertainment-Content eine ausgesprochene Gratismentalität herrschte, sind Nutzer*innen heute von Anfang an zahlungsbereit. Selbst, wenn wie bei den meisten Gen-AI-Tools nur eine Minderheit die Inhalte professionell nutzt oder auch nur privat irgendwo veröffentlicht. Als "Creation-as-Entertainment" bezeichnet Stelzer dieses Phänomen.
Marken als Sponsoren von KI-Workflows
Denkbar, wenn auch bei Glif derzeit nicht geplant, sind weitere Erlösquellen. Als eine naheliegende nennt Stelzer "Advertising sponsored Inference". Als Inferenz bezeichnet man in der KI-Welt den Rechenaufwand, den die Modelle benötigen, um Ergebnisse zu produzieren. Zwar sinken die Inferenz-Kosten durch immer schlankere Modelle gerade drastisch. Aber sie können im Fall besonders leistungsstarker Bildgeneratoren, bei KI-generierten Videos – oder eben verschachtelten Glifs – erheblich sein.
Stelzer glaubt darum, dass Unternehmen künftig besonders beliebte KI-Workflows sponsern und im Gegenzug mit ihrer Marke verknüpfen könnten. Naheliegendstes Beispiel ist der Bildgenerator, über den ein Autohersteller sein neues Modell in von Usern bestimmten Szenen platziert. Andere Startups arbeiten bereist an solchen Marketing-Anwendungen.
Wie bringt man User-generierte Inhalte und Brand Safety zusammen? An einer Lösung arbeitet das luxemburgische Startup Letz AI. Bei Luxi, dem Maskottchen der luxemburgischen Fluggesellschaft, klappt das schon ganz gut. Screenshot: OMR
Noch spannender könnte jedoch ein Workflow sein, bei dem Leute den Inhalt ihres Kühlschranks abfotografieren und auf dieser Basis eine Zubereitungsanleitung samt Visualisierung des fertigen Gerichts unter Verwendung eines Produkts des Sponsors bekommen.
Noch allerdings herrscht bei vielen Firmen Zurückhaltung. Schon die Vorstellung, die eigene Brand mit generativer KI zu verbinden, bereitet Unbehagen. Ganz zu schweigen von der Vorstellung, die User mit der Marke herumspielen zu lassen. Stelzer ist sich jedoch sicher: "Es wird Marken geben, die verstehen, dass sie unfassbar viel Aufmerksamkeit und Community-Kreativität anlocken können, wenn sie da ein bisschen mehr laissez-faire sind."
Herausforderung Content Moderation
Eine gewisse Neigung zum Machenlassen lässt sich auch auf der Website von Glif beobachten. Wie nicht anders zu erwarten, nutzen viele User die KI-Workflows, um mit bekannten Figuren aus Politik und Popkultur herumzuspielen. „Es ist natürlich klar, dass du in so einer frühen Phase nicht wie Youtube eine halbe Milliarde in automatisierte Filter investierst“, sagt Stelzer. Er betont, man nehme das Thema Copyright bei Glif ernst, halte sich natürlich an geltende Gesetze und entferne von Rechteinhabern monierte Inhalte nach Prüfung.
Der Glif "Charakter Mix" kreuzt auf User-Wunsch die Minions mit Mutter Theresa, Hello Kitty mit den Teenage Mutant Hero Turtles, Super Mario mit Charlie Chaplin … Ein großer Spaß, auch wenn die Rechteinhaber das anders sehen könnten. Screenshot: OMR
Zu ergänzen wäre wohl, dass ein nicht allzu rigider Umgang mit rechtlich geschütztem Material die Attraktivität einer Entertainment-Plattform zumindest nicht schmälert. Etwas scrollen durch den Glif-Feed reicht, um prognostizierten zu können, dass das Thema Copyright noch eine Rolle spielen wird. Und Stelzer selbst ist bewusst, dass eine wachsende User-Community die bekannten Probleme von Deepfakes über NSFW-Content bis zu politischer Instrumentalisierung der Tools auch zu Glif bringen wird. Die Plattform sei darauf vorbereitet: Die bei Glif für Content Moderation zuständige Person arbeitete vorher in entsprechender Position bei Tumbler.
Design-Hustler und virtuelle Tiktok-Avatare
Unterhaltsamer Content wird bis auf weiteres der Fixpunkt für Glif sein, sagt Stelzer. Doch die Plattform sei so gebaut, dass sich auch alle möglichen ernsthaften Use-Cases darauf umsetzen lassen. Bereits heute gebe es erste Beispiele. Zum einen Designer, die Tasks von Gig-Economy-Plattformen wie 99 Design unverändert zu Glif copypasten. Im besten Fall sind das dann unkompliziert verdiente 50 Dollar. Zum anderen existieren aber weit komplexere B2B-Ansätze.
Jemand vom britischen National Health Service habe mit Glif eine Education-App entwickelt, erzählt Stelzer. Mehrere NFT-Projekte würden über die Plattform laufen. Und es gibt Tanaki, einen vollautomatischen Tiktok-Charakter aus Japan, der an einen dreiäugigen Karl Klammer erinnert. Die Macher*innen nutzen Glif, um Requests in der Kommentarspalte von Livestreams zu identifizieren und in Animationen umzusetzen. So kann Tanaki dann Bilder mit den von seinen Zuschauer*innen gewünschten Motiven malen.
Solche komplexen Automatisierungen zu bauen, erfordert noch immer einige IT-Skills. Stelzer glaubt jedoch, dass diese Hürde demnächst geschleift wird. Bald werde es Glifs geben, die für die Nutzer*innen die Prompts schreiben, aus denen dann die Glifs entstehen, die sie benötigen. Das wäre ein radikaler Entwicklungsschritt. "Wenn die Kosten und die menschliche Intelligenz, die notwendig ist, um Software zu bauen, auf Null runtergeht, dann wirst du wahnsinnig viel mehr Software haben", sagt der Glif-Gründer. Und es werde ganz spezifische Software geben, die nach Erfüllung ihres Zwecks quasi weggeworfen werden kann.
Das Zeitalter der Wegwerf-Apps
Als Beispiel dafür nennt er einen Ausflug einer Gruppe von Freunden. Aktuell wird der über die WhatsApp-Gruppe koordiniert, die man eh hat, um Bilder und Gedanken zu teilen. Stelzers Idee ist, dass es für den Ausflug dann eine ganz spezifische App geben wird, die die Agenda enthält, Karten, eine Funktion zum Teilen der Kosten. Glif solle dann die Plattform sein, auf der diese und unzählige andere Apps – die ja alle letztlich jeweils nur ein komplexer Workflow sind – gebaut werden.
Bis dahin ist es noch ein weiter Weg. Aktuell beschäftigt Glif auf beiden Seiten des Atlantiks gerade einmal 15 Leute, die remote arbeiten. Der offizielle Firmensitz von Glif ist in den USA, Stelzer pendelt zwischen Berlin und New York. Diese kleine Truppe legt ihren Fokus derzeit also voll auf das Thema Entertainment. Denn hier muss Glif ein entscheidender Sprung gelingen, soll die Plattform vom Prokrastinations-Outlet zum echten Player der Creator Economy werden.
KI kann inzwischen auch witzig sein: Diese Memes nach bekannten Vorlagen generierten die jeweiligen Glifs auf Basis von Text-Prompts, die nur ein oder Wörter beinhalteten. Screenshots: OMR
Es sei von zentraler Bedeutung, die Schöpfer erfolgreicher Glifs für ihre Arbeit zu belohnen, so Stelzer. Bei Open AI arbeitet man an einem Modell, mit dem die Ersteller erfolgreicher Chatbots an Umsätzen im GPT Store beteiligt werden können. Solche Mechaniken wird es auch bei Glif geben. "Im Prinzip ist es das YouTube-Modell, nur für AI Workflows", so Stelzer.
Erklärtes Ziel ist ein Börsengang
Das Kapital für die nächsten Schritte auf dem Weg zum neuen Youtube dürfte vorhanden sein. Die Namen der beiden US-Investoren, die Geld in Glif gesteckt haben, will Stelzer vor dem Start der Beta-Phase nicht preisgeben; sie gehörten aber zu den bekanntesten der VC-Szene. Mit der Wahl dieser Finanzierung über Wagniskapital ist auch klar, wo Glif einmal landen soll: Ziel ist der Börsengang, sagt Stelzer. "Wenn man den VC-Pfad wählt, muss man natürlich auch sagen: Ich will das Ding richtig, richtig groß machen."
Zum Abschluss dann vielleicht noch eine ganz naheliegende Frage: Wofür steht Glif eigentlich? "Galactic Life Intelligence Format", erklärt Stelzer und lacht. "Nee, das steht für nichts." In der Zeit, als er einen Namen für sein Startup suchte, sei er in Berlin im Pergamonmuseum gewesen. Und als er dort Hieroglyphen sah, passte das irgendwie. "Dass es auch wie GILF klingt, habe ich damals nicht bedacht." Wofür diese Abkürzung steht, das muss jede*r selbst googeln. Es hat aber für sich schon fast Meme-Potenzial. Vielleicht baut ja jemand einen Glif zum prophylaktischen Firmennamen-Check.