In fünf Minuten zum Video – Wie fabbrain Redaktionen in der Videoproduktion entlasten will
Viele Produktideen in der Startup-Welt starten mit einem Problem, das man selbst hatte. So war es auch bei Linda und Sven Döhre, die zeitintensive Face-to-Face-Workshops durch Lernvideos ersetzen wollten. Problem: Das Erstellen der Videos war nicht weniger aufwendig. So entstand die Idee zu Text2VideoBrain, einer Videosoftware, die die Arbeit von zwei Stunden auf fünf Minuten reduzieren können soll. Eine Lösung, auf die sich nicht nur Redaktionen in Zukunft freuen können.
Hi Linda, welche Rolle hast du im Text2VideoBrain-Team und wie seid ihr aufgestellt?
Mein Name ist Linda Döhre und zusammen mit meinem Mann Sven betreiben wir seit 2017 unser Software-Startup fabbrain. Bei unserer Video-Software Text2VideoBrain bin ich Product Owner. Das heißt, ich kümmere mich darum, dass wir unser Produkt nach agilen Prinzipien entwickeln und wir dabei ganz nah an den Bedürfnissen und Wünschen der Nutzer:innen sind. Ich habe Diplom Medienwissenschaften studiert und war in verschiedenen PR-Redaktionen tätig. Daher übernehme ich alles in Richtung Kundenkommunikation. Sven ist Diplom-Informatiker und hat seit über 13 Jahren Erfahrung als Software-Architekt und Softwareentwickler.
Wie seid ihr auf die Idee für Text2VideoBrain gekommen?
Eigentlich aus Eigenbedarf. Seit 2019 arbeiten wir mit unserem Anwendungsgenerator. Unser Low-Code-Ansatz ermöglicht es Fachexperten ohne Programmierkenntnisse mittels Excel-Tabellen ihre Anwendungssoftware selbst zu konfigurieren und zu erweitern. Mit unserem Low-Code-Generator haben wir bereits Projekte im Online-Baustoffhandel, der Messkrafttechnik und der Immobilienbranche umgesetzt.
Wir haben gemerkt, dass unser Low-Code-Generator zwar nützlich, aber nicht immer selbsterklärend ist. Und da haben wir uns überlegt, wie wir die zeitaufwändigen Face-to-Face-Workshops optimieren können. Da kam die Idee der Erklärvideos auf, die aber auch aufwändig zu produzieren sind. Zuletzt bin ich dann dazu übergangen die PDF-Slideshow einfach abzufilmen. Sven kam dann auf die Idee das zu automatisieren. Und daraus ist dann die Idee zu Text2VideoBrain entstanden.
Von einem nützlichen internen Tool zu einem Software-Produkt ist es ja dann schon noch mal ein Schritt. Wie seid ihr auf die Idee gekommen damit an den Markt zu gehen?
Die Lust darauf kam, als wir gesehen haben, dass das Fellowship-Programm des JournalismusLab genau so eine Kombination sucht: Also eine Medienwissenschaftlerin und einen Informatiker, die ein redaktionelles Problem lösen. Eine Redakteurin berichtete uns in einem Interview, dass sie selbst solche Videos produziert. Die Redakteurin braucht für ihr 30 Sekunden Video aktuell über zwei Stunden Arbeit. Wir können das in 5 Minuten generieren. Ähnliches haben uns andere Redakteurinnen und Redakteure erzählt. Da haben wir gemerkt, dass daraus ein nützliches und skalierbares Produkt werden könnte.
Im Rahmen des Bootcamps des Journalismus Lab haben wir auch mit anderen Personen gesprochen und da hat sich gezeigt, dass unsere Video-Software durchaus auch in der B2B-Kommunikation spannend sein könnte. Also für andere Unternehmen mit erklärungsbedürftigen Produkten oder Dienstleistungen.
Was macht Text2VideoBrain genau?
Mit Text2VideoBrain wollen wir die Erstellung redaktioneller und informativer Videos automatisieren. Nehmen wir mal an, eine Redakteurin hat einen Text geschrieben, den sie mit einem Video auf Social Media bewerben möchte. Sie würde dann in ihrem Text verschiedene Abschnitte markieren. Unsere Video-Software schlägt zu den Abschnitten Bilder und Videos vor, aus denen sie dann auswählen kann. So der langfristige Plan. Vorerst wählen die Testerinnen und Tester das Bildmaterial selbst aus. Denn wir wollen herausfinden, welche Funktionen sie wirklich brauchen. Oft haben die Redakteurinnen und Redakteure auch eigenes Material. Ein Sprach-Bot liest auf Wunsch den Text automatisch vor und die Software generiert daraus ein komplettes Video, dass die Redakteurin dann direkt in alle Kanäle posten kann. Bei der Nutzung des Sprach-Bots wollen wir auch erst noch heraus finden, wie bedeutend die Vorlese-Funktion für unsere Nutzerinnen und Nutzer überhaupt ist. Es kam auch der Wunsch auf, Musik hinterlegen zu können.
Soweit ich das sehe, ist die Video-Software bisher nur in Deutsch verfügbar. Warum nicht gleich international gehen? Bilder vorschlagen und Text vorlesen kann auch in Englisch automatisiert werden.
Das stimmt wohl. Für die Entwicklung wollen wir erst mal im deutschen Raum bleiben und da vor allem vom Netzwerk des Journalismus Lab lernen, das erst mal in Deutschland ist.
Wie sieht denn der Markt für solche Video-Software aus?
Es gibt natürlich schon Tools, die Videos generieren können. Die Besonderheit bei uns ist, dass wir nicht die Zeit-Achse in den Vordergrund nehmen, sondern den Text. Das hat den Vorteil, dass wenn nachträglich ein kompletter Satz hinzugefügt oder etwas herausgestrichen wird, dann können wir das viel leichter und schneller anpassen. Denn unsere Video-Software blendet das Bild oder die Videosequenz immer so lange ein, wie der Text lang ist und schneidet das Video entsprechend automatisch zu.
Natürlich wäre das Tool auch für andere Betriebe interessant, auch für Unis ist der Einsatz denkbar. Wir haben auch Kontakt zu einer Hochschul-Professorin. Aber wir wollen uns zunächst auf Redaktionen konzentrieren. Eine wichtige Aufgabe für uns während des Fellowships ist es, unsere erste Zielgruppe und die Anforderungen genauer zu definieren.
Welche weiteren Ziele habt ihr im Fellowship?
Unser Low-Code-Ansatz ermöglicht uns, deutlich schneller Softwareanwendungen realisieren zu können. So haben wir für unsere Video-Software bereits innerhalb einer Woche ein funktionales MVP entwickelt.
Über das MVP wollen wir ab Mai Testerinnen und Tester Videos erstellen lassen. Durch ihr Feedback entwickeln wir unsere Video-Software kontinuierlich weiter.
Habt ihr auch schon eine Vorstellung davon, was das Tool letztendlich kosten soll?
Bei unseren ersten Gesprächen haben wir schon ein paar erste Preise genannt bekommen. Für ein kurzes Video von einer Minute würden die Nutzer für ein kurzes Video zwischen fünf bis 20 Euro bezahlen. Für fünf Minuten können das schon zwischen 50 bis 100 Euro sein. Eine Option ist auch ein Abo-Modell für Power-User. Wir müssen mit den Testerinnen und Tester evaluieren, wie viel sie bereit wären dafür monatlich zu bezahlen. Denkbar wäre auch ein Gratismonat und danach ein Abo.
Vielleicht bieten wir pro Zielgruppe aber auch unterschiedliche Webseiten an, um für Universitäten oder Redaktionen verschiedene Preismodelle zu testen.
Was ist für euch noch die größte Unsicherheit in der aktuellen Phase?
Ob wir genügend Leute finden, die uns ihre Zeit schenken, unsere Video-Software auszuprobieren und uns Feedback geben. Über unser MVP können bereits Videos erstellt werden. Wir wollen genügend Funktionalität anbieten ohne zu komplex zu werden. Das ist durchaus eine technische Herausforderung. Denn trotz aller Automatisierung möchten die Nutzerinnen und Nutzer weiter selbst Einstellungen anpassen können und zwar leicht verständlich und nutzerfreundlich. Das haben uns die Interviews gezeigt.
Wo seht ihr euch denn in zwei Jahren im Bezug auf das Team und Investitionen durch Fremdkapital?
Also ich würde sagen, dass wir in Sachen Teamentwicklung nicht abgeneigt sind, wenn wir bereits im Laufe des Fellowships jemanden kennenlernen, der das mega cool findet, was wir machen und uns verstärken möchte. Die Herausforderung wird sein, engagierte, motivierte Leute zu finden, die auch für ein Startup-Gehalt mitarbeiten wollen. Mit Venture Capital könnten wir deutlich schneller ein Team aufbauen, die neuen Funktionen für die Nutzerinnen und Nutzer von Text2Videobrain umsetzen und so den Alltag von möglichst vielen Redaktionen erleichtern.