Google I/O 2025 hat eine wahre Revolution in Gang gesetzt. In diesem Jahr hat das Unternehmen einen mutigen Ansatz gewählt Natürlich: keine kleinen Schritte mehr, sondern eine komplette Überarbeitung der generativen AI das die Landschaft für Suchmaschinen, Videos und digitale Kreativität neu gestaltet.
Im Mittelpunkt dieser Veränderungen steht Gemini, Googles Modell der nächsten Generation, das alles von Suchergebnissen über Videosynthese bis hin zur Erstellung hochwertiger Bilder ermöglicht. In einer Zeit, in der Geschwindigkeit und der natürliche Fluss der KI-Generierung der Maßstab sind, positioniert sich Gemini als bahnbrechende Neuerung.
Der eigentliche Clou? Veo 3, Googles erster KI-Video-Editor, der nicht nur visuelle Elemente erstellt, sondern auch komplette Soundtracks – von Umgebungsgeräuschen bis hin zu Gesprächen – perfekt synchronisiert mit den Bildern generiert. Text und Bildanweisungen eingeben, und voilà: Ein fertig produziertes 4K-Video erscheint! Veo 3 ist die erste groß angelegte Video-Engine, die Audio und Bild gleichzeitig generieren kann – ein Trend, der mit der noch nicht veröffentlichten Showrunner Alpha begann. Veo 2 bietet deutlich mehr Flexibilität und kann eine Vielzahl von Stilen über einfache XNUMXD-Animationen hinaus generieren. „Wir betreten eine neue Ära der Kreation mit kombinierter Audio- und Videogenerierung“, sagte Josh Woodward, VP von Google Labs, bei der Vorstellung. Damit fordert Google die etablierten Video-Marktführer heraus und positioniert Veo als Komplettlösung.
Neben Veo 3 stellt Google auch Imagen 4 vor, die neueste Version seines Bildgenerators. Diese Version bietet verbesserte fotorealistische Renderings, 2K-Auflösung und ein entscheidendes Feature: Textgenerierung, die tatsächlich für Schilder, Produkte und digitale Mockups verwendet werden kann. Für alle, die bisher mit inkonsistentem, von KI generiertem Text zu kämpfen hatten, stellt Imagen 4 eine deutliche Verbesserung dar.
Diese Tools sind jedoch nicht eigenständig. Flow AI, ein neues Abonnement für professionelle Anwender, kombiniert die Sprachfunktionen von Veo, Imagen und Gemini in einer integrierten Umgebung für Filmproduktion und Szenenbearbeitung. Dieser Komfort kostet während eines Aktionszeitraums 125 US-Dollar pro Monat, bis die volle Gebühr von 250 US-Dollar fällig wird.
Generative KI ist nicht nur für Content-Ersteller gedacht. Gemini 2.5 bildet nun das Rückgrat der überarbeiteten Google-Suchmaschine. Diese Plattform entwickelt sich vom Link-Aggregator zu einer dynamischen, dialogorientierten Benutzeroberfläche, die komplexe Fragen bearbeitet und aggregierte, vielschichtige Antworten liefert. KI-Übersichten – Google Gemini versucht, umfassende Antworten zu liefern, ohne dass Nutzer auf andere Websites klicken müssen – erscheinen nun oben auf den Suchseiten. Und das ist noch nicht alles: Mit über 1,5 Milliarden monatlichen Nutzern ist das Wachstum spektakulär.
Darüber hinaus gibt es „Gemini Diffusion“, basierend auf einer Technologie, die vor einigen Monaten von Inception Labs entwickelt wurde. Während sich die KI-Community bisher auf autoregressive Technologie für die Textgenerierung und Diffusionstechnologie für Bilder konzentrierte, hat Google nun den ersten großen Schritt gemacht und die Diffusionsgenerierung auf Text angewendet. Das bedeutet, dass das Modell mit zufälligen Informationen beginnt und jede Iteration mit unglaublich hoher Geschwindigkeit verfeinert.
Unsere Erfahrungen mit einigen der neuen KI-Funktionen von Google waren je nach Level gemischt. Deep Research erwies sich als besonders leistungsstark, sogar besser als vergleichbare Alternativen. Es kann Hunderte von Quellen analysieren und zuverlässige Daten mit minimalen Fehlern liefern und sogar optisch ansprechende Infografiken erstellen.
Veo 3 ist derzeit nur für Gemini Ultra-Nutzer verfügbar, aber mehrere Drittanbieterplattformen bieten bereits Zugriff über APIs. Flow, der intuitive Videoeditor, der auf Veo-Modellen basiert, ermöglicht Nutzern die einfache Bearbeitung von KI-Szenen mit Texteingaben.
Was Audioübersichten betrifft, können die neuen Modelle nun mühelos über zwanzig Minuten vollständige Debatten produzieren, ohne dass Nutzer zwischen verschiedenen Plattformen wechseln müssen. Dies macht Gemini zu einer umfassenderen Benutzeroberfläche und reduziert die Fragmentierung, die zuvor zum Wechsel zwischen verschiedenen Websites für unterschiedliche Dienste führte.
Google hat seine Monetarisierungsstrategie offengelegt. Der „Ultra“-Plan kostet 250 US-Dollar pro Monat und bietet die leistungsstärksten Modelle, Flow-KI-Tools und 30 Terabyte Speicherplatz. Er richtet sich klar an Filmemacher, ambitionierte Content-Ersteller und Unternehmen. Für ein breiteres Publikum gibt es die 20 US-Dollar teure „AI Pro“-Variante, die Zugriff auf das Vorgängermodell Veo 2 sowie Bildbearbeitungs- und Produktivitätsfunktionen bietet. Grundlegende generative Tools bleiben kostenlos, allerdings mit Einschränkungen wie einem Token-Limit und maximal zehn Studien pro Monat.
Dieser mehrschichtige Ansatz spiegelt einen breiteren Trend im KI-Markt wider: Massen mit kostenlosen Tools anlocken und dann Profis mit Funktionen an Bord holen, die so wertvoll sind, dass man sie nicht ignorieren kann. Google setzt darauf, dass die wahren Erfolge in anspruchsvoller Kreativarbeit und automatisierten Geschäftsabläufen liegen – nicht nur in gelegentlichen Eingabeaufforderungen und der Generierung von Memes.
„Und jetzt starten Sie mit Ihrer eigenen kreativen Explosion?“
Was ist die größte Neuerung bei Google I/O 2025?
Die Einführung von Gemini und Veo 3, die zusammen einen neuen Standard für KI-generierte Videos und Bilder setzen.
Wie funktioniert Gemini Diffusion?
Gemini Diffusion beginnt mit zufälligen Informationen, die Schritt für Schritt verfeinert werden, sodass das Modell Tausende von Token pro Sekunde generieren kann, ohne die Genauigkeit zu beeinträchtigen.
Wie viel kostet der Ultra-Plan von Google?
Der Ultra-Plan kostet 250 US-Dollar pro Monat und bietet Zugriff auf die leistungsstärksten KI-Tools und 30 Terabyte Speicherplatz.