Ankündigung von Google über sein neues Sprachmodell, Gemini, hob einen Schleier der Neugier und Skepsis. Obwohl das Werbevideo außergewöhnliche Leistungen versprach, brachten einige Untersuchungen und Beobachtungen Licht ins Dunkel erhebliche Abweichungen zwischen dem Gezeigten und den tatsächlichen Fähigkeiten vom System. Entsprechend bedeutende QuellenSeien Sie sehr vorsichtig, sein Potenzial wäre geringer als beschrieben.
Die Wahrheit hinter dem Gemini-Werbevideo: Alles Rauch und Feuer?
Während der letzten Präsentation der ZwillingeGoogle machte mit einem Video an die Öffentlichkeit, das die vermeintlich fortschrittlichen Fähigkeiten seines neuen KI-Sprachmodells vorstellte. Es dauerte jedoch nicht lange, bis einige Medien, darunter Bloomberg, sie begannen es Zweifel an der Authentizität dieser Darbietungen.
In dem Video schien Zwillinge in der Lage zu sein, eine Reihe von Gesten, darunter Stein, Papier und Schere, sofort zu interpretieren. Wie sich jedoch später herausstellte, um genaue Antworten von Zwillingen zu erhalten, Sie müssen alle drei Gesten zeigen und konkrete Leitfragen stellen. Dies deutet darauf hin, dass der tatsächliche Prozess komplizierter und weniger intuitiv ist als zunächst dargestellt.
Vorwürfe, die tatsächlichen Fähigkeiten des neuronalen Netzwerks „verschönert“ zu haben, haben Zweifel daran geweckt Googles Transparenz und Ehrlichkeit bei der Präsentation ihrer Innovationen. Laut einigen Google-Mitarbeitern, die anonym bleiben wollten, spiegelte das Demonstrationsvideo die tatsächlichen Fähigkeiten von Gemini nicht genau wider. Diese Ansicht wurde weiter bestätigt durch Eli Collins von Google DeepMind, das zugab, dass einige der demonstrierten Funktionen, wie zum Beispiel die Entenzeichnung, Sie befinden sich noch auf Forschungsniveau und sind nicht vollständig in das Produkt integriert.
Trotz dieser Enthüllungen behauptet Google, dass das Video aus Gründen der Unterhaltung und Klarheit eine vereinfachte Darstellung der Fähigkeiten von Gemini sein sollte. Die Beschreibung des Videos auf YouTube gibt tatsächlich zu, dass die Die Präsentation wurde gekürzt für diese Zwecke.
Während eines Tests, der mit Gemini über den Google Bard-Chatbot durchgeführt wurde, stellten Journalisten fest, dass die Die Fähigkeiten des neuen KI-Modells unterschieden sich nicht wesentlich von denen von GPT-3.5. Dies wirft Fragen über den tatsächlichen technologischen Fortschritt auf, den Gemini im Vergleich zu bestehenden Modellen darstellt.
Die drei Varianten von Zwillinge
Es gibt drei Versionen des neuronalen Netzwerks: Ultra-, Pro e Nano. Ersteres ist für den Einsatz in Rechenzentren und Unternehmensanwendungen konzipiert, letzteres konzentriert sich auf Bard und andere Google-Dienste und Nano ist für die Offline-Arbeit auf Android konzipiert. Letzteres wurde bereits angekündigt Pixel 8 Pro. Als Anwendungsbeispiel zeigte Google die Zusammenfassung von Informationen aus Sprachaufzeichnungen.