
Die Welt der künstlichen Intelligenz entwickelt sich ständig weiter, und OpenAI ist mit der Einführung seines neuesten Sprachmodells nicht anders. GPT-4o, eine erweiterte Version der vorherigen GPT-4 Turbo. Diese neue Version wird nicht nur besser, sie erweitert auch ihre Fähigkeiten erheblich und umfasst mehr als nur das Text hinzu e Metaphorik, sondern auch dieAudio-.
OpenAI stellt GPT-4o vor: was es ist und wozu es fähig ist
GPT-4o wird als „Omni“-Version beschrieben (daher das „o“ im Namen), da es mehrere Interaktionsmodi integriert: Text hinzu, Vision und nun, Stimme. Dieses Modell bietet Echtzeit-Antworten auf Fragen der Benutzer und ermöglicht es ihnen, das System zu unterbrechen, während es antwortet, und sogar darauf Ändern Sie die Anwendung unterwegs. Darüber hinaus kann es Emotionen in der Stimme des Benutzers erkennen und entsprechend reagieren, indem es den emotionalen Stil der Antworten variiert, bis hin zu singenden Antworten.
Diese können Sie auch interessieren: Was sind Sprachmodelle in der Künstlichen Intelligenz?
Zusätzlich zu Sprachinteraktionen bietet GPT-4o Verbessert die visuellen Fähigkeiten von ChatGPT erheblich. Beispielsweise kann es jetzt schnell Fragen zu Fotos oder Screenshots beantworten und Details wie die Marke eines T-Shirts oder den Inhalt eines angezeigten Softwarecodes identifizieren. Stellen Sie sich vor, Sie könnten ein Menü in einer Fremdsprache fotografieren und sofort die Übersetzung erhalten: Dies ist nur eines der Zukunftsszenarien, die mit GPT-4o möglich sind.
Das neue OpenAI GPT-4o-Modell liefert es Verbesserte Unterstützung für über 50 SprachenDies garantiert die doppelte Leistung im Vergleich zum vorherigen GPT-4 Turbo EA der halbe Preis, mit höheren Nutzungsbeschränkungen. Dies führt zu einem nahtloseren und zugänglicheren Benutzererlebnis und erweitert das Potenzial für den Einsatz in verschiedenen internationalen Kontexten.
Verfügbarkeit und Ausgang
GPT-4o ist jetzt für Nutzer der kostenlosen Version von ChatGPT kostenlos verfügbar und für Abonnenten von Premium-Plänen mit fünffachem Nachrichtenlimit. Diese Änderungen gehen mit einem erneuerten Layout der Benutzeroberfläche einher, das intuitiver und verständlicher ist, und a Desktop-Version für macOS, dem bald eine Windows-Version folgen wird. Darüber hinaus wird der Zugriff auf zuvor kostenpflichtige Funktionen, wie z. B. die Möglichkeit, sich Benutzerpräferenzen zu „merken“, jetzt auf alle Benutzer ausgeweitet.