Interessieren Sie sich für sie? ANGEBOTE? Sparen Sie mit unseren Gutscheinen WhatsApp o TELEGRAMM!

Llama 3 fordert die Riesen heraus: Hier ist Metas neues KI-Modell

18. April 2024

Meta hat zwei neue hinzugefügt Sprachliche Modelle zu seiner Serie: Lama 3 8B e Lama 3 70B. Diese versprechen Spitzenleistungen in der Welt der künstlichen Intelligenz. Die auffälligste Nachricht? Das Vorhandensein von 8 Milliarden bzw. 70 Milliarden Parametern. Diese Zahlen stellen die Komplexität und Fähigkeit des Modells dar, mit und umzugehen verarbeiten Informationen.

Llama 3 besteht nicht nur aus zwei Modellen: Weiteres Material ist in Vorbereitung

Meta hört hier nicht auf; plant Veröffentlichung weiterer Modelle der Llama 3-Serie, jedoch ohne Angabe eines Datums. Diese Strategie weckt Vorfreude und zeigt zugleich das Engagement des Unternehmens, sein Angebot kontinuierlich zu verbessern.

I neue Lama-Modelle Sie werden als ein Sprung gegenüber früheren Modellen beschrieben. Diese Verbesserung ist teilweise auf die Verwendung von zurückzuführen zwei benutzerdefinierte GPU-Clustermit jeweils 24.000 Einheiten, wodurch Modelle effektiver und genauer trainiert werden konnten. Meta behauptet, dass diese Modelle aufgrund der Anzahl der Parameter, die sie besitzen, dies tun zu den Besten, die es gibt heute für generative künstliche Intelligenz.

Die Leistung von Llama 3 wurde anhand verschiedener KI-Benchmarks gemessen, bei denen es sich um standardisierte Tests zur Bewertung der Fähigkeiten von KI-Modellen handelt. Diese beinhalten MMLU für Wissen, ARC zum Erwerb von Fähigkeiten, z DROP zum Nachdenken über Textblöcke. Auch wenn es unterschiedliche Meinungen über den Nutzen dieser Benchmarks gibt, bleiben sie eine gängige Methode zur Bewertung und zum Vergleich der Fähigkeiten von KI-Modellen.

Insbesondere Llama 3 8B übertraf ähnliche Open-Source-Modelle mit weniger Parametern wie Mistral und Google Gemma, in mindestens neun verschiedenen Benchmarks. Dazu gehören Tests zu Allgemeinwissen, Argumentation und spezifischen Fähigkeiten in Bereichen wie Biologie, Physik, Chemie und sogar zu Code-Generierung und mathematischen Problemen. Was beispielsweise GPT-4 nicht sehr gut kann.

Das größte Modell, Llama 3 70B, konkurriert nicht nur mit Flaggschiffmodellen, sondern übertrifft diese in einigen Fällen sogar Gemini 1.5 Pro von Google in verschiedenen Tests bewiesen, dass es trotz starker Konkurrenz sogar mit den Giganten der Branche mithalten kann. Es ist jedoch wichtig zu beachten, dass es zwar einige Flaggschiff-Modelle übertrifft, z Claude 3 Sonett von Anthropic In mehreren Tests erreicht es nicht die Leistung des weiterentwickelten Claude 3 Opus-Modells.