OpenChat 3.5: Der Open-Source-LLM, der Branchenriesen übertrifft

Name: Jennie Rose

Published on 30.4.2024

OpenChat 3.5 ist ein leistungsstarkes Open-Source-Sprachmodell, das eine außergewöhnliche Leistung erbringt, die mit proprietären Modellen wie ChatGPT und Grok vergleichbar oder sogar besser ist, während es für Entwickler und Forscher zugänglich ist. Erfahren Sie mehr über seine wichtigsten Funktionen, Benchmark-Ergebnisse und wie Sie es lokal ausführen können.

OpenChat 3.5 ist ein bahnbrechendes Open-Source-Sprachmodell, das vom OpenChat-Team entwickelt wurde. Mit nur 7 Milliarden Parametern erzielt es eine bemerkenswerte Leistung, die mit führenden Modellen wie ChatGPT und Grok vergleichbar oder besser ist. Was OpenChat 3.5 auszeichnet, ist sein Engagement für die Open-Source-Zugänglichkeit, die es Entwicklern und Forschern ermöglicht, seine Fähigkeiten ohne die Beschränkungen proprietärer Lizenzen zu nutzen.

Möchten Sie die neuesten LLM-Nachrichten erfahren? Schauen Sie sich das aktuelle LLM-Leaderboard an!

Wichtige Funktionen von OpenChat 3.5

Effizientes Training mit C-RLFT: OpenChat 3.5 wird mit Conditioned Reinforcement Learning from Feedback (C-RLFT) trainiert, einer Technik, die von Offline-Reinforcement-Learning inspiriert ist. Mit diesem Ansatz kann das Modell effektiv aus Daten mit gemischter Qualität lernen, ohne explizite Präferenzetiketten.
Außergewöhnliche Leistung mit weniger Parametern: Trotz nur 7 Milliarden Parametern liefert OpenChat 3.5 eine Leistung, die mit Modellen mit deutlich mehr Parametern wie ChatGPT und Grok vergleichbar oder besser ist.
Zugängliche Bereitstellung: OpenChat 3.5 kann auf Consumer-GPUs wie der RTX 3090 ausgeführt werden, was es im Vergleich zu ressourcenintensiven proprietären Modellen für Entwickler und Forscher zugänglicher macht.
Vielseitige Fähigkeiten: OpenChat 3.5 zeichnet sich als generalistisches Modell aus und zeigt eine starke Leistung in einer breiten Palette von Aufgaben, wie z.B. Programmieren, Frage-Antworten und Sprachverständnis.

Benchmark-Ergebnisse

OpenChat 3.5 hat beeindruckende Ergebnisse bei verschiedenen Benchmarks erzielt, die seine Position als leistungsfähiges Open-Source-Sprachmodell festigen. Hier sind einige bemerkenswerte Benchmark-Vergleiche:

Modell	Params	Durchschnitt	MMLU	HumanEval	MATH	GSM8k
OpenChat-3.5-0106	7B	61,0	65,8	71,3	29,3	77,4
OpenChat-3.5-1210	7B	60,1	65,3	68,9	28,9	77,3
OpenChat-3.5	7B	56,4	64,3	55,5	28,6	77,3
Grok-0	33B	44,5	65,7	39,7	15,7	56,8
Grok-1	???B	55,8	73,0	63,2	23,9	62,9
ChatGPT (März 2023)	???B	???	70,0	63,0	???	75,0

Wie aus der Tabelle ersichtlich ist, übertrifft OpenChat 3.5 Grok-0 (33B Parameter) bei allen vier Benchmarks und übertrifft Grok-1 (unbekannte Parameter) im Durchschnitt und in 3 von 4 Benchmarks. Trotz deutlich weniger Parameter erzielt es auch Ergebnisse, die mit ChatGPT (März 2023 Version) vergleichbar oder besser sind, insbesondere in den Bereichen HumanEval und GSM8k.

Ausführung von OpenChat 3.5 lokal mit Ollama

Einer der Hauptvorteile von OpenChat 3.5 besteht darin, dass es mit Tools wie Ollama lokal ausgeführt werden kann. Hier ist eine Schritt-für-Schritt-Anleitung:

Installieren Sie Ollama, indem Sie den folgenden Befehl ausführen:
```
curl -fsSL https://ollama.com/install.sh | sh
```
Laden Sie das OpenChat 3.5-Modell mit dem Ollama-Befehl herunter:
```
ollama run openchat
```
Starten Sie den Ollama-Server:
```
./ollama serve
```
Führen Sie das OpenChat 3.5-Modell in einer separaten Shell aus:
```
./ollama run openchat
```
Interagieren Sie mit dem Modell über die Ollama-REST-API oder eine der kompatiblen Benutzeroberflächen, wie z.B.:
- LibreChat
- Bionic GPT
- Enchanted (macOS nativ)
- HTML-Benutzeroberfläche
- Saddle
- Chatbot-Benutzeroberfläche

Hier ist ein Beispiel, wie man Text mit der Ollama-REST-API generiert:

curl http://localhost:11434/api/generate -d '{
  "model": "openchat",
  "prompt": "Warum ist der Himmel blau?"
}'

Und so können Sie eine Chat-ähnliche Interaktion führen:

curl http://localhost:11434/api/chat -d '{
  "model": "openchat",
  "messages": [
    {
      "role": "user",
      "content": "Warum ist der Himmel blau?"
    }
  ]
}'

Indem Sie diesen Schritten folgen, können Sie OpenChat 3.5 problemlos lokal ausführen und seine beeindruckenden Fähigkeiten aus erster Hand erleben.

Potenzielle Anwendungen und Auswirkungen

OpenChat 3.5 hat das Potenzial, die KI-Landschaft zu revolutionieren, indem es ein hochleistungsfähiges Open-Source-Sprachmodell bereitstellt, das für Entwickler und Forscher weltweit zugänglich ist. Einige potenzielle Anwendungen sind:

Unterstützung beim Programmieren: Mit seiner starken Leistung bei Programmier-Benchmarks wie HumanEval kann OpenChat 3.5 als leistungsstarker Assistenz beim Programmieren dienen und Entwicklern helfen, effizienteren und fehlerfreien Code zu schreiben.
Fragen beantworten: Die außergewöhnliche Leistung von OpenChat 3.5 bei Benchmarks wie MMLU und GSM8k zeigt seine Fähigkeit, genaue und informative Antworten auf eine Vielzahl von Fragen zu liefern.
Sprachverständnis: Die starke Leistung des Modells bei sprachlichen Verständnisaufgaben macht es geeignet für Anwendungen wie Sentimentanalyse, Textklassifikation und Named Entity Recognition.
Forschung und Innovation: Durch die Bereitstellung einer Open-Source-Alternative zu proprietären Modellen ermöglicht OpenChat 3.5 Forschern, neue Ideen zu erkunden und die Grenzen dessen, was mit Sprachmodellen möglich ist, auszuloten.

Fazit

OpenChat 3.5 stellt einen bedeutenden Meilenstein in der Entwicklung von Open-Source-Sprachmodellen dar. Durch seine außergewöhnliche Leistung, effiziente Ressourcennutzung und Zugänglichkeit hat es das Potenzial, den Zugang zu leistungsstarken KI-Werkzeugen demokratisieren und die Forschung und Innovation in diesem Bereich beschleunigen.

Während die KI-Landschaft weiterhin wächst, spielen Modelle wie OpenChat 3.5 eine entscheidende Rolle bei der Gestaltung der Zukunft der natürlichen Sprachverarbeitung und KI-gesteuerten Anwendungen. Durch die Unterstützung von Open-Source-Initiativen und die Zusammenarbeit mit der globalen KI-Gemeinschaft können wir neue Möglichkeiten erschließen und die Entwicklung noch fortschrittlicherer und leistungsfähigerer Sprachmodelle vorantreiben.

Möchten Sie die neuesten LLM-Nachrichten erfahren? Schauen Sie sich das aktuelle LLM-Ranking an!

Mistral AI enthüllt bahnbrechendes 8x22B Moe-Modell: Eine neue Ära in der Open-Source-KI OpenDevin: Die Open-Source-Alternative zu DevIn AI