OpenChat 3.5: 業界大手を凌駕する、オープンソースのLLM
Published on
OpenChat 3.5は、OpenChatチームが開発した画期的なオープンソースの言語モデルです。わずか70億パラメータで、ChatGPTやGrokなどの業界トップクラスのモデルと匹敵するか、それを凌駕する驚くべきパフォーマンスを実現しています。OpenChat 3.5が際立つのは、専有ライセンスの制約なく、開発者や研究者がその機能を活用できるオープンソースのアクセシビリティにあります。
最新のLLMニュースを知りたいですか? 最新のLLMランキングをチェックしましょう!
OpenChat 3.5の主要な機能
-
C-RLFTによる効率的な学習: OpenChat 3.5は、オフラインの強化学習に着想を得たConditioned Reinforcement Learning from Feedback (C-RLFT)を使って学習されています。この手法により、明示的な好みのラベルなしでも、混在する品質のデータから効果的に学習できます。
-
パラメータ数が少ないにも関わらずの高パフォーマンス: わずか70億パラメータにもかかわらず、OpenChat 3.5は、はるかに多くのパラメータを持つChatGPTやGrokなどのモデルと同等以上のパフォーマンスを発揮します。
-
アクセシブルなデプロイ: OpenChat 3.5は、RTX 3090などのコンシューマ向けGPUでも実行できるため、リソース集約的な専有モデルに比べて、開発者や研究者がより手軽に利用できます。- 多様な機能: OpenChat 3.5は汎用モデルとして優れており、プログラミング、質問回答、言語理解など、幅広い分野でstrong な性能を発揮しています。
ベンチマーク結果
OpenChat 3.5は様々なベンチマークで印象的な結果を示し、トップクラスのオープンソース言語モデルとしての地位を確立しています。以下に注目すべきベンチマーク比較を示します:
モデル | パラメータ | 平均 | MMLU | HumanEval | MATH | GSM8k |
---|---|---|---|---|---|---|
OpenChat-3.5-0106 | 7B | 61.0 | 65.8 | 71.3 | 29.3 | 77.4 |
OpenChat-3.5-1210 | 7B | 60.1 | 65.3 | 68.9 | 28.9 | 77.3 |
OpenChat-3.5 | 7B | 56.4 | 64.3 | 55.5 | 28.6 | 77.3 |
Grok-0 | 33B | 44.5 | 65.7 | 39.7 | 15.7 | 56.8 |
Grok-1 | ???B | 55.8 | 73.0 | 63.2 | 23.9 | 62.9 |
ChatGPT (2023年3月) | ???B | ??? | 70.0 | 63.0 | ??? | 75.0 |
表から明らかなように、OpenChat 3.5はGrok-0 (33Bパラメータ)を全てのベンチマークで上回り、Grok-1 (不明なパラメータ数)を平均値と3つのベンチマークで上回っています。また、HumanEvalとGSM8kでは、はるかに少ないパラメータ数にもかかわらず、ChatGPT (2023年3月版)と同等以上の結果を達成しています。
Ollama を使ったOpenChat 3.5のローカル実行
OpenChat 3.5の大きな利点の1つは、Ollamaなどのツールを使ってローカルで実行できることです。以下にステップバイステップのガイドを示します:
-
以下のコマンドでOllamaをインストールします:
curl -fsSL https://ollama.com/install.sh | sh
-
Ollamaコマンドを使ってOpenChat 3.5モデルをダウンロードします:
ollama run openchat
-
Ollamaサーバーを起動します:
./ollama serve
-
別のシェルで、OpenChat 3.5モデルを実行します:
./ollama run openchat
-
モデルと対話します。Ollama REST APIまたは以下のような互換性のあるユーザーインターフェイスを使用してください:
- LibreChat
- Bionic GPT
- Enchanted (macOS ネイティブ)
- HTML UI
- Saddle
- Chatbot UI
Ollama REST APIを使用してテキストを生成する例は以下のとおりです:
# 'openchat'モデルを使用して'Why is the sky blue?'というプロンプトでテキストを生成する
curl http://localhost:11434/api/generate -d '{
"model": "openchat",
"prompt": "Why is the sky blue?"
}'
チャットのようなやり取りを行う例は以下のとおりです:
# 'openchat'モデルを使用して'Why is the sky blue?'というユーザーメッセージに応答する
curl http://localhost:11434/api/chat -d '{
"model": "openchat",
"messages": [
{
"role": "user",
"content": "Why is the sky blue?"
}
]
}'
これらの手順に従えば、OpenChat 3.5をローカルで簡単に実行し、その優れた機能を直接体験できます。
潜在的な用途と影響
OpenChat 3.5は、開発者や研究者が利用できる高性能なオープンソースの言語モデルを提供することで、AIの分野を革新する可能性があります。主な用途は以下のとおりです:
- コーディングアシスト: HumanEvalなどのコーディングベンチマークで優れた性能を発揮するため、開発者の生産性向上に役立ちます。
- 質問応答: MMLU やGSM8kなどのベンチマークで高い精度を示すため、幅広い質問に対する正確な回答が可能です。
- 言語理解: 言語理解タスクでの高い性能から、感情分析、テキスト分類、固有表現抽出などに活用できます。
- 研究と革新: 独占的なモデルに代わる選択肢を提供することで、研究者が新しいアイデアを探索し、言語モデルの可能性を広げることができます。
結論
OpenChat 3.5は、オープンソースの言語モデルの発展において重要なマイルストーンを示しています。優れた性能、効率的なリソース使用、そして誰もが利用できるアクセシビリティを備えており、AIの未来に大きな影響を与えるでしょう。 これは強力な AI ツールへのアクセスを民主化し、この分野の研究とイノベーションを加速する可能性を秘めています。
AI の景観が継続的に進化する中で、OpenChat 3.5 のようなモデルは自然言語処理と AI ドリブンのアプリケーションの未来を形作る重要な役割を果たすでしょう。オープンソースの取り組みを受け入れ、グローバルな AI コミュニティと協力することで、さらに高度で優れた言語モデルの開発を推進することができます。
.最新の LLM ニュースを学びたいですか? 最新の LLM リーダーボードをチェックしてください!