OpenChat 3.5: 業界大手を凌駕する、オープンソースのLLM

Name: Jennie Rose

Published on 2024/4/30

OpenChat 3.5は、ChatGPTやGrokなどの専有モデルと同等以上のパフォーマンスを発揮する強力なオープンソースの言語モデルです。開発者や研究者が利用できるアクセシビリティを備えています。その主要な機能、ベンチマーク結果、ローカルでの実行方法について学びましょう。

OpenChat 3.5は、OpenChatチームが開発した画期的なオープンソースの言語モデルです。わずか70億パラメータで、ChatGPTやGrokなどの業界トップクラスのモデルと匹敵するか、それを凌駕する驚くべきパフォーマンスを実現しています。OpenChat 3.5が際立つのは、専有ライセンスの制約なく、開発者や研究者がその機能を活用できるオープンソースのアクセシビリティにあります。

最新のLLMニュースを知りたいですか? 最新のLLMランキングをチェックしましょう!

OpenChat 3.5の主要な機能

C-RLFTによる効率的な学習: OpenChat 3.5は、オフラインの強化学習に着想を得たConditioned Reinforcement Learning from Feedback (C-RLFT)を使って学習されています。この手法により、明示的な好みのラベルなしでも、混在する品質のデータから効果的に学習できます。
パラメータ数が少ないにも関わらずの高パフォーマンス: わずか70億パラメータにもかかわらず、OpenChat 3.5は、はるかに多くのパラメータを持つChatGPTやGrokなどのモデルと同等以上のパフォーマンスを発揮します。
アクセシブルなデプロイ: OpenChat 3.5は、RTX 3090などのコンシューマ向けGPUでも実行できるため、リソース集約的な専有モデルに比べて、開発者や研究者がより手軽に利用できます。- 多様な機能: OpenChat 3.5は汎用モデルとして優れており、プログラミング、質問回答、言語理解など、幅広い分野でstrong な性能を発揮しています。

ベンチマーク結果

OpenChat 3.5は様々なベンチマークで印象的な結果を示し、トップクラスのオープンソース言語モデルとしての地位を確立しています。以下に注目すべきベンチマーク比較を示します:

モデル	パラメータ	平均	MMLU	HumanEval	MATH	GSM8k
OpenChat-3.5-0106	7B	61.0	65.8	71.3	29.3	77.4
OpenChat-3.5-1210	7B	60.1	65.3	68.9	28.9	77.3
OpenChat-3.5	7B	56.4	64.3	55.5	28.6	77.3
Grok-0	33B	44.5	65.7	39.7	15.7	56.8
Grok-1	???B	55.8	73.0	63.2	23.9	62.9
ChatGPT (2023年3月)	???B	???	70.0	63.0	???	75.0

表から明らかなように、OpenChat 3.5はGrok-0 (33Bパラメータ)を全てのベンチマークで上回り、Grok-1 (不明なパラメータ数)を平均値と3つのベンチマークで上回っています。また、HumanEvalとGSM8kでは、はるかに少ないパラメータ数にもかかわらず、ChatGPT (2023年3月版)と同等以上の結果を達成しています。

Ollama を使ったOpenChat 3.5のローカル実行

OpenChat 3.5の大きな利点の1つは、Ollamaなどのツールを使ってローカルで実行できることです。以下にステップバイステップのガイドを示します:

以下のコマンドでOllamaをインストールします:
```
curl -fsSL https://ollama.com/install.sh | sh
```
Ollamaコマンドを使ってOpenChat 3.5モデルをダウンロードします:
```
ollama run openchat
```
Ollamaサーバーを起動します:
```
./ollama serve
```
別のシェルで、OpenChat 3.5モデルを実行します:
```
./ollama run openchat
```
モデルと対話します。Ollama REST APIまたは以下のような互換性のあるユーザーインターフェイスを使用してください:
- LibreChat
- Bionic GPT
- Enchanted (macOS ネイティブ)
- HTML UI
- Saddle
- Chatbot UI

Ollama REST APIを使用してテキストを生成する例は以下のとおりです:

# 'openchat'モデルを使用して'Why is the sky blue?'というプロンプトでテキストを生成する
curl http://localhost:11434/api/generate -d '{
  "model": "openchat",
  "prompt": "Why is the sky blue?"
}'

チャットのようなやり取りを行う例は以下のとおりです:

# 'openchat'モデルを使用して'Why is the sky blue?'というユーザーメッセージに応答する
curl http://localhost:11434/api/chat -d '{
  "model": "openchat",
  "messages": [
    {
      "role": "user",
      "content": "Why is the sky blue?"
    }
  ]
}'

これらの手順に従えば、OpenChat 3.5をローカルで簡単に実行し、その優れた機能を直接体験できます。

潜在的な用途と影響

OpenChat 3.5は、開発者や研究者が利用できる高性能なオープンソースの言語モデルを提供することで、AIの分野を革新する可能性があります。主な用途は以下のとおりです:

コーディングアシスト: HumanEvalなどのコーディングベンチマークで優れた性能を発揮するため、開発者の生産性向上に役立ちます。
質問応答: MMLU やGSM8kなどのベンチマークで高い精度を示すため、幅広い質問に対する正確な回答が可能です。
言語理解: 言語理解タスクでの高い性能から、感情分析、テキスト分類、固有表現抽出などに活用できます。
研究と革新: 独占的なモデルに代わる選択肢を提供することで、研究者が新しいアイデアを探索し、言語モデルの可能性を広げることができます。

結論

OpenChat 3.5は、オープンソースの言語モデルの発展において重要なマイルストーンを示しています。優れた性能、効率的なリソース使用、そして誰もが利用できるアクセシビリティを備えており、AIの未来に大きな影響を与えるでしょう。これは強力な AI ツールへのアクセスを民主化し、この分野の研究とイノベーションを加速する可能性を秘めています。

AI の景観が継続的に進化する中で、OpenChat 3.5 のようなモデルは自然言語処理と AI ドリブンのアプリケーションの未来を形作る重要な役割を果たすでしょう。オープンソースの取り組みを受け入れ、グローバルな AI コミュニティと協力することで、さらに高度で優れた言語モデルの開発を推進することができます。

最新の LLM ニュースを学びたいですか? 最新の LLM リーダーボードをチェックしてください!

ミストラルAI、画期的な8x22Bモデルを発表：オープンソースAIの新時代 OpenDevin: OpenDevin - オープンソースのDevIn AIの代替案