Want to Become a Sponsor? Contact Us Now!🎉

LLM
OpenChat 3.5: 業界大手を凌駕する、オープンソースのLLM

OpenChat 3.5: 業界大手を凌駕する、オープンソースのLLM

Published on

OpenChat 3.5は、ChatGPTやGrokなどの専有モデルと同等以上のパフォーマンスを発揮する強力なオープンソースの言語モデルです。開発者や研究者が利用できるアクセシビリティを備えています。その主要な機能、ベンチマーク結果、ローカルでの実行方法について学びましょう。

OpenChat 3.5は、OpenChatチームが開発した画期的なオープンソースの言語モデルです。わずか70億パラメータで、ChatGPTやGrokなどの業界トップクラスのモデルと匹敵するか、それを凌駕する驚くべきパフォーマンスを実現しています。OpenChat 3.5が際立つのは、専有ライセンスの制約なく、開発者や研究者がその機能を活用できるオープンソースのアクセシビリティにあります。

最新のLLMニュースを知りたいですか? 最新のLLMランキングをチェックしましょう!

Anakin AI - The Ultimate No-Code AI App Builder

OpenChat 3.5の主要な機能

  • C-RLFTによる効率的な学習: OpenChat 3.5は、オフラインの強化学習に着想を得たConditioned Reinforcement Learning from Feedback (C-RLFT)を使って学習されています。この手法により、明示的な好みのラベルなしでも、混在する品質のデータから効果的に学習できます。

  • パラメータ数が少ないにも関わらずの高パフォーマンス: わずか70億パラメータにもかかわらず、OpenChat 3.5は、はるかに多くのパラメータを持つChatGPTやGrokなどのモデルと同等以上のパフォーマンスを発揮します。

  • アクセシブルなデプロイ: OpenChat 3.5は、RTX 3090などのコンシューマ向けGPUでも実行できるため、リソース集約的な専有モデルに比べて、開発者や研究者がより手軽に利用できます。- 多様な機能: OpenChat 3.5は汎用モデルとして優れており、プログラミング、質問回答、言語理解など、幅広い分野でstrong な性能を発揮しています。

ベンチマーク結果

OpenChat 3.5は様々なベンチマークで印象的な結果を示し、トップクラスのオープンソース言語モデルとしての地位を確立しています。以下に注目すべきベンチマーク比較を示します:

モデルパラメータ平均MMLUHumanEvalMATHGSM8k
OpenChat-3.5-01067B61.065.871.329.377.4
OpenChat-3.5-12107B60.165.368.928.977.3
OpenChat-3.57B56.464.355.528.677.3
Grok-033B44.565.739.715.756.8
Grok-1???B55.873.063.223.962.9
ChatGPT (2023年3月)???B???70.063.0???75.0

表から明らかなように、OpenChat 3.5はGrok-0 (33Bパラメータ)を全てのベンチマークで上回り、Grok-1 (不明なパラメータ数)を平均値と3つのベンチマークで上回っています。また、HumanEvalとGSM8kでは、はるかに少ないパラメータ数にもかかわらず、ChatGPT (2023年3月版)と同等以上の結果を達成しています。

Ollama を使ったOpenChat 3.5のローカル実行

OpenChat 3.5の大きな利点の1つは、Ollamaなどのツールを使ってローカルで実行できることです。以下にステップバイステップのガイドを示します:

  1. 以下のコマンドでOllamaをインストールします:

    curl -fsSL https://ollama.com/install.sh | sh
  2. Ollamaコマンドを使ってOpenChat 3.5モデルをダウンロードします:

    ollama run openchat
  3. Ollamaサーバーを起動します:

    ./ollama serve
  4. 別のシェルで、OpenChat 3.5モデルを実行します:

    ./ollama run openchat
  5. モデルと対話します。Ollama REST APIまたは以下のような互換性のあるユーザーインターフェイスを使用してください:

    • LibreChat
    • Bionic GPT
    • Enchanted (macOS ネイティブ)
    • HTML UI
    • Saddle
    • Chatbot UI

Ollama REST APIを使用してテキストを生成する例は以下のとおりです:

# 'openchat'モデルを使用して'Why is the sky blue?'というプロンプトでテキストを生成する
curl http://localhost:11434/api/generate -d '{
  "model": "openchat",
  "prompt": "Why is the sky blue?"
}'

チャットのようなやり取りを行う例は以下のとおりです:

# 'openchat'モデルを使用して'Why is the sky blue?'というユーザーメッセージに応答する
curl http://localhost:11434/api/chat -d '{
  "model": "openchat",
  "messages": [
    {
      "role": "user",
      "content": "Why is the sky blue?"
    }
  ]
}'

これらの手順に従えば、OpenChat 3.5をローカルで簡単に実行し、その優れた機能を直接体験できます。

潜在的な用途と影響

OpenChat 3.5は、開発者や研究者が利用できる高性能なオープンソースの言語モデルを提供することで、AIの分野を革新する可能性があります。主な用途は以下のとおりです:

  • コーディングアシスト: HumanEvalなどのコーディングベンチマークで優れた性能を発揮するため、開発者の生産性向上に役立ちます。
  • 質問応答: MMLU やGSM8kなどのベンチマークで高い精度を示すため、幅広い質問に対する正確な回答が可能です。
  • 言語理解: 言語理解タスクでの高い性能から、感情分析、テキスト分類、固有表現抽出などに活用できます。
  • 研究と革新: 独占的なモデルに代わる選択肢を提供することで、研究者が新しいアイデアを探索し、言語モデルの可能性を広げることができます。

結論

OpenChat 3.5は、オープンソースの言語モデルの発展において重要なマイルストーンを示しています。優れた性能、効率的なリソース使用、そして誰もが利用できるアクセシビリティを備えており、AIの未来に大きな影響を与えるでしょう。 これは強力な AI ツールへのアクセスを民主化し、この分野の研究とイノベーションを加速する可能性を秘めています。

AI の景観が継続的に進化する中で、OpenChat 3.5 のようなモデルは自然言語処理と AI ドリブンのアプリケーションの未来を形作る重要な役割を果たすでしょう。オープンソースの取り組みを受け入れ、グローバルな AI コミュニティと協力することで、さらに高度で優れた言語モデルの開発を推進することができます。

最新の LLM ニュースを学びたいですか? 最新の LLM リーダーボードをチェックしてください!

Anakin AI - The Ultimate No-Code AI App Builder
.