Want to Become a Sponsor? Contact Us Now!🎉

LLM
OpenChat 3.5: O LLM de código aberto que supera gigantes da indústria

OpenChat 3.5: O LLM de código aberto que supera gigantes da indústria

Published on

O OpenChat 3.5 é um poderoso modelo de linguagem de código aberto que oferece um desempenho excepcional, equiparando-se ou superando modelos proprietários como o ChatGPT e o Grok, ao mesmo tempo em que é acessível a desenvolvedores e pesquisadores. Saiba mais sobre suas principais características, resultados de referência e como executá-lo localmente.

O OpenChat 3.5 é um modelo de linguagem de código aberto inovador desenvolvido pela equipe do OpenChat. Com apenas 7 bilhões de parâmetros, ele alcança um desempenho notável que rivaliza ou supera os modelos líderes do setor, como o ChatGPT e o Grok. O que diferencia o OpenChat 3.5 é seu compromisso com a acessibilidade de código aberto, permitindo que desenvolvedores e pesquisadores aproveitem suas capacidades sem as restrições de licenças proprietárias.

Quer ficar atualizado com as novidades sobre LLM? Confira a classificação LLM mais recente!

Anakin AI - The Ultimate No-Code AI App Builder

Principais Características do OpenChat 3.5

  • Treinamento Eficiente com C-RLFT: O OpenChat 3.5 é treinado usando o Aprendizado por Reforço Condicionado a partir de Retroalimentação (C-RLFT), uma técnica inspirada no aprendizado por reforço offline. Essa abordagem permite que o modelo aprenda de forma eficaz a partir de dados mistos de qualidade sem rótulos de preferência explícitos.

  • Desempenho Excepcional com Menos Parâmetros: Apesar de ter apenas 7 bilhões de parâmetros, o OpenChat 3.5 oferece um desempenho comparável ou superior a modelos com significativamente mais parâmetros, como o ChatGPT e o Grok.

  • Implantação Acessível: O OpenChat 3.5 pode ser executado em GPUs de consumo, como a RTX 3090, tornando-o mais acessível a desenvolvedores e pesquisadores em comparação com modelos proprietários que exigem muitos recursos.

  • Capacidades Versáteis: O OpenChat 3.5 se destaca como um modelo generalista, demonstrando um excelente desempenho em uma ampla gama de tarefas, incluindo codificação, perguntas e respostas, e compreensão de linguagem.

Resultados de Referência

O OpenChat 3.5 demonstrou resultados impressionantes em vários benchmarks, consolidando sua posição como um modelo de linguagem de código aberto de alto desempenho. Aqui estão algumas comparações de benchmark notáveis:

ModeloParâmetrosMédiaMMLUAvaliação HumanaMATHGSM8k
OpenChat-3.5-01067B61.065.871.329.377.4
OpenChat-3.5-12107B60.165.368.928.977.3
OpenChat-3.57B56.464.355.528.677.3
Grok-033B44.565.739.715.756.8
Grok-1???B55.873.063.223.962.9
ChatGPT (Março 2023)???B???70.063.0???75.0

Como evidente na tabela, o OpenChat 3.5 supera o Grok-0 (33B parâmetros) em todos os quatro benchmarks e supera o Grok-1 (número de parâmetros desconhecido) em média e em 3 dos 4 benchmarks. Ele também alcança resultados comparáveis ou melhores que o ChatGPT (versão de março de 2023) em áreas-chave como Avaliação Humana e GSM8k, apesar de ter significativamente menos parâmetros.

Executando o OpenChat 3.5 Localmente com Ollama

Uma das principais vantagens do OpenChat 3.5 é a possibilidade de executá-lo localmente usando ferramentas como o Ollama. Aqui está um guia passo a passo:

  1. Instale o Ollama executando o seguinte comando:

    curl -fsSL https://ollama.com/install.sh | sh
  2. Baixe o modelo OpenChat 3.5 usando o comando do Ollama:

    ollama run openchat
  3. Inicie o servidor Ollama:

    ./ollama serve
  4. Em uma shell separada, execute o modelo OpenChat 3.5:

    ./ollama run openchat
  5. Interaja com o modelo usando a API REST do Ollama ou uma das interfaces de usuário compatíveis, como:

    • LibreChat
    • Bionic GPT
    • Enchanted (nativo do macOS)
    • UI HTML
    • Saddle
    • Chatbot UI

Aqui está um exemplo de como gerar texto usando a API REST do Ollama:

curl http://localhost:11434/api/generate -d '{
  "model": "openchat",
  "prompt": "Por que o céu é azul?"
}'

E aqui está como participar de uma interação semelhante a um chat:

curl http://localhost:11434/api/chat -d '{
  "model": "openchat",
  "messages": [
    {
      "role": "user",
      "content": "Por que o céu é azul?"
    }
  ]
}'

Ao seguir essas etapas, você pode executar facilmente o OpenChat 3.5 localmente e experimentar suas impressionantes capacidades em primeira mão.

Aplicações Potenciais e Impacto

O OpenChat 3.5 tem o potencial de revolucionar o cenário de IA, fornecendo um modelo de linguagem de código aberto altamente capaz e acessível a desenvolvedores e pesquisadores em todo o mundo. Algumas aplicações potenciais incluem:

  • Assistência em Codificação: Com seu forte desempenho em benchmarks de codificação, como Avaliação Humana, o OpenChat 3.5 pode servir como um poderoso assistente de codificação, ajudando os desenvolvedores a escrever código mais eficiente e sem erros.

  • Perguntas e Respostas: O desempenho excepcional do OpenChat 3.5 em benchmarks como MMLU e GSM8k demonstra sua capacidade de fornecer respostas precisas e informativas a uma ampla gama de perguntas.

  • Compreensão de Linguagem: O forte desempenho do modelo em tarefas de compreensão de linguagem o torna adequado para aplicações como análise de sentimentos, classificação de texto e reconhecimento de entidades nomeadas.

  • Pesquisa e Inovação: Ao fornecer uma alternativa de código aberto para modelos proprietários, o OpenChat 3.5 permite que os pesquisadores explorem novas ideias e empurrem os limites do que é possível com modelos de linguagem.

Conclusão

OpenChat 3.5 representa uma etapa significativa no desenvolvimento de modelos de linguagem de código aberto. Com seu desempenho excepcional, uso eficiente de recursos e acessibilidade, ele tem o potencial de democratizar o acesso a ferramentas poderosas de IA e acelerar a pesquisa e inovação no campo.

À medida que o cenário de IA continua a evoluir, modelos como o OpenChat 3.5 desempenharão um papel crucial na moldagem do futuro do processamento de linguagem natural e aplicativos impulsionados por IA. Ao abraçar iniciativas de código aberto e colaborar com a comunidade global de IA, podemos desbloquear novas possibilidades e impulsionar o desenvolvimento de modelos de linguagem ainda mais avançados e capazes.

Quer saber das últimas notícias do LLM? Confira a última classificação do LLM!

Anakin AI - The Ultimate No-Code AI App Builder