OpenChat 3.5: O LLM de código aberto que supera gigantes da indústria

Name: Jennie Rose

Published on 30/04/2024

O OpenChat 3.5 é um poderoso modelo de linguagem de código aberto que oferece um desempenho excepcional, equiparando-se ou superando modelos proprietários como o ChatGPT e o Grok, ao mesmo tempo em que é acessível a desenvolvedores e pesquisadores. Saiba mais sobre suas principais características, resultados de referência e como executá-lo localmente.

O OpenChat 3.5 é um modelo de linguagem de código aberto inovador desenvolvido pela equipe do OpenChat. Com apenas 7 bilhões de parâmetros, ele alcança um desempenho notável que rivaliza ou supera os modelos líderes do setor, como o ChatGPT e o Grok. O que diferencia o OpenChat 3.5 é seu compromisso com a acessibilidade de código aberto, permitindo que desenvolvedores e pesquisadores aproveitem suas capacidades sem as restrições de licenças proprietárias.

Quer ficar atualizado com as novidades sobre LLM? Confira a classificação LLM mais recente!

Principais Características do OpenChat 3.5

Treinamento Eficiente com C-RLFT: O OpenChat 3.5 é treinado usando o Aprendizado por Reforço Condicionado a partir de Retroalimentação (C-RLFT), uma técnica inspirada no aprendizado por reforço offline. Essa abordagem permite que o modelo aprenda de forma eficaz a partir de dados mistos de qualidade sem rótulos de preferência explícitos.
Desempenho Excepcional com Menos Parâmetros: Apesar de ter apenas 7 bilhões de parâmetros, o OpenChat 3.5 oferece um desempenho comparável ou superior a modelos com significativamente mais parâmetros, como o ChatGPT e o Grok.
Implantação Acessível: O OpenChat 3.5 pode ser executado em GPUs de consumo, como a RTX 3090, tornando-o mais acessível a desenvolvedores e pesquisadores em comparação com modelos proprietários que exigem muitos recursos.
Capacidades Versáteis: O OpenChat 3.5 se destaca como um modelo generalista, demonstrando um excelente desempenho em uma ampla gama de tarefas, incluindo codificação, perguntas e respostas, e compreensão de linguagem.

Resultados de Referência

O OpenChat 3.5 demonstrou resultados impressionantes em vários benchmarks, consolidando sua posição como um modelo de linguagem de código aberto de alto desempenho. Aqui estão algumas comparações de benchmark notáveis:

Modelo	Parâmetros	Média	MMLU	Avaliação Humana	MATH	GSM8k
OpenChat-3.5-0106	7B	61.0	65.8	71.3	29.3	77.4
OpenChat-3.5-1210	7B	60.1	65.3	68.9	28.9	77.3
OpenChat-3.5	7B	56.4	64.3	55.5	28.6	77.3
Grok-0	33B	44.5	65.7	39.7	15.7	56.8
Grok-1	???B	55.8	73.0	63.2	23.9	62.9
ChatGPT (Março 2023)	???B	???	70.0	63.0	???	75.0

Como evidente na tabela, o OpenChat 3.5 supera o Grok-0 (33B parâmetros) em todos os quatro benchmarks e supera o Grok-1 (número de parâmetros desconhecido) em média e em 3 dos 4 benchmarks. Ele também alcança resultados comparáveis ou melhores que o ChatGPT (versão de março de 2023) em áreas-chave como Avaliação Humana e GSM8k, apesar de ter significativamente menos parâmetros.

Executando o OpenChat 3.5 Localmente com Ollama

Uma das principais vantagens do OpenChat 3.5 é a possibilidade de executá-lo localmente usando ferramentas como o Ollama. Aqui está um guia passo a passo:

Instale o Ollama executando o seguinte comando:

curl -fsSL https://ollama.com/install.sh | sh

Baixe o modelo OpenChat 3.5 usando o comando do Ollama:
```
ollama run openchat
```
Inicie o servidor Ollama:
```
./ollama serve
```
Em uma shell separada, execute o modelo OpenChat 3.5:
```
./ollama run openchat
```
Interaja com o modelo usando a API REST do Ollama ou uma das interfaces de usuário compatíveis, como:
- LibreChat
- Bionic GPT
- Enchanted (nativo do macOS)
- UI HTML
- Saddle
- Chatbot UI

Aqui está um exemplo de como gerar texto usando a API REST do Ollama:

curl http://localhost:11434/api/generate -d '{
  "model": "openchat",
  "prompt": "Por que o céu é azul?"
}'

E aqui está como participar de uma interação semelhante a um chat:

curl http://localhost:11434/api/chat -d '{
  "model": "openchat",
  "messages": [
    {
      "role": "user",
      "content": "Por que o céu é azul?"
    }
  ]
}'

Ao seguir essas etapas, você pode executar facilmente o OpenChat 3.5 localmente e experimentar suas impressionantes capacidades em primeira mão.

Aplicações Potenciais e Impacto

O OpenChat 3.5 tem o potencial de revolucionar o cenário de IA, fornecendo um modelo de linguagem de código aberto altamente capaz e acessível a desenvolvedores e pesquisadores em todo o mundo. Algumas aplicações potenciais incluem:

Assistência em Codificação: Com seu forte desempenho em benchmarks de codificação, como Avaliação Humana, o OpenChat 3.5 pode servir como um poderoso assistente de codificação, ajudando os desenvolvedores a escrever código mais eficiente e sem erros.
Perguntas e Respostas: O desempenho excepcional do OpenChat 3.5 em benchmarks como MMLU e GSM8k demonstra sua capacidade de fornecer respostas precisas e informativas a uma ampla gama de perguntas.
Compreensão de Linguagem: O forte desempenho do modelo em tarefas de compreensão de linguagem o torna adequado para aplicações como análise de sentimentos, classificação de texto e reconhecimento de entidades nomeadas.
Pesquisa e Inovação: Ao fornecer uma alternativa de código aberto para modelos proprietários, o OpenChat 3.5 permite que os pesquisadores explorem novas ideias e empurrem os limites do que é possível com modelos de linguagem.

Conclusão

OpenChat 3.5 representa uma etapa significativa no desenvolvimento de modelos de linguagem de código aberto. Com seu desempenho excepcional, uso eficiente de recursos e acessibilidade, ele tem o potencial de democratizar o acesso a ferramentas poderosas de IA e acelerar a pesquisa e inovação no campo.

À medida que o cenário de IA continua a evoluir, modelos como o OpenChat 3.5 desempenharão um papel crucial na moldagem do futuro do processamento de linguagem natural e aplicativos impulsionados por IA. Ao abraçar iniciativas de código aberto e colaborar com a comunidade global de IA, podemos desbloquear novas possibilidades e impulsionar o desenvolvimento de modelos de linguagem ainda mais avançados e capazes.

Quer saber das últimas notícias do LLM? Confira a última classificação do LLM!

Mistral AI Revela o Revolucionário Modelo 8x22B Moe: Uma Nova Era em IA de Código Aberto OpenDevin: A Alternativa de Código Aberto para o DevIn AI