OpenChat 3.5: O LLM de código aberto que supera gigantes da indústria
Published on
O OpenChat 3.5 é um modelo de linguagem de código aberto inovador desenvolvido pela equipe do OpenChat. Com apenas 7 bilhões de parâmetros, ele alcança um desempenho notável que rivaliza ou supera os modelos líderes do setor, como o ChatGPT e o Grok. O que diferencia o OpenChat 3.5 é seu compromisso com a acessibilidade de código aberto, permitindo que desenvolvedores e pesquisadores aproveitem suas capacidades sem as restrições de licenças proprietárias.
Quer ficar atualizado com as novidades sobre LLM? Confira a classificação LLM mais recente!
Principais Características do OpenChat 3.5
-
Treinamento Eficiente com C-RLFT: O OpenChat 3.5 é treinado usando o Aprendizado por Reforço Condicionado a partir de Retroalimentação (C-RLFT), uma técnica inspirada no aprendizado por reforço offline. Essa abordagem permite que o modelo aprenda de forma eficaz a partir de dados mistos de qualidade sem rótulos de preferência explícitos.
-
Desempenho Excepcional com Menos Parâmetros: Apesar de ter apenas 7 bilhões de parâmetros, o OpenChat 3.5 oferece um desempenho comparável ou superior a modelos com significativamente mais parâmetros, como o ChatGPT e o Grok.
-
Implantação Acessível: O OpenChat 3.5 pode ser executado em GPUs de consumo, como a RTX 3090, tornando-o mais acessível a desenvolvedores e pesquisadores em comparação com modelos proprietários que exigem muitos recursos.
-
Capacidades Versáteis: O OpenChat 3.5 se destaca como um modelo generalista, demonstrando um excelente desempenho em uma ampla gama de tarefas, incluindo codificação, perguntas e respostas, e compreensão de linguagem.
Resultados de Referência
O OpenChat 3.5 demonstrou resultados impressionantes em vários benchmarks, consolidando sua posição como um modelo de linguagem de código aberto de alto desempenho. Aqui estão algumas comparações de benchmark notáveis:
Modelo | Parâmetros | Média | MMLU | Avaliação Humana | MATH | GSM8k |
---|---|---|---|---|---|---|
OpenChat-3.5-0106 | 7B | 61.0 | 65.8 | 71.3 | 29.3 | 77.4 |
OpenChat-3.5-1210 | 7B | 60.1 | 65.3 | 68.9 | 28.9 | 77.3 |
OpenChat-3.5 | 7B | 56.4 | 64.3 | 55.5 | 28.6 | 77.3 |
Grok-0 | 33B | 44.5 | 65.7 | 39.7 | 15.7 | 56.8 |
Grok-1 | ???B | 55.8 | 73.0 | 63.2 | 23.9 | 62.9 |
ChatGPT (Março 2023) | ???B | ??? | 70.0 | 63.0 | ??? | 75.0 |
Como evidente na tabela, o OpenChat 3.5 supera o Grok-0 (33B parâmetros) em todos os quatro benchmarks e supera o Grok-1 (número de parâmetros desconhecido) em média e em 3 dos 4 benchmarks. Ele também alcança resultados comparáveis ou melhores que o ChatGPT (versão de março de 2023) em áreas-chave como Avaliação Humana e GSM8k, apesar de ter significativamente menos parâmetros.
Executando o OpenChat 3.5 Localmente com Ollama
Uma das principais vantagens do OpenChat 3.5 é a possibilidade de executá-lo localmente usando ferramentas como o Ollama. Aqui está um guia passo a passo:
-
Instale o Ollama executando o seguinte comando:
curl -fsSL https://ollama.com/install.sh | sh
-
Baixe o modelo OpenChat 3.5 usando o comando do Ollama:
ollama run openchat
-
Inicie o servidor Ollama:
./ollama serve
-
Em uma shell separada, execute o modelo OpenChat 3.5:
./ollama run openchat
-
Interaja com o modelo usando a API REST do Ollama ou uma das interfaces de usuário compatíveis, como:
- LibreChat
- Bionic GPT
- Enchanted (nativo do macOS)
- UI HTML
- Saddle
- Chatbot UI
Aqui está um exemplo de como gerar texto usando a API REST do Ollama:
curl http://localhost:11434/api/generate -d '{
"model": "openchat",
"prompt": "Por que o céu é azul?"
}'
E aqui está como participar de uma interação semelhante a um chat:
curl http://localhost:11434/api/chat -d '{
"model": "openchat",
"messages": [
{
"role": "user",
"content": "Por que o céu é azul?"
}
]
}'
Ao seguir essas etapas, você pode executar facilmente o OpenChat 3.5 localmente e experimentar suas impressionantes capacidades em primeira mão.
Aplicações Potenciais e Impacto
O OpenChat 3.5 tem o potencial de revolucionar o cenário de IA, fornecendo um modelo de linguagem de código aberto altamente capaz e acessível a desenvolvedores e pesquisadores em todo o mundo. Algumas aplicações potenciais incluem:
-
Assistência em Codificação: Com seu forte desempenho em benchmarks de codificação, como Avaliação Humana, o OpenChat 3.5 pode servir como um poderoso assistente de codificação, ajudando os desenvolvedores a escrever código mais eficiente e sem erros.
-
Perguntas e Respostas: O desempenho excepcional do OpenChat 3.5 em benchmarks como MMLU e GSM8k demonstra sua capacidade de fornecer respostas precisas e informativas a uma ampla gama de perguntas.
-
Compreensão de Linguagem: O forte desempenho do modelo em tarefas de compreensão de linguagem o torna adequado para aplicações como análise de sentimentos, classificação de texto e reconhecimento de entidades nomeadas.
-
Pesquisa e Inovação: Ao fornecer uma alternativa de código aberto para modelos proprietários, o OpenChat 3.5 permite que os pesquisadores explorem novas ideias e empurrem os limites do que é possível com modelos de linguagem.
Conclusão
OpenChat 3.5 representa uma etapa significativa no desenvolvimento de modelos de linguagem de código aberto. Com seu desempenho excepcional, uso eficiente de recursos e acessibilidade, ele tem o potencial de democratizar o acesso a ferramentas poderosas de IA e acelerar a pesquisa e inovação no campo.
À medida que o cenário de IA continua a evoluir, modelos como o OpenChat 3.5 desempenharão um papel crucial na moldagem do futuro do processamento de linguagem natural e aplicativos impulsionados por IA. Ao abraçar iniciativas de código aberto e colaborar com a comunidade global de IA, podemos desbloquear novas possibilidades e impulsionar o desenvolvimento de modelos de linguagem ainda mais avançados e capazes.
Quer saber das últimas notícias do LLM? Confira a última classificação do LLM!