OpenChat 3.5: El LLM de Código Abierto que Supera a los Gigantes de la Industria
Published on
OpenChat 3.5 es un revolucionario modelo de lenguaje de código abierto desarrollado por el equipo de OpenChat. Con solo 7 mil millones de parámetros, logra un rendimiento notable que rivaliza o supera a los modelos líderes de la industria como ChatGPT y Grok. Lo que distingue a OpenChat 3.5 es su compromiso con la accesibilidad de código abierto, lo que permite a los desarrolladores e investigadores aprovechar sus capacidades sin las limitaciones de las licencias propietarias.
¿Quiere conocer las últimas noticias sobre LLM? ¡Consulte la última clasificación LLM!
Características clave de OpenChat 3.5
-
Entrenamiento eficiente con C-RLFT: OpenChat 3.5 se entrena utilizando el Aprendizaje por Reforzamiento Condicionado a partir de Comentarios (C-RLFT), una técnica inspirada en el aprendizaje por refuerzo fuera de línea. Este enfoque permite que el modelo aprenda de manera efectiva a partir de datos de calidad mixta sin etiquetas de preferencia explícitas.
-
Rendimiento excepcional con menos parámetros: A pesar de tener solo 7 mil millones de parámetros, OpenChat 3.5 ofrece un rendimiento comparable o mejor que modelos con muchos más parámetros, como ChatGPT y Grok.
-
Implementación accesible: OpenChat 3.5 se puede ejecutar en tarjetas gráficas de consumo como la RTX 3090, lo que lo hace más accesible para desarrolladores e investigadores en comparación con los modelos propietarios que requieren muchos recursos.
-
Capacidades versátiles: OpenChat 3.5 se destaca como un modelo generalista, demostrando un rendimiento sólido en una amplia gama de tareas, incluyendo programación, respuesta a preguntas y comprensión del lenguaje.
Resultados de referencia
OpenChat 3.5 ha demostrado resultados impresionantes en varias pruebas de referencia, solidificando su posición como un modelo de lenguaje de código abierto de alto rendimiento. Estas son algunas comparaciones destacadas:
Modelo | Parámetros | Promedio | MMLU | EvaluaciónHumana | MATH | GSM8k |
---|---|---|---|---|---|---|
OpenChat-3.5-0106 | 7B | 61.0 | 65.8 | 71.3 | 29.3 | 77.4 |
OpenChat-3.5-1210 | 7B | 60.1 | 65.3 | 68.9 | 28.9 | 77.3 |
OpenChat-3.5 | 7B | 56.4 | 64.3 | 55.5 | 28.6 | 77.3 |
Grok-0 | 33B | 44.5 | 65.7 | 39.7 | 15.7 | 56.8 |
Grok-1 | ???B | 55.8 | 73.0 | 63.2 | 23.9 | 62.9 |
ChatGPT (Marzo 2023) | ???B | ??? | 70.0 | 63.0 | ??? | 75.0 |
Como se puede ver en la tabla, OpenChat 3.5 supera a Grok-0 (33B parámetros) en las cuatro pruebas de referencia y supera a Grok-1 (parámetros desconocidos) en promedio y en 3 de las 4 pruebas. También logra resultados comparables o mejores que ChatGPT (versión de marzo de 2023) en áreas clave como EvaluaciónHumana y GSM8k, a pesar de tener significativamente menos parámetros.
Ejecución local de OpenChat 3.5 con Ollama
Una de las principales ventajas de OpenChat 3.5 es la capacidad de ejecutarlo localmente utilizando herramientas como Ollama. Aquí tienes una guía paso a paso:
-
Instale Ollama ejecutando el siguiente comando:
curl -fsSL https://ollama.com/install.sh | sh
-
Descargue el modelo OpenChat 3.5 usando el comando Ollama:
ollama run openchat
-
Inicie el servidor de Ollama:
./ollama serve
-
En una terminal separada, ejecute el modelo OpenChat 3.5:
./ollama run openchat
-
Interactúe con el modelo utilizando la API REST de Ollama o una de las interfaces de usuario compatibles, como:
- LibreChat
- Bionic GPT
- Enchanted (nativo de macOS)
- Interfaz de usuario HTML
- Saddle
- Interfaz de chatbot
Aquí hay un ejemplo de cómo generar texto utilizando la API REST de Ollama:
curl http://localhost:11434/api/generate -d '{
"model": "openchat",
"prompt": "¿Por qué el cielo es azul?"
}'
Y aquí hay instrucciones para tener una interacción similar a un chat:
curl http://localhost:11434/api/chat -d '{
"model": "openchat",
"messages": [
{
"role": "user",
"content": "¿Por qué el cielo es azul?"
}
]
}'
Siguiendo estos pasos, puede ejecutar fácilmente OpenChat 3.5 localmente y experimentar con sus impresionantes capacidades de primera mano.
Potenciales Aplicaciones e Impacto
OpenChat 3.5 tiene el potencial de revolucionar el panorama de la IA al proporcionar un modelo de lenguaje de código abierto altamente capaz que es accesible para desarrolladores e investigadores de todo el mundo. Algunas posibles aplicaciones incluyen:
-
Asistencia en Programación: Con su sólido rendimiento en pruebas de programación como EvaluaciónHumana, OpenChat 3.5 puede servir como un potente asistente de programación, ayudando a los desarrolladores a escribir código más eficiente y sin errores.
-
Respuesta a Preguntas: El rendimiento excepcional de OpenChat 3.5 en pruebas como MMLU y GSM8k demuestra su capacidad para proporcionar respuestas precisas e informativas a una amplia gama de preguntas.
-
Comprensión del Lenguaje: El sólido rendimiento del modelo en tareas de comprensión del lenguaje lo hace adecuado para aplicaciones como análisis de sentimientos, clasificación de texto y reconocimiento de entidades nombradas.
-
Investigación e Innovación: Al proporcionar una alternativa de código abierto a los modelos propietarios, OpenChat 3.5 permite a los investigadores explorar nuevas ideas y empujar los límites de lo posible con los modelos de lenguaje.
Conclusión
OpenChat 3.5 representa un hito significativo en el desarrollo de modelos de lenguaje de código abierto. Con su rendimiento excepcional, uso eficiente de recursos y accesibilidad, tiene el potencial de democratizar el acceso a poderosas herramientas de IA y acelerar la investigación e innovación en el campo.
A medida que el panorama de la IA continúa evolucionando, modelos como OpenChat 3.5 jugarán un papel crucial en la formación del futuro del procesamiento del lenguaje natural y las aplicaciones impulsadas por la IA. Al adoptar iniciativas de código abierto y colaborar con la comunidad global de IA, podemos desbloquear nuevas posibilidades y impulsar el desarrollo de modelos de lenguaje aún más avanzados y capaces.
¿Quieres conocer las últimas noticias del LLM? ¡Consulta la última clasificación del LLM!