OpenLLaMA: Alternativa de código abierto para LLaMA de Meta

Name: Jennie Rose

Published on 30/4/2024

Sumérgete en el mundo de OpenLLaMA, el modelo de lenguaje de código abierto que está revolucionando el mundo tecnológico. Aprende cómo funciona, cómo se compara con LLaMA y por qué es la opción preferida de los ingenieros de prompts.

Bienvenido a la guía definitiva sobre OpenLLaMA, el modelo de lenguaje que está causando sensación tanto en el ámbito de la investigación como en el comercial. Si eres un ingeniero de prompts, desarrollador o simplemente un entusiasta de la tecnología, esta guía es todo lo que necesitas saber sobre OpenLLaMA.

En este artículo completo, profundizaremos en lo que es OpenLLaMA, cómo funciona y cómo se compara con su predecesor, LLaMA. También te proporcionaremos tutoriales prácticos y ejemplos para que puedas comenzar tu viaje con OpenLLaMA. ¡Así que vamos a sumergirnos!

¿Qué es OpenLLaMA?

Definición: OpenLLaMA es un modelo de lenguaje de código abierto desarrollado por OpenLM Research. Está diseñado para ser una alternativa versátil y no restringida a LLaMA, dirigido tanto a aplicaciones de investigación como comerciales.

OpenLLaMA ha sido un cambio de juego en el campo del Procesamiento del Lenguaje Natural (PLN). A diferencia de los modelos de lenguaje tradicionales que suelen tener restricciones en su uso, OpenLLaMA ofrece un nivel de flexibilidad difícil de igualar. Aquí está por qué:

Código abierto: El código base es de acceso libre, lo que te permite ajustar y afinar el modelo según tus necesidades.
Múltiples versiones: OpenLLaMA viene en diferentes tamaños, incluyendo modelos con 3B, 7B y 13B de parámetros, dándote la libertad de elegir el que se adapte a tu proyecto.
Aplicaciones comerciales e investigativas: Ya seas un investigador buscando expandir los límites del PLN o una empresa que busca integrar capacidades avanzadas de lenguaje en tu producto, OpenLLaMA tiene todo cubierto.

¿Cómo funciona OpenLLaMA?

OpenLLaMA opera utilizando un mecanismo basado en prompts, similar a otros grandes modelos de lenguaje como GPT-3. Sin embargo, lo que lo diferencia es su capacidad de ajuste fino. Puedes personalizar el modelo para realizar tareas específicas, ya sea resúmenes de texto, traducciones o incluso generación de código. Aquí tienes una guía paso a paso sobre cómo ajustar finamente OpenLLaMA:

Elige el modelo base: Comienza seleccionando el tamaño del modelo base que se ajuste a tu proyecto. Las opciones disponibles son modelos con 3B, 7B y 13B de parámetros.
Prepara tu conjunto de datos: Reúne los datos que utilizarás para el ajuste fino. Asegúrate de que estén limpios, bien estructurados y relevantes para la tarea en cuestión.
Ajuste fino: Utiliza la API de OpenLLaMA para cargar tu conjunto de datos e iniciar el proceso de ajuste fino. Debes especificar el tipo de tarea y otros parámetros.
Prueba y valida: Una vez que el ajuste fino esté completo, prueba el modelo en un conjunto de datos separado para validar su rendimiento.

Arquitectura de OpenLLaMA

OpenLLaMA, al igual que LLaMA, se basa en la arquitectura del decodificador transformer. Sin embargo, OpenLLaMA ha implementado mejoras específicas:

Pre-normalización de capa: Utiliza normalización de la raíz media cuadrada (RMSNorm) en la entrada de cada bloque de atención, lo que garantiza estabilidad durante el entrenamiento.
Activación MLP: OpenLLaMA utiliza activaciones sigmoidales lineales unitarias (SiLU). En contraste, LLaMA opta por la unidad lineal activada dependiente de puertas (SwiGLU). Esta diferencia permite que los modelos de OpenLLaMA converjan más rápidamente.
Incrustaciones rotativas: Ambos modelos utilizan incrustaciones rotativas en lugar de incrustaciones posicionales absolutas, lo que garantiza longitudes de contexto más largas y resultados de mejor calidad.

Conjunto de datos de entrenamiento de OpenLLaMA

Las versiones secundarias de OpenLLaMA se entrenan con:

Falcon RefinedWeb: Una versión depurada del conjunto de datos web de Common Crawl, que contiene miles de millones de páginas web.
StarCoder: Un conjunto de datos completo de código de programación obtenido de GitHub.
RedPajama: Los modelos utilizan subconjuntos específicos de la colección RedPajama, como Wikipedia, arXiv, libros y StackExchange. En contraste, la primera versión utilizaba toda la colección RedPajama.

Versiones de OpenLLaMA y diferencias de modelos

Hasta agosto de 2023, OpenLLaMA ha lanzado cinco modelos:

Modelos con 3B y 7B de parámetros (1ª versión).
Modelos con 3B, 7B y 13B de parámetros (2ª versión).

Diferencias entre las dos versiones:

Precisión de la tokenización: La segunda versión cuenta con una tokenización mejorada que no fusiona múltiples espacios en blanco, mejorando el rendimiento de generación de código.
Mejora del conjunto de datos de entrenamiento: Las proporciones de contenido en el conjunto de datos de entrenamiento para la segunda versión se han ajustado para obtener mejores resultados de rendimiento.

LLaMA vs. OpenLLaMA, ¿Cuál es la diferencia?

Comparación de referencia entre LLaMA y OpenLLaMA

Modelo	Versión	Parámetros	Tamaño del modelo	Máximo de tokens en el prompt	Capas	Cabezas de atención
OpenLLaMA 7Bv2	2ª	7 mil millones	13.5 GB	2048	32	32
OpenLLaMA 3Bv2	2ª	3 mil millones	6.9 GB	2048	26	32
OpenLLaMA 13B	1ª	13 mil millones	27 GB	2048	60	40
OpenLLaMA 7B	1ª	7 mil millones	13.5 GB	2048	32	32
OpenLLaMA 3B	1ª	3 mil millones	6.9 GB	2048	26	32

Comparación de características del producto entre LLaMA y OpenLLaMA

LLaMA:

Desarrollador: Meta AI.
Propósito: Diseñado originalmente para investigadores y casos de uso no comerciales.
Rendimiento: Superó a GPT-3 en varios puntos de referencia.
Restricciones: Acceso restringido a investigadores con limitaciones en el uso comercial.
Lanzamiento inicial: 2023-02-24.
Referencia: Blog de Meta AI (opens in a new tab)
Lecturas adicionales: Artículo ArXiv (opens in a new tab)

OpenLLaMA:

Desarrollador: OpenLM Research.
Propósito: Una alternativa no restrictiva de LLaMA para fines de investigación y comerciales.
Disponibilidad: Desde junio de 2023, están disponibles modelos con 3B, 7B y 13B parámetros.
Lanzamiento inicial: 2023-04-28.
Referencia: Repositorio en GitHub (opens in a new tab)
Lecturas adicionales: Discusión en Hacker News (opens in a new tab)

Características	LLaMA	OpenLLaMA
Instruir modelos	✅	✅
Capacidad de codificación	✅	✅
Afinamiento	✅	✅
Código abierto	❌	✅
Licencia	No comercial	Apache 2.0
Tamaños de modelo	7B, 13B, 33B, 65B	3B, 7B, 13B

Primeros pasos con OpenLLaMA

Así que has decidido sumergirte y trabajar con OpenLLaMA. ¡Excelente elección! ¿Pero por dónde empiezas? La buena noticia es que OpenLLaMA es increíblemente fácil de usar, incluso para aquellos que pueden no tener una amplia experiencia con modelos de lenguaje. A continuación, se muestra una guía detallada para ponerlo en marcha.

Configuración de tu entorno

Antes de sumergirte en OpenLLaMA, necesitarás configurar tu entorno de desarrollo. Sigue estos pasos:

Instalar Python: Asegúrate de tener instalado Python 3.x. Si no lo tienes, puedes descargarlo desde el sitio web oficial de Python (opens in a new tab).
Instalar Pip: Pip es un administrador de paquetes para Python. Lo necesitarás para instalar las dependencias de OpenLLaMA.
```
curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
python get-pip.py
```
Instalar el paquete OpenLLaMA: Usa pip para instalar el paquete de OpenLLaMA.
```
pip install openllama
```

Ajuste fino de OpenLLaMA: Un ejemplo de trabajo

Digamos que quieres hacer un ajuste fino de OpenLLaMA para resumen de texto. Aquí tienes un fragmento de código de muestra que demuestra cómo hacerlo:

from openllama import OpenLLaMA, FineTuner
 
# Inicializar OpenLLaMA
model = OpenLLaMA(model_size="3B")
 
# Preparar tu conjunto de datos
train_data = "ruta/al/conjunto_de_datos_entrenamiento.csv"
val_data = "ruta/al/conjunto_de_datos_validacion.csv"
 
# Inicializar FineTuner
fine_tuner = FineTuner(task="resumen_de_texto")
 
# Ajustar fino el modelo
model.fine_tune(fine_tuner, train_data, val_data)

En este ejemplo, primero importamos los módulos necesarios e inicializamos el modelo de OpenLLaMA con un tamaño de parámetros de 3B. Luego especificamos las rutas a nuestros conjuntos de datos de entrenamiento y validación. Finalmente, inicializamos la clase FineTuner para el resumen de texto y procedemos a ajustar fino el modelo.

Probar tu modelo ajustado fino

Después de ajustar fino, es crucial probar tu modelo para asegurarte de que funcione como se espera. Aquí te mostramos cómo puedes hacerlo:

from openllama import OpenLLaMA
 
# Cargar el modelo ajustado fino
model = OpenLLaMA.load_model("ruta/al/modelo_ajustado_fino")
 
# Datos de prueba
test_data = [
    "Este es un artículo largo que necesita ser resumido.",
    "Otro artículo extenso para el resumen."
]
 
# Generar resúmenes
summaries = model.generate_summary(test_data)
 
# Imprimir los resúmenes
for i, summary in enumerate(summaries):
    print(f"Resumen {i+1}: {summary}")

En este fragmento de código, cargamos el modelo ajustado fino y luego lo utilizamos para generar resúmenes de dos artículos de prueba. El método generate_summary se encarga de la mayor parte del trabajo pesado, proporcionando resúmenes concisos del texto de entrada.

Explorando las versiones de OpenLLaMA

OpenLLaMA está disponible en múltiples versiones, cada una con su propio conjunto de parámetros y capacidades. Las versiones más comúnmente utilizadas son la 3B V2 y la 7B V2, ambas accesibles a través de la plataforma de Hugging Face.

OpenLLaMA 3B V2

La versión 3B V2 es un modelo más ligero con 3 mil millones de parámetros. Es ideal para proyectos que requieren respuestas rápidas pero pueden comprometer un poco la precisión. Puedes acceder a ella en Hugging Face utilizando el siguiente código:

from transformers import AutoModelForCausalLM
 
model = AutoModelForCausalLM.from_pretrained("openlm-research/open_llama_3b_v2")

OpenLLaMA 7B V2

La versión 7B V2 es un modelo más robusto con 7 mil millones de parámetros. Es adecuado para proyectos que requieren alta precisión y pueden permitirse tiempos de inferencia ligeramente más largos. Para acceder a ella en Hugging Face, utiliza el siguiente código:

from transformers import AutoModelForCausalLM
 
model = AutoModelForCausalLM.from_pretrained("openlm-research/open_llama_7b_v2")

Ambas versiones tienen sus propias ventajas y desventajas, así que elige aquella que mejor se ajuste a los requisitos de tu proyecto.

Conclusión: Por qué OpenLLaMA es tu modelo de lenguaje de referencia

Has llegado al final de esta guía completa y, a estas alturas, deberías tener una comprensión sólida de lo que es OpenLLaMA, cómo funciona y cómo empezar con él. OpenLLaMA se destaca por su versatilidad, facilidad de uso y la amplia gama de aplicaciones que puede manejar. Ya seas un desarrollador experimentado o un ingeniero principiante en la utilización de indicaciones, OpenLLaMA ofrece un conjunto robusto de funciones que pueden adaptarse a tus necesidades específicas.

Desde sus múltiples versiones hasta sus capacidades de ajuste fino, OpenLLaMA está diseñado para ser lo más fácil de usar posible. Su naturaleza de código abierto significa que no estás limitado por restricciones de licencia, lo que te brinda la libertad de usar el modelo como consideres necesario. Es esta combinación de potencia y flexibilidad la que hace de OpenLLaMA una opción convincente para cualquier proyecto relacionado con modelos de lenguaje.

Preguntas frecuentes: Todo lo que necesitas saber sobre OpenLLaMA

¿Cuál es la diferencia entre OpenLLaMA y LLaMA?

La diferencia principal radica en sus restricciones de uso y licencias. LLaMA está orientado hacia los investigadores y tiene restricciones de uso comercial. Por otro lado, OpenLLaMA es de código abierto y se puede utilizar tanto para la investigación como para aplicaciones comerciales. Además, OpenLLaMA ofrece más flexibilidad en términos de ajuste fino y adaptaciones específicas de tareas.

¿Qué idiomas son compatibles con OpenLLaMA?

OpenLLaMA está diseñado como un modelo multilingüe, capaz de entender y generar texto en varios idiomas. Si bien la lista exacta de idiomas compatibles se actualiza constantemente, generalmente incluye idiomas principales como inglés, español, francés y chino, entre otros.

¿Qué tan grande es OpenLLaMA?

OpenLLaMA viene en varias tamaños para adaptarse a diferentes necesidades. Las versiones más utilizadas son los modelos de parámetros 3B, 7B y 13B. La "B" significa billón, lo que indica la cantidad de parámetros en cada modelo. Cuanto más grande sea el modelo, más potencia computacional requerirá, pero también será más preciso.

¿OpenLLaMA está ajustado a instrucciones?

Sí, OpenLLaMA está diseñado para ser ajustado a instrucciones. Esto significa que puedes ajustar el modelo para seguir instrucciones o consignas específicas, lo que lo hace altamente adaptable para diversas tareas como resumen de texto, traducción o respuesta a preguntas.

OpenDevin: La alternativa de código abierto a DevIn AI Qwen 110B: El Potente Modelo de Lenguaje de Alibaba y Cómo Ejecutarlo Localmente