Meta presenta LLaMA 3 y detalla su modelo de inteligencia artificial

Meta presenta LLaMA 3, su última innovación en inteligencia artificial

La empresa tecnológica Meta ha anunciado el lanzamiento de LLaMA 3, la más reciente versión de su modelo de lenguaje grande (LLM), destinada a mejorar habilidades como el razonamiento, la codificación y la ejecución de instrucciones a través de inteligencia artificial.

Esta nueva iteración ofrece modelos pre-entrenados y adaptados con una amplia variedad de parámetros, incluyendo versiones con 8 mil millones (8B) y 70 mil millones (70B) de parámetros respectivamente. Estos modelos están diseñados para adaptarse a diferentes necesidades y escenarios de uso.

LLaMA 3 se basa en un enfoque de código abierto, buscando la colaboración de desarrolladores para mejorar su funcionalidad general. Además, Meta ha optado por un enfoque ágil de desarrollo, permitiendo que la comunidad acceda y contribuya a estos modelos durante su proceso de desarrollo.

Los nuevos modelos LLaMa 3 representan un avance significativo con respecto a su predecesor, LLaMA 2, al mejorar aspectos como la tasa de falsos rechazos, la alineación y la diversidad en las respuestas del modelo.

Para garantizar un desempeño óptimo en escenarios del mundo real, Meta ha desarrollado un conjunto de evaluación humana de alta calidad, que cubre una variedad de casos de uso clave.

LLaMA 3 utiliza una arquitectura de transformador estándar y ha introducido mejoras clave, como un tokenizador con un vocabulario más amplio, lo que mejora la eficiencia del modelo en la codificación del lenguaje.

En cuanto al entrenamiento del modelo, Meta ha empleado un conjunto de datos amplio y de alta calidad, que incluye una gran cantidad de tokens recopilados de fuentes públicas. Se han implementado procesos de filtración de datos para garantizar la calidad de los datos utilizados en el entrenamiento.

La empresa también ha innovado en su enfoque de ajuste de instrucciones, utilizando una combinación de técnicas de aprendizaje por refuerzo para mejorar el rendimiento del modelo en tareas de razonamiento y codificación.

Meta tiene planes de seguir mejorando LLaMA 3 y lanzar nuevas funcionalidades en los próximos meses, incluyendo la multimodalidad, la capacidad de conversación en varios idiomas y una ventana de contexto más amplia.

Además, la empresa está expandiendo la disponibilidad de Meta AI a nivel internacional, permitiendo que más personas accedan a esta tecnología a través de varias plataformas, como Facebook, Instagram, WhatsApp y Messenger, en diferentes países.

LLaMA 3 estará disponible próximamente en diversas plataformas, incluidos los proveedores de nube y los proveedores de API de modelos.

Leer Anterior

Descubre cómo postularte para trabajar en Microsoft desde Perú

Leer Siguiente

Advierten irregularidades en construcción de la vía Huánuco – La Unión – Huallanca