OpenAI ha lanzado dos modelos de lenguaje de código abierto, gpt-oss-120b y gpt-oss-20b, bajo licencia Apache2.0. Estos modelos, entrenados con técnicas de aprendizaje profundo inspiradas en los modelos internos de OpenAI como o3 y o4-mini, están disponibles para descarga y uso sin restricciones comerciales.
El gpt-oss-120b es equiparable al modelo o4-mini en tareas de razonamiento y puede ejecutarse en una sola GPU de 80 GB. El gpt-oss-20b, diseñado para dispositivos con 16 GB de memoria, supera a modelos propietarios como o1 y GPT-4o en benchmarks de salud y matemáticas. Ambos modelos destacan por su capacidad de razonamiento de cadena de pensamiento sin supervisión directa y soporte nativo para funciones estructuradas y llamadas de herramientas.
OpenAI también ha publicado guías técnicas para el ajuste fino de modelos e integraciones con plataformas populares como Hugging Face y vLLM. La compañía ha desarrollado un protocolo para simular escenarios de uso malicioso extremo y enfatiza su compromiso con la seguridad y el beneficio colectivo.
Los modelos están disponibles para que desarrolladores, organizaciones y países los utilicen, modifiquen y desplieguen en su propia infraestructura.
Crítica:
El artículo cumple parcialmente con las expectativas del título, ya que se enfoca más en los detalles técnicos de los modelos que en su impacto general. La calidad informativa es alta, pero podría ser más accesible para no expertos. No hay elementos sensacionalistas evidentes, pero falta una discusión más profunda sobre las implicaciones éticas de estos modelos de IA.
Comentarios