Alibaba se está convirtiendo en la apisonadora de la IA Open Source. Su familia de modelos Qwen está...

Alibaba lanza IA multimodal gratuita

tecnologia Imagen de un robot de inteligencia artificial procesando texto, imágenes, audio y vídeo simultáneamente con una arquitectura 'Pensador-Hablador'

Alibaba lanzó Qwen3-Omni, un modelo de inteligencia artificial de código abierto que procesa texto, imágenes, audio y vídeo simultáneamente. Es el primer modelo que unifica estas cuatro modalidades de forma nativa y lo ofrece gratis bajo licencia Apache2.0. Qwen3-Omni procesa texto en 119 idiomas, reconoce voz en 19 lenguas y habla en 10 idiomas.

Su arquitectura 'Pensador-Hablador' permite respuestas en tiempo real con latencias de 234 milisegundos para audio y 547 milisegundos para vídeo. En 36 pruebas de referencia, supera a modelos de código abierto en 32 y establece nuevos récords en 22. En matemáticas avanzadas, obtiene 65 puntos frente a los 26,7 de GPT-4o.

Alibaba apuesta por el código libre para ganar cuota de mercado en la IA multimodal.

Crítica:

El artículo cumple con las expectativas del título, ofreciendo una visión detallada de la estrategia de Alibaba en la IA multimodal. La calidad informativa es alta, pero podría profundizar más en las implicaciones económicas de esta apuesta por el código abierto.

Comentarios

¡Sorpresa!
¡Ya eres Premium!

De hecho, aquí todos somos Premium. En NoticiasResumidas.com no existen las cuentas de pago. Disfruta de todas las funcionalidades, gratis, sin registros y para siempre. ¡A resumir se ha dicho!