5 resultados
20 DE MAYO DE 2025 / Gemma
Gemma 3n es un modelo abierto de vanguardia, diseñado para una IA rápida y multimodal en dispositivos que ofrece un rendimiento optimizado, una flexibilidad única con un modelo 2 en 1 y una comprensión multimodal ampliada con audio, lo que permite a los desarrolladores compilar aplicaciones interactivas en vivo y sofisticadas experiencias centradas en el audio.
9 DE MAYO DE 2025 / DeepMind
Gemini 2.5 implica un gran salto en la comprensión de video, ya que logra un rendimiento de vanguardia en puntos de referencia clave de comprensión de video y puede usar sin problemas información audiovisual con código y otros formatos de datos.
30 DE ABRIL DE 2025 / Gemma
Las nuevas funciones de Gemma 3 incluyen capacidades de lenguaje-visión y cambios arquitectónicos para mejorar la eficiencia de la memoria y procesar contextos más extensos, en comparación con los modelos anteriores de Gemma.
23 DE ABRIL DE 2025 / Gemini
Explora las aplicaciones del mundo real de la API Live para los modelos de Gemini, ahora actualizados con funciones mejoradas para el procesamiento de audio, video y texto en tiempo real, administración de sesiones mejorada, control sobre las interacciones y opciones de salida más ricas.
20 DE NOVIEMBRE DE 2024 / Gemini
OpusClip usa las funciones multimodales de Gemini 1.5 Flash para mejorar la comprensión de videos y agilizar la creación de contenido, lo que lleva a un ahorro de costos y un aumento de la participación.