5 hasil
20 MEI 2025 / Gemma
Gemma 3n adalah model terbuka termutakhir yang dirancang untuk AI multimodal yang cepat di perangkat. Model ini menghadirkan performa yang dioptimalkan, fleksibilitas unik dengan model 2-in-1, dan pemahaman multimodal yang diperluas dengan audio sehingga memampukan developer untuk membangun aplikasi interaktif secara langsung dan pengalaman audio-sentris tercanggih.
9 MEI 2025 / DeepMind
Gemini 2.5 menandai lompatan besar dalam pemahaman video, mencapai performa canggih pada tolok ukur pemahaman video penting dan mampu menggunakan informasi audio-visual dengan kode dan format data lainnya secara mulus.
30 APRIL 2025 / Gemma
Fitur baru Gemma 3 mencakup kemampuan visi-bahasa dan perubahan arsitektur untuk meningkatkan efisiensi memori dan penanganan konteks yang lebih panjang dibandingkan dengan model Gemma sebelumnya.
23 APRIL 2025 / Gemini
Jelajahi aplikasi dunia nyata bagi Live API untuk model Gemini, yang kini diupdate dengan menyertakan fitur yang disempurnakan untuk pemrosesan audio, video, dan teks secara real-time, manajemen sesi yang lebih baik, kontrol atas interaksi, dan opsi output yang lebih kaya.
20 NOV. 2024 / Gemini
OpusClip memanfaatkan kemampuan multimodal Gemini 1.5 Flash untuk meningkatkan pemahaman video dan memudahkan pembuatan konten, yang menghasilkan penghematan biaya dan peningkatan engagement.