Penelusuran

5 hasil

Hapus filter
  • 20 MEI 2025 / Gemma

    Pengumuman pratinjau Gemma 3n: AI berorientasi-seluler yang kuat dan efisien

    Gemma 3n adalah model terbuka termutakhir yang dirancang untuk AI multimodal yang cepat di perangkat. Model ini menghadirkan performa yang dioptimalkan, fleksibilitas unik dengan model 2-in-1, dan pemahaman multimodal yang diperluas dengan audio sehingga memampukan developer untuk membangun aplikasi interaktif secara langsung dan pengalaman audio-sentris tercanggih.

    Gemma 3n
  • 9 MEI 2025 / DeepMind

    Memajukan batas pemahaman video dengan Gemini 2.5

    Gemini 2.5 menandai lompatan besar dalam pemahaman video, mencapai performa canggih pada tolok ukur pemahaman video penting dan mampu menggunakan informasi audio-visual dengan kode dan format data lainnya secara mulus.

    2.5Pro_Metadata_VideoUnderstanding
  • 30 APRIL 2025 / Gemma

    Penjelasan Gemma: Yang baru di Gemma 3

    Fitur baru Gemma 3 mencakup kemampuan visi-bahasa dan perubahan arsitektur untuk meningkatkan efisiensi memori dan penanganan konteks yang lebih panjang dibandingkan dengan model Gemma sebelumnya.

    What's new in Gemma-3
  • 23 APRIL 2025 / Gemini

    Mencapai interaksi real-time: Membangun dengan Live API

    Jelajahi aplikasi dunia nyata bagi Live API untuk model Gemini, yang kini diupdate dengan menyertakan fitur yang disempurnakan untuk pemrosesan audio, video, dan teks secara real-time, manajemen sesi yang lebih baik, kontrol atas interaksi, dan opsi output yang lebih kaya.

    gemini-live-api-meta
  • 20 NOV. 2024 / Gemini

    OpusClip mencapai penghematan biaya 30% dalam pemrosesan deskripsi visual dengan Gemini Flash

    OpusClip memanfaatkan kemampuan multimodal Gemini 1.5 Flash untuk meningkatkan pemahaman video dan memudahkan pembuatan konten, yang menghasilkan penghematan biaya dan peningkatan engagement.

    OpusClip_metadata