Bayangkan menatap cermin dan melihat bukan hanya bayangan Anda, tetapi juga pintu gerbang menuju informasi, kreativitas, dan sentuhan ajaib. Inilah yang diwujudkan oleh project Magic Mirror yang didukung oleh Gemini. Tidak hanya sekadar tampilan sederhana, project ini menampilkan kemampuan interaktif Gemini API dan JavaScript GenAI SDK yang luar biasa, mentransformasi objek yang familier menjadi antarmuka chat baru.
Link to Youtube Video (visible only when JS is disabled)
Project ini menciptakan pengalaman interaktif menggunakan beberapa fitur Gemini API:
Fondasi interaktivitas cermin ajaib adalah Live API. Ini memungkinkan interaksi suara real-time yang berkelanjutan. Anda berbicara, dan cermin tidak hanya mendengarkan satu perintah saja, ia terlibat dalam percakapan yang mengalir dengan memproses ucapan saat Anda berbicara, memungkinkan dialog bolak-balik yang lebih natural baik dalam teks maupun audio.
Selain itu, Live API dapat mengenali saat Anda berbicara selama pemutaran dan menafsirkan interupsi tersebut untuk menyesuaikan narasi dan percakapan berdasarkan input Anda, sehingga memungkinkan percakapan audio yang dinamis bersamaan dengan teks.
Link to Youtube Video (visible only when JS is disabled)
Selain dapat melakukan percakapan melalui Live API, magic mirror juga dapat disesuaikan untuk mengarang cerita, semuanya berkat kemampuan generasi lanjutan model Gemini dengan menyediakan petunjuk sistem khusus dan mengupdate konfigurasi ucapan selama inisialisasi untuk menyertakan dialek atau aksen yang berbeda, suara, dan berbagai atribut lainnya.
Link to Youtube Video (visible only when JS is disabled)
Meskipun percakapan dan cerita memang menarik, terkadang Anda ingin mengetahui dunia di sekitar Anda secara langsung saat itu terjadi. Project magic mirror ini memanfaatkan kemampuan model untuk berintegrasi dengan Grounding menggunakan Google Penelusuran, memberikan informasi terkini serta berdasar.
Link to Youtube Video (visible only when JS is disabled)
Menggunakan Function Calling dengan Gemini API, magic mirror dapat menghasilkan visual berdasarkan deskripsi Anda, menambah kedalaman cerita dan memperdalam pengalaman berinteraksi dengan model Gemini. Model Gemini menentukan bahwa permintaan Anda memerlukan pembuatan gambar dan memanggil fungsi yang telah ditentukan sebelumnya berdasarkan karakteristik yang dinyatakan, meneruskan perintah terperinci yang berasal dari kata yang Anda ucapkan.
Link to Youtube Video (visible only when JS is disabled)
Meskipun pengalaman pengguna dimaksudkan untuk menyembunyikan detail teknis, tetapi sejumlah fitur canggih dari model Gemini bekerja bersama untuk menciptakan pengalaman ajaib ini:
Magic Mirror berbasis Gemini ini bukan hanya sekadar inovasi baru; ini adalah demonstrasi yang kuat tentang bagaimana AI canggih bisa diintegrasikan ke dalam lingkungan fisik kita untuk menciptakan interaksi yang bermanfaat, menarik, dan bahkan memesona. Fleksibilitas Gemini API membuka pintu bagi banyak aplikasi lain, mulai dari asisten yang sangat dipersonalisasi hingga alat pendidikan yang dinamis dan platform hiburan yang imersif.
Anda bisa melihat keseluruhan kode project ini di GitHub, serta tutorial teknis lengkap di Hackster.io.
Kami mendorong Anda untuk membayangkan semua kemungkinan yang ada. Apa yang dapat dilakukan oleh cermin ajaib Anda?
Pastikan membagikan ide dan kreasi berbasis Gemini Anda kepada kami di X dan LinkedIn.