Google AI Studio における開発エクスペリエンスのアップグレード

2025年5月21日

Olivier Lacombe Group Product Manager

Kat Kampf Product Manager

Ammaar Reshi UX Design Lead

Seth Odoom Product Manager

ネイティブコード生成、エージェントツールなど

Google AI Studio は、Gemini API を使った開発を最速で始められるプラットフォームであり、Gemini 2.5 プレビューモデルを含む最高性能のモデルや、Imagen、Lyria RealTime、Veo といった生成メディアモデルにアクセスできます。Google I/O では、アプリケーションの構築とデプロイを支援する新機能、新たなモデル機能、そして Google Gen AI SDK における新機能を発表しました。

Gemini 2.5 Pro のコード生成でアプリをビルドする

Gemini 2.5 Pro はコーディングにおいて非常に優れており、その機能を Google AI Studio のネイティブコードエディタに搭載できたことを嬉しく思います。このエディタは Gen AI SDK と緊密に最適化されており、テキスト、画像、動画のシンプルなプロンプトからアプリを簡単に生成できます。新しい「ビルド」タブは、AI 搭載のウェブアプリを素早く構築・デプロイするためのゲートウェイとなっています。また、新しいショーケース例も公開されており、新しいモデルなどを自由に試すことができます。

Imagen + Gemini でテキストアドベンチャーゲームを生成している動画（動画は説明のためにスピードアップしています）

単一のプロンプトからのアプリ生成に加えて、チャットを通じてウェブアプリの反復開発を継続することができます。これにより、変更の適用、差分の確認、さらには過去のチェックポイントへのジャンプによる編集の取り消しも可能です。

コードのバージョンを比較し、拡張されたファイル構造を使ってプロジェクトの開発を管理する（説明のためにビデオを早送りしています）

また、新しく作成したアプリを Cloud Run にワンクリックでデプロイすることもできます。

作成したアプリを Cloud Run に素早くデプロイ（説明のため、動画はスピードアップしています）

Google AI Studio のアプリおよび生成されたコードは、ユニークなプレースホルダー API キーを利用しており、Google AI Studio がすべての Gemini API 呼び出しをプロキシします。したがって、Google AI Studio を使ってアプリを共有する場合、そのユーザーによるすべての API 使用は、ユーザー自身の Google AI Studio の無料利用枠に帰属し、ご自身の API キーやクオータは一切使用されません。詳細は FAQ をご参照ください。

この機能は実験的なものであるため、プロジェクトを外部に共有する前には必ずコードをご確認ください。現在のワンショット生成は、主に Gemini モデルおよび Imagen モデルとの連携に最適化されており、今後さらに多くのモデルやツール呼び出しへの対応が予定されています。

Google AI Studio でマルチモーダル生成が簡単に

Google DeepMind の高度なマルチモーダルモデルを、より迅速にデベロッパーのツールボックスに届けるために取り組んできました。新しい Generate Media ページでは、Imagen、Veo、Gemini によるネイティブな画像生成や、新たに加わったネイティブな音声生成モデルの探索を一元化しています。さらに、Google AI Studio に組み込まれた PromptDJ アプリを通じて、Lyria RealTime を使ったインタラクティブな音楽生成も体験できます。

Link to Youtube Video (visible only when JS is disabled)

Google AI Studio の「Generate Media」タブから、生成メディアモデルを検索する（動画は説明のためにスピードアップしています）

Live API と音声合成（TTS）用の新しいネイティブオーディオ

Live API でプレビュー中の Gemini 2.5 Flash ネイティブオーディオダイアログでは、モデルは 30 以上の音声をサポートし、より自然な応答を生成するようになりました。また、プロアクティブオーディオが追加され、モデルが話し手と背景の会話を区別できるようになりました。これにより、より直感的で自然に感じられる会話 AI エージェントやエクスペリエンスを構築することが可能になります。

Link to Youtube Video (visible only when JS is disabled)

「Google AI Studio Stream」タブでネイティブオーディオダイアログを試す（動画は説明のためにスピードアップしています）

Live API に加え、テキスト読み上げ（TTS）をネイティブ音声出力に対応させた Gemini 2.5 Pro および Flash のプレビュー版を発表しました。これにより、話し方のスタイルを柔軟にコントロールしながら、単一話者および複数話者による音声出力を作成できるようになりました。

Link to Youtube Video (visible only when JS is disabled)

新しい TTS 機能を使って音声を生成する（説明のためにビデオをスピードアップしています）

「ストリーム」タブから Live API におけるネイティブ音声をお試しいただき、Generate Speech を通じて新しい TTS 機能をご体験ください。

モデルコンテキストプロトコル（MCP）サポート

Model Context Protocol（MCP）の定義は、Google Gen AI SDK においてもネイティブにサポートされるようになり、拡大し続けるオープンソースツールとの統合がさらに容易になりました。Google Maps と Gemini API を組み合わせた MCP サーバーの活用例を示すデモアプリもご用意しています。