Google AI Studio における開発エクスペリエンスのアップグレード

2025年5月21日
Olivier Lacombe Group Product Manager
Kat Kampf Product Manager
Ammaar Reshi UX Design Lead
Seth Odoom Product Manager

ネイティブコード生成、エージェント ツールなど


Google AI Studio は、Gemini API を使った開発を最速で始められるプラットフォームであり、Gemini 2.5 プレビュー モデルを含む最高性能のモデルや、Imagen、Lyria RealTime、Veo といった生成メディア モデルにアクセスできます。Google I/O では、アプリケーションの構築とデプロイを支援する新機能、新たなモデル機能、そして Google Gen AI SDK における新機能を発表しました。


Gemini 2.5 Pro のコード生成でアプリをビルドする

Gemini 2.5 Pro はコーディングにおいて非常に優れており、その機能を Google AI Studio のネイティブ コード エディタに搭載できたことを嬉しく思います。このエディタは Gen AI SDK と緊密に最適化されており、テキスト、画像、動画のシンプルなプロンプトからアプリを簡単に生成できます。新しい「ビルド」タブは、AI 搭載のウェブアプリを素早く構築・デプロイするためのゲートウェイとなっています。また、新しい ショーケース 例も公開されており、新しいモデルなどを自由に試すことができます。

Imagen + Gemini でテキスト アドベンチャー ゲームを生成している動画 (動画は説明のためにスピード アップしています)

単一のプロンプトからのアプリ生成に加えて、チャットを通じてウェブアプリの反復開発を継続することができます。これにより、変更の適用、差分の確認、さらには過去のチェックポイントへのジャンプによる編集の取り消しも可能です。

コードのバージョンを比較し、拡張されたファイル構造を使ってプロジェクトの開発を管理する(説明のためにビデオを早送りしています)

また、新しく作成したアプリを Cloud Run にワンクリックでデプロイすることもできます。

作成したアプリを Cloud Run に素早くデプロイ(説明のため、動画はスピードアップしています)

Google AI Studio のアプリおよび生成されたコードは、ユニークなプレースホルダー API キーを利用しており、Google AI Studio がすべての Gemini API 呼び出しをプロキシします。したがって、Google AI Studio を使ってアプリを共有する場合、そのユーザーによるすべての API 使用は、ユーザー自身の Google AI Studio の無料利用枠に帰属し、ご自身の API キーやクオータは一切使用されません。詳細は FAQ をご参照ください。

この機能は実験的なものであるため、プロジェクトを外部に共有する前には必ずコードをご確認ください。現在のワンショット生成は、主に Gemini モデルおよび Imagen モデルとの連携に最適化されており、今後さらに多くのモデルやツール呼び出しへの対応が予定されています。


Google AI Studio でマルチモーダル生成が簡単に

Google DeepMind の高度なマルチモーダル モデルを、より迅速にデベロッパーのツールボックスに届けるために取り組んできました。新しい Generate Media ページでは、Imagen、Veo、Gemini によるネイティブな画像生成や、新たに加わったネイティブな音声生成モデルの探索を一元化しています。さらに、Google AI Studio に組み込まれた PromptDJ アプリを通じて、Lyria RealTime を使ったインタラクティブな音楽生成も体験できます。

Link to Youtube Video (visible only when JS is disabled)

Google AI Studio の「Generate Media」タブから、生成メディア モデルを検索する(動画は説明のためにスピード アップしています)

Live API と音声合成(TTS)用の新しいネイティブ オーディオ

Live API でプレビュー中の Gemini 2.5 Flash ネイティブ オーディオ ダイアログでは、モデルは 30 以上の音声をサポートし、より自然な応答を生成するようになりました。また、プロアクティブ オーディオが追加され、モデルが話し手と背景の会話を区別できるようになりました。これにより、より直感的で自然に感じられる会話 AI エージェントやエクスペリエンスを構築することが可能になります。

Link to Youtube Video (visible only when JS is disabled)

「Google AI Studio Stream」タブでネイティブ オーディオ ダイアログを試す(動画は説明のためにスピード アップしています)

Live API に加え、テキスト読み上げ(TTS)をネイティブ音声出力に対応させた Gemini 2.5 Pro および Flash のプレビュー版を発表しました。これにより、話し方のスタイルを柔軟にコントロールしながら、単一話者および複数話者による音声出力を作成できるようになりました。

Link to Youtube Video (visible only when JS is disabled)

新しい TTS 機能を使って音声を生成する(説明のためにビデオをスピード アップしています)

ストリーム」タブから Live API におけるネイティブ音声をお試しいただき、Generate Speech を通じて新しい TTS 機能をご体験ください。


モデル コンテキスト プロトコル(MCP)サポート

Model Context Protocol(MCP)の定義は、Google Gen AI SDK においてもネイティブにサポートされるようになり、拡大し続けるオープンソース ツールとの統合がさらに容易になりました。Google Maps と Gemini API を組み合わせた MCP サーバーの活用例を示すデモアプリもご用意しています。

Model Context Protocol (MCP)

新しい URL コンテキスト ツール

URL Context は新しい実験的なツールで、提供されたリンクからコンテンツを取得し、参照する能力をモデルに与える。これは、事実確認、比較、要約、より深い調査に役立ちます。

Google AI Studio でビルドを開始する

これらすべてのアップデートを Google AI Studio に導入できたことを大変嬉しく思います。これにより、Google が提供する最新モデルを活用して、デベロッパーが探究・構築するための最適なプラットフォームとなります。

この発表と Google I/O 2025 のすべての最新情報は、5 月 22 日以降に io.google でご覧いただけます。