2024年09月25日 11:21 ITmedia NEWS
米Googleは9月24日(現地時間)、本番環境で利用可能とする2つの最新Geminiモデル「Gemini-1.5-Pro-002」(以下「Pro」)と「Gemini-1.5-Flash-002」(以下「Flash」)のリリースを発表した。Google Cloudの顧客は、Vertex AIで利用可能だ。
2つのモデルは、2月に発表した以前のモデルの2倍となる200万のコンテキストウィンドウを備える。Proはテキスト、コード、画像を処理できるマルチモーダルだ。Flashは以前のバージョンより処理速度が向上し、リアルタイム性が求められるアプリにも適しているという。
Proの企業向け料金は、10月1日から128K(12万8000)トークン未満のプロンプトの場合、入力トークンで64%、出力トークンで52%、インクリメンタルキャッシュトークンで64%値下げになる。
開発者は、Google AI StudioとGemini APIを通じて無料でアクセスできる。開発者向けの有料レベルのレート制限を引き上げ、ProではRPM(1分当たりのリクエスト数)を360から1000に、Flashでは1000から2000に引き上げる。
Googleは「データローカリティ」に取り組んでおり、顧客はデータの保存先だけでなく、プロンプトの取り込みや推論、出力などを行う場所も選択できる。これにより、データセキュリティ、プライバシー、コンプライアンスを重視する企業顧客が安心して利用できるとしている。