2024年09月26日 08:51 ITmedia NEWS
米Metaは9月25日(現地時間)、年次開発者会議「Meta Connect 2024」で、同社のLLM「Llama」の最新版「Llama 3.2」のリリースを発表した。7月に「Llama 3.1」をリリースしたばかりだが、初のマルチモーダルモデルの追加など、大きな更新になった。
これには、中小規模のビジョンLLMと、事前トレーニング済みおよびインストラクションを含む、エッジおよびモバイルデバイスに適合する軽量のテキスト専用モデルが含まれる。
●画像認識機能の追加
Llama 3.2では、11B(110億)と90B(900億)の2つのモデルで画像認識機能をサポートする。
これにより、表やグラフなどの理解、画像キャプションの生成、画像内のオブジェクトに自然言語で指示する視覚的なグラウンディングなどの画像推論ユースケースが可能になる。
例えば、ユーザーが前年のどの月に売り上げが最も多かったのかをグラフに基づいて質問すると、Llama 3.2は迅速に回答を提供するという。
●エッジデバイスに対応した軽量モデル
1Bと3Bの軽量モデルは、要約、指示の追従、書き換えタスクなど、エッジデバイス上でのローカルな実行に最適化されており、128Kトークンのコンテキスト長をサポートする。これらのモデルは、米Qualcommと台湾MediaTekのハードウェアで動作し、Armプロセッサ向けに最適化されている。
開発者は、データがデバイスから離れることのない、プライバシーを重視したパーソナライズされたオンデバイスエージェントアプリを構築できることになる。
例えば、受信した最後の10件のメッセージを要約したり、アクションアイテムを抽出したり、ツール呼び出しを活用してフォローアップ会議の予定表招待を直接送信したりする機能が可能になるだろう。
●多様な環境でモデルを使うためのツールセット「Llama Stack」
開発者が多様な環境(単一ノード、オンプレミス、クラウド、オンデバイスなど)でLlamaモデルを簡単に利用できるように、「Llama Stack」ディストリビューションをリリースした。これにより、検索拡張生成(RAG)や安全性が統合されたツール対応アプリをすぐに展開できるとしている。
Llama 3.2は、llama.comとHugging Faceからダウンロードできる。また、AMD、AWS、Databricks、Dell、Google Cloud、Groq、IBM、Intel、Microsoft Azure、NVIDIA、Oracle Cloud、Snowflakeなどのパートナー企業の幅広いエコシステム上のプラットフォームですぐに開発に使用できる。