MetaがSAM 3Dをリリースしました。有名なSegment Anything Modelを3D生成に拡張したものです。これはオープンソースで完全無料であり、3D AIコミュニティにとって重要なマイルストーンです。
AzureのA100で推論環境をデプロイし、このモデルの全機能をテストしました。徹底的なテストを経た率直な評価をお伝えします。

SAM 3Dの仕組み
SAM 3DはSegment Anythingファミリーの一部です。画像を受け取り、オブジェクトをセグメントし、3D表現を生成します。ただし、重要なポイントがあります:
Metaのプレイグラウンドを使用する場合、出力はGaussian Splatsのみです。テクスチャ付きメッシュを取得するには、モデルをローカルで実行する必要があります。
驚異的な生成速度
すぐに目を引くのが、生成速度が非常に速いことです。1回の生成に数分かかる他の3D生成ツールと比較すると、大きなアドバンテージです。

システム要件
Metaのドキュメントでは最低32GB VRAMと記載されていますが、12GB VRAM以下でジオメトリ生成を実行することができました。Gaussian Splatsとメッシュ出力を含めての数値です。
ただし、テクスチャを含むフルパイプラインの場合は、より多くのVRAMとLinux環境が必要です。
品質比較:SAM 3D vs Hunyuan 2.1
Metaは他のオープンソースモデルに対して80%の選好率を主張しています。Hunyuan 2.1と直接比較してみました。
私の率直な評価は?80%には達していません。60〜70%程度の選好率というのが妥当な印象です。ただし、多くのケースでHunyuan 2.1より確実に優れています。

得意な分野と苦手な分野
得意なもの
- • 家具やプロップ
- • 環境オブジェクト
- • シンプルな幾何学的形状
- • 素早いプロトタイピング
苦手なもの
- • キャラクターや顔
- • 有機的な形状
- • テキストや細かいディテール
- • 高解像度テクスチャ(最大2K、まだぼやけがち)

テクスチャはぼやけがちで、最大2K解像度でもその傾向があります。これは、Gaussian Splatsをテクスチャベイク済みメッシュに変換する過程でディテールが失われるためです。
メッシュ自体は比較的シンプルですが、オープンソースモデルとしては全体的な形状精度はかなり良好です。
最適なユースケース
SAM 3Dのユースケースはやや限定的だが明確です:
- •VR/AR開発 — 環境プロップの素早い作成
- •Unreal Engine開発者 — シーンオブジェクトの高速プロトタイピング
- •Gaussian Splatワークフロー — 既にSplatsを扱っている場合
従来の3Dワークフロー(Blender、Mayaなど)では、Gaussian Splat出力がハードルになり得ます。Splatsの展開と変換は、GLBやOBJファイルのインポートほど簡単ではありません。
総評
SAM 3Dは、オープンソース3D AIコミュニティにとって真に画期的なリリースです。速度は印象的で、特定のユースケース、とりわけ家具、プロップ、環境オブジェクトでは堅実な結果を提供します。
制約は確かにあります。Linux限定、Gaussian Splat出力、ぼやけたテクスチャ、有機的な形状への対応の弱さ。しかし、このモデルが存在し、オープンソースであり、進歩を続けているという事実は、この分野にとって素晴らしいことです。
結論:VR/ARプロップを制作するUnreal開発者、またはGaussian Splatsを既に活用している方には、SAM 3Dを試す価値があります。従来の3Dワークフローでは、リーダーボードに掲載されている他のツールの方が実用的かもしれません。