NVIDIAが2D画像から3D特性を予測するシステムを開発した事例について紹介します。
DIB-R

このシステムは3Dのトレーニングデータ無しで、2D画像の3D特性を予測できるAIシステムです。照明やテクスチャ、深度を入れることで、2D画像が3次元でどのように見えるかを予測することで3Dモデルを作成するそうです。この研究はカナダのバンクーバーで開催される次神経情報処理システム会議(NeurIPS)で発表されるそうです。
今後の展望
このシステムは複数のオブジェクトやシーン全体の3Dモデルのレンダリングのような、より複雑なタスクに区別が可能なレンダリングフレームワークを拡張することを試みる可能性があると語っているそうです。
また、このシステムはゲーム、AR/VR、ロボット工学または物体追跡システムに応用ができるそうで、例えば親の古い写真や子供の絵、お気に入りのビデオゲーム、またはその他の2Dのものを3Dに変換することは、開発などにおいて大きなチャンスに繋がると考えているそうです。
【考察】企業でも家庭でも
2Dから3Dを生成できるというのは夢のような話ですよね。
モデリングには膨大な時間がかかってしまいますが画像を用意してベースだけをAIが作成し、残りの微調整やアレンジなどは人間の手で行う、そんなやり方ができたら作業時間の短縮につながると思います。
また、写真から生成できるという点から、家庭での大切な思い出を3Dにして出力して、保管、鑑賞できるかもしれないという点でも非常に実用的なシステムになりえるのではないでしょうか。
参考:Nvidia trains AI to transform 2D images into 3D models
参考:2D or Not 2D: NVIDIA Researchers Bring Images to Life with AI