Blog
人工知能・AIブログ

2020年10月7日

AI(人工知能)事例集 vol.218 世界のランドマーク写真を4D体験に変換するツール

ローマのトレビの泉やニューヨークのトップ・オブ・ザ・ロックなど、世界のランドマークを撮影した観光写真を使って、時間の経過とともに外観を変化させる3D画像を作成する方法を、研究者が開発したといいます。

時間の経過とともに変化する外観を再現

コーネル大学の研究者は、ローマのトレビの泉やニューヨークのトップ・オブ・ザ・ロックなどの世界的なランドマークの観光写真を使って、時間の経過とともに変化する外観を示す操作可能な3D画像を作成する方法を開発しました。

この方法は、タグ付けされていない写真や日付の入っていない写真を何万枚も読み取って合成するためにディープラーニングが採用されているといいます。

コーネル工科大学のコンピュータサイエンスの准教授Noah Snavely氏は次のように述べています。「もしあなたが休暇中にトレビの泉に行ったとしたら、トレビの泉がどのように見えるかはあなたが行った時間に依存するでしょう。例えば、夜には下から投光器で照らされているし、午後になると太陽の光に照らされます。私たちは多くの写真から、時間帯や天候に基づいたさまざまな外観を学習させ、様々なシーンを移動することができるようにしました。」

現実世界の外観は非常に多様で、光沢のあるもの、水、薄い構造物など、さまざまな種類の素材を持っているため、フォトリアリスティックな方法で場所を再現することは、テクスチャの数が非常に多いこともあって、従来のコンピュータビジョンでは困難でした。

しかし、ディープラーニングを使用することで、任意の時間と場所でそのシーンがどのように見えていたかを推測することができるといいます。

SNSで公開されている約5万枚の画像を使ってシーンを作成

研究者たちは、ディープマルチプレーンイメージと呼ばれる新しいシーン表現を導入し、4次元の外観を作り出しました。彼らの方法は、1930年代にウォルト・ディズニー・カンパニーによって開発された古典的なアニメーション技術に触発されているのだそうです。

「2Dアニメーションで3D効果を生み出すために発明されたのと同じアイデアを、実世界のシーンで3D効果を生み出すために使い、観光客の写真から得られるすべての異なる寸法にフィットさせることで、この深い多層イメージを生み出しています。」とSnavely氏は述べています。

今回の研究では、FlickrやInstagramなどのサイトで公開されている約5万枚の画像を使ってシーンを作成することで、このモデルを訓練することができることが示されました。この方法は、コンピュータビジョンの研究だけでなく、バーチャルツーリズムの研究にも応用できるといいます。

【考察】3D画像のバーチャルツーリズムへの応用

ディープラーニングによって時間とともに外観が変化する3D画像が作成されることは、バーチャルの旅行への応用が大いに期待できます。

特に、withコロナやアフターコロナの時代において、旅行に行くことが困難な状況でも、世界各地のリアルな3D画像が見られることは、バーチャルツーリズム分野においてその体験をより向上させることでしょう。

参照元:Tool transforms world landmark photos into 4D experiences

※当サイトに掲載されている一部画像、スクリ-ンショット、文章に置いては著作権侵害を目的に利用しておらず、第三十二条で定められる引用の範囲で使用しています。万が一問題があればお問い合わせからご連絡ください。即刻削除いたします。また、本ブログは業務の研究開発のためのものとなり、一部、弊社に関連性が無いものも掲載しております。

Contact

お問い合わせ

人工知能・AIに関してのお問い合わせは
フォームまたはお電話にて。
フォームに必要事項をご入力の上、
「送信」ボタンを押してください。
担当者より、
回答・返信させていただきます。

人工知能・AI

すべての項目が入力必須となります。

名前
貴社名
メールアドレス
電話番号
ご予算
お問い合わせ内容

NAGOYA

名古屋オフィス

愛知県名古屋市中区丸の内1-17-19
キリックス丸の内ビル 5F

TEL:052-253-9866

Map view

TOKYO

東京オフィス

東京都千代田区神田錦町1-21-2
大手町モダンビルディング 4F

TEL:03-3525-8640

Map view