El Portal de las Tecnologías para la Innovación

La IA de World Labs puede generar escenas 3D interactivas a partir de una sola foto

World Labs , la startup fundada por el pionero de la IA Fei-Fei Li, ha  presentado  su primer proyecto: un sistema de IA que puede generar escenas 3D similares a las de los videojuegos a partir de una sola imagen.

Muchos sistemas de inteligencia artificial pueden convertir una foto en modelos y entornos 3D, pero las escenas de World Labs son únicas porque son interactivas y modificables.

“Nuestra tecnología te permite entrar en cualquier imagen y explorarla en 3D”, escribió World Labs en una publicación de blog. “Más allá de la imagen de entrada, todo se genera”.

Laboratorios mundiales
El sistema de World Labs convierte una imagen en una escena 3D interactiva y explorable.Créditos de la imagen: World Labs

Las escenas generadas por IA, que cualquier persona con un teclado y un ratón puede explorar en una demostración en el sitio web de World Labs, tienen un aspecto impresionante, aunque un poco caricaturesco. Se reproducen en directo en el navegador y tienen una cámara controlable con una profundidad de campo simulada (DoF) ajustable. Cuanto más fuerte sea el efecto DoF, más borrosos aparecerán los objetos del fondo.

El sistema de World Labs es parte de una categoría emergente de IA llamada “ modelos mundiales ”.  Muchos  de  estos  modelos  pueden simular juegos y entornos 3D, pero con problemas de artefactos y consistencia. Por ejemplo, el modelo mundial que simula Minecraft de la startup Decart, Oasis , tiene una resolución baja y rápidamente “olvida” el diseño de los niveles.

Por el contrario, el enfoque de World Labs garantiza que las escenas permanezcan iguales una vez generadas y que obedezcan las leyes básicas de la física, lo que significa que tienen una sensación de solidez y profundidad.

El sistema de World Labs también puede aplicar efectos interactivos y animaciones a las escenas, como cambiar el color de los objetos e iluminar dinámicamente los fondos.

Laboratorios mundiales
Una escena generada por el sistema de World Labs.Créditos de la imagen: World Labs

“La mayoría de las herramientas de IA generativa crean contenido en 2D, como imágenes o videos”, escribió World Labs. “En cambio, generar en 3D mejora el control y la consistencia. Esto cambiará la forma en que hacemos películas, juegos, simuladores y otras manifestaciones digitales de nuestro mundo físico”.

Ahora bien, sin duda hay margen de mejora. Las escenas de World Labs no son totalmente explorables: los movimientos se limitan a un área pequeña (si intentas moverte fuera de ella, te toparás con un límite). Y hay errores de renderización ocasionales, por ejemplo, objetos que se mezclan de forma poco natural.

Pero World Labs dice que es sólo un «vistazo preliminar».

“Estamos trabajando arduamente para mejorar el tamaño y la fidelidad de nuestros mundos generados y experimentar con nuevas formas para que los usuarios interactúen con ellos”, escribió la startup en el blog.

Laboratorios mundiales
Parte de la demostración en el sitio de World Labs. Se pueden aplicar efectos a las escenas en tiempo real.Créditos de la imagen: World Labs

World Labs, que se lanzó a principios de este año, ha recaudado 230 millones de dólares en capital de riesgo de inversores como Andreessen Horowitz (a16z), Ashton Kutcher, Intel Capital, AMD Ventures y Eric Schmidt. La empresa, valorada en más de 1.000 millones de dólares, espera tener listo su primer producto en 2025.

Más allá de las escenas interactivas, World Labs planea crear herramientas que puedan ser útiles para profesionales como artistas, diseñadores, desarrolladores, cineastas e ingenieros. Sus clientes van desde desarrolladores de videojuegos hasta estudios cinematográficos.

“Ya tenemos la capacidad de crear mundos virtuales interactivos, pero cuesta cientos y cientos de millones de dólares y un montón de tiempo de desarrollo”, dijo el cofundador de World Labs, Justin Johnson, en un  episodio reciente  del podcast a16z. “[Los modelos de mundo] te permitirán no solo obtener una imagen o un clip, sino un mundo 3D completamente simulado, vibrante e interactivo”. TechCrunch. K. W. traducido al español

Artículos relacionados

Scroll al inicio