World Labs , la startup fundada por el pionero de la IA Fei-Fei Li, ha presentado su primer proyecto: un sistema de IA que puede generar escenas 3D similares a las de los videojuegos a partir de una sola imagen.
Muchos sistemas de inteligencia artificial pueden convertir una foto en modelos y entornos 3D, pero las escenas de World Labs son únicas porque son interactivas y modificables.
“Nuestra tecnología te permite entrar en cualquier imagen y explorarla en 3D”, escribió World Labs en una publicación de blog. “Más allá de la imagen de entrada, todo se genera”.
Las escenas generadas por IA, que cualquier persona con un teclado y un ratón puede explorar en una demostración en el sitio web de World Labs, tienen un aspecto impresionante, aunque un poco caricaturesco. Se reproducen en directo en el navegador y tienen una cámara controlable con una profundidad de campo simulada (DoF) ajustable. Cuanto más fuerte sea el efecto DoF, más borrosos aparecerán los objetos del fondo.
El sistema de World Labs es parte de una categoría emergente de IA llamada “ modelos mundiales ”. Muchos de estos modelos pueden simular juegos y entornos 3D, pero con problemas de artefactos y consistencia. Por ejemplo, el modelo mundial que simula Minecraft de la startup Decart, Oasis , tiene una resolución baja y rápidamente “olvida” el diseño de los niveles.
Por el contrario, el enfoque de World Labs garantiza que las escenas permanezcan iguales una vez generadas y que obedezcan las leyes básicas de la física, lo que significa que tienen una sensación de solidez y profundidad.
El sistema de World Labs también puede aplicar efectos interactivos y animaciones a las escenas, como cambiar el color de los objetos e iluminar dinámicamente los fondos.
“La mayoría de las herramientas de IA generativa crean contenido en 2D, como imágenes o videos”, escribió World Labs. “En cambio, generar en 3D mejora el control y la consistencia. Esto cambiará la forma en que hacemos películas, juegos, simuladores y otras manifestaciones digitales de nuestro mundo físico”.
Ahora bien, sin duda hay margen de mejora. Las escenas de World Labs no son totalmente explorables: los movimientos se limitan a un área pequeña (si intentas moverte fuera de ella, te toparás con un límite). Y hay errores de renderización ocasionales, por ejemplo, objetos que se mezclan de forma poco natural.
Pero World Labs dice que es sólo un «vistazo preliminar».
“Estamos trabajando arduamente para mejorar el tamaño y la fidelidad de nuestros mundos generados y experimentar con nuevas formas para que los usuarios interactúen con ellos”, escribió la startup en el blog.
World Labs, que se lanzó a principios de este año, ha recaudado 230 millones de dólares en capital de riesgo de inversores como Andreessen Horowitz (a16z), Ashton Kutcher, Intel Capital, AMD Ventures y Eric Schmidt. La empresa, valorada en más de 1.000 millones de dólares, espera tener listo su primer producto en 2025.
Más allá de las escenas interactivas, World Labs planea crear herramientas que puedan ser útiles para profesionales como artistas, diseñadores, desarrolladores, cineastas e ingenieros. Sus clientes van desde desarrolladores de videojuegos hasta estudios cinematográficos.
“Ya tenemos la capacidad de crear mundos virtuales interactivos, pero cuesta cientos y cientos de millones de dólares y un montón de tiempo de desarrollo”, dijo el cofundador de World Labs, Justin Johnson, en un episodio reciente del podcast a16z. “[Los modelos de mundo] te permitirán no solo obtener una imagen o un clip, sino un mundo 3D completamente simulado, vibrante e interactivo”. TechCrunch. K. W. traducido al español