
Dividir y conquistar: XR de alta calidad para todos
La tecnología de Realidad Extendida (XR) promete revolucionar nuestra vida personal y profesional al proporcionar experiencias inmersivas e interactivas para el entretenimiento, la educación o la comunicación. Sin embargo, la creación de estas experiencias requiere una potencia de procesamiento sustancial, que a menudo requiere hardware de alta gama que puede comprometer la movilidad, la comodidad y el rendimiento, lo que puede limitar la adopción generalizada. La representación dividida ofrece a los usuarios lo mejor de ambos mundos al descargar el procesamiento a servidores potentes en la red y entregar XR de alta calidad a dispositivos de consumo livianos como teléfonos inteligentes y gafas AR. Imagine jugar juegos VR de primer nivel en teléfonos inteligentes o auriculares independientes sin preocuparse por la compatibilidad del hardware o las grandes descargas. Nokia, en colaboración con socios de 3GPP, es pionera en tecnologías estandarizadas para realizar renderizado dividido en redes móviles. ¿Qué es una aplicación XR? Realidad Extendida (XR) es un término completo que abarca una gama de tecnologías inmersivas, incluyendo Realidad Virtual (VR), Realidad Aumentada (AR) y Realidad Mixta (MR). VR sumerge a los usuarios en un entorno completamente digital, a menudo a través de auriculares que bloquean el mundo físico. AR superpone la información digital en nuestra visión del mundo real, mejorando nuestra percepción de la realidad a través de dispositivos como teléfonos inteligentes o gafas AR. MR combina elementos de VR y AR, lo que permite que los objetos digitales y físicos interactúen en tiempo real. Estas experiencias se entregan a través de “XR applications” diseñadas para procesar y renderizar entornos digitales complejos en tiempo real, al tiempo que analizan y posiblemente integran el entorno real. Una aplicación XR incluye, más allá de los datos que eventualmente se representan como contenido de audio y visual y son consumidos por el usuario, múltiples componentes para crear una experiencia inmersiva. La Figura 1 ilustra algunos de estos componentes, incluyendo la gestión de entradas, seguimiento, computación espacial, física, gestión de interacción, ejecución de lógica de experiencia, renderizado y visualización. Juntos, estos componentes contribuyen al gran tamaño de las aplicaciones XR. La mayoría de las aplicaciones XR se descargan y se ejecutan en dispositivos como teléfonos inteligentes, tabletas o auriculares. El proceso de renderizado, manejado por un motor de renderizado, suele ser la tarea más intensiva en recursos y requiere potentes chips especializados de la Unidad de Procesamiento de Gráficos (GPU), lo que dificulta que estos dispositivos de consumo con procesamiento limitado y capacidad de potencia manejen aplicaciones XR intensivas en recursos.Esto puede conducir a una calidad gráfica más pobre, un drenaje más rápido de la batería y el calentamiento del dispositivo, reduciendo en última instancia el rendimiento general y la Calidad de Experiencia (QoE) para los usuarios finales. Además, descargar una aplicación XR grande puede llevar mucho tiempo y puede consumir un almacenamiento significativo del dispositivo. Figura 1: Componentes de representación de XR Cómo funciona el renderizado dividido La representación dividida, como su nombre indica, divide la carga de trabajo computacional de una aplicación XR entre el dispositivo del usuario y los potentes servidores remotos accesibles a través de una red de comunicaciones. Esto permite la entrega de experiencias XR complejas y visualmente impresionantes a los usuarios finales con dispositivos que tienen recursos limitados. El paradigma de renderizado dividido permite que las operaciones computacionalmente complejas de una aplicación XR se descarguen en un servidor Edge o Cloud. El servidor recibe la entrada del usuario y los datos del sensor, ejecuta todas las operaciones de la aplicación, renderiza el marco gráfico, lo codifica y lo transmite al dispositivo cliente. Luego, el cliente decodifica el marco recibido, corrige cualquier desajuste de pose y lo muestra. Aunque evidentemente útil, este enfoque, ilustrado en la Figura 2, tiene desafíos que superar. El video de alta calidad del servidor de renderizado dividido da como resultado altas tasas de datos, incluso con compresión de video. Además, garantizar un buen QoE para XR inmersivo requiere una baja latencia de interacción. Lograr altas tasas de datos consistentes y baja latencia a través de Internet puede ser difícil de lograr. Figura 2: Representación dividida Habilitación de renderizado dividido a través del ecosistema 3GPP Nokia, junto con otros miembros de los 3rd Generation Partnership Project (3GPP), ha estado activo en el desarrollo de estándares para la representación dividida (SR) para redes móviles. Como parte de la versión 19, la segunda versión de 5G-Advanced, 3GPP Service and System Aspects Working Group 4 (SA4) pronto finalizará TS 26.567 para soporte de renderizado dividido sobre Subsistemas Multimedia IP (IMS). Esta especificación utiliza el canal de datos IMS y el Protocolo de Transporte en Tiempo Real (RTP) para entregar medios renderizados divididos a dispositivos compatibles con los estándares 3GPP, lo que permite el uso de Calidad de Servicio (QoS) garantizada para el intercambio de medios y metadatos dentro de la red móvil. Anteriormente en la versión 18, también se definió un habilitador de servicios de medios de renderizado dividido para servicios que no son IMS en TS 26.565. Los servicios 3GPP SR estandarizan los formatos de mensajes de metadatos, las capacidades de los medios y los elementos de arquitectura, ofreciendo marcos de implementación interoperables y extensibilidad a nivel de aplicación a los proveedores de servicios. Las aplicaciones XR de renderizado dividido en servidores de borde de red reducen la latencia y permiten a los proveedores de servicios de aplicaciones solicitar perfiles QoS específicos para sus aplicaciones. 3GPP también ha introducido características como granular Conciencia del tráfico de la aplicación XR en la red para cumplir con los estrictos requisitos de red del tráfico XR, incluido el tráfico generado por soluciones de renderizado dividido. Para que el proceso sea adecuado para diferentes condiciones de red o dispositivo, el servidor de renderizado dividido 3GPP en la red y el cliente de renderizado dividido (es decir, el dispositivo de usuario) pueden aceptar la renderización dividida flexible al comienzo del proceso de renderizado dividido. Para una descarga de cálculo máxima, el servidor lo renderiza todo, pero los dispositivos también pueden ejecutar algunas tareas de renderizado mediante el