La próxima semana, en la Conferencia de reconocimiento de patrones y visión por computadora (CVPR) en Vancouver, Canadá, NVIDIA será presentado como el ganador del Desafío de predicción de ocupación 3D altamente competitivo para el desarrollo de conducción autónoma.

Esta competencia atrajo a más de 400 presentaciones de casi 150 equipos de 10 regiones diferentes. El objetivo del desafío es predecir el estado de cada vóxel en una escena tridimensional, es decir, cada punto de datos en una cuadrícula de vista de pájaro 3D. Los vóxeles se pueden clasificar como libres, ocupados o desconocidos.

La predicción de la ocupación en 3D es crucial para el desarrollo de sistemas autónomos seguros y robustos. Utiliza redes neuronales convolucionales de última generación y modelos de transformadores habilitados por la plataforma DRIVE de NVIDIA, brindando información valiosa para las pilas de planificación y control de vehículos autónomos (AV).

El científico investigador sénior de aprendizaje y percepción en NVIDIA, Zhiding Yu, comenta que se presentan dos avances importantes en AV. Por un lado, utiliza un diseño de modelo de última generación que proporciona una excelente percepción de vista de pájaro. Por otro lado, demuestra la efectividad de los modelos visuales básicos con hasta mil millones de parámetros y entrenamiento a gran escala en la predicción de ocupación 3D.


Detección de objetos o espacios libres

En los últimos años, la percepción de la conducción autónoma ha evolucionado desde tareas en 2D, como la detección de objetos o espacios libres en imágenes, hacia un razonamiento en 3D con múltiples imágenes de entrada. Esto permite una representación detallada, flexible y precisa de objetos en escenas de tráfico complejas, lo cual es crucial para cumplir con los requisitos de seguridad en la percepción de la conducción autónoma, según José Álvarez, director de investigación aplicada AV y científico distinguido de NVIDIA.

Zhiding Yu presentará el trabajo premiado del equipo de investigación de NVIDIA en el Taller de conducción autónoma de extremo a extremo de CVPR, así como en el Taller de conducción autónoma centrado en la visión. Además de ganar el primer lugar en el desafío, NVIDIA también recibirá un Premio a la Innovación durante el evento, en reconocimiento a sus nuevos conocimientos en el desarrollo de módulos de transformación de vistas, que han logrado un rendimiento sustancialmente mejorado en comparación con enfoques anteriores, según el comité del taller CVPR.

Si estás interesado en leer el documento técnico, lo tienes aquí.