Por Edd Gent
Cuando
comience la Copa del Mundo de fútbol este jueves, imagínenlo como un
"holograma" 3D en la mesa de su cocina. Eso puede no estar lejos
gracias a una nueva técnica que convierte los videos de YouTube en
reconstrucciones 3D de los partidos.
La clave del
enfoque es una red neuronal convolucional, un tipo de algoritmo de inteligencia
artificial modelado libremente en la parte del cerebro que procesa datos
visuales, que los investigadores entrenaron para estimar qué tan lejos están
las superficies de cada jugador de la cámara que grabó el partido.
La red
analizó 12,000 imágenes 2D de jugadores extraídos del videojuego de
fútbol FIFA junto con los datos 3D correspondientes del motor del juego
para aprender cómo se correlacionan los dos.
Eso le
permitió estimar los mapas de profundidad para los jugadores de imágenes 2D
invisibles. Cuando se muestran videos no vistos, el sistema predijo con
precisión mapas de profundidad para cada jugador y los combinó con el metraje
en color para reconstruir cada jugador en 3D.
Luego, los
jugadores se superpusieron en un campo de fútbol virtual que permite ver el
partido en cualquier visor de contenido 3D desde una variedad de ángulos.
Los
investigadores probaron el enfoque con las gafas inteligentes HoloLens de
Microsoft, que les permitieron superponer la reconstrucción 3D en una mesa de
la vida real.
El producto
final todavía tiene fallas, no puede recrear la pelota, no funciona en tiempo
real, y solo permite puntos de vista desde el lado del campo donde se grabó el
video. Pero la técnica podría ser más escalable que los enfoques
principales para reconstruir los deportes en 3D, que requieren arreglos de
cámaras alrededor del terreno de juego registrando cada ángulo.
Los
investigadores dicen que el enfoque también debería funcionar para otros
eventos que ocurren en escenarios predefinidos, como conciertos de música o
teatros.