Según explican los creadores esto puede servir para crear un avatar más realista de una persona, para loa industria de los efectos especiales y para usarlo como telepresencia (en conferencias o videojuegos).
A diferencia de otros deepfakes de video generados con machine learning, este sistema no requiere un modelado 3D y puede funcionar con apenas una fotografía de base.
Estos videos realistas pueden generarse a partir de un único fotograma gracias a la gran base de datos de cabezas parlantes de distinta apariencia