ByteDance, la empresa matriz de TikTok, ha presentado OmniHuman-1, un modelo de inteligencia artificial capaz de generar videos hiperrealistas a partir de una sola imagen. Este avanzado sistema de deepfake puede replicar gestos, movimientos corporales y voz de una persona con gran precisión, lo que ha generado preocupaciones sobre la privacidad y el uso de esta tecnología.
OmniHuman-1 se basa en modelos de difusión y transformadores que combinan sonido e imagen para lograr resultados naturales. Su entrenamiento se realizó con más de 19,000 horas de video, utilizando un proceso innovador que permite mejorar la calidad de los videos incluso con entradas de baja fidelidad. Gracias a su arquitectura, puede trabajar con imágenes de cualquier proporción, permitiendo crear videos realistas en distintos escenarios.

Entre sus características más destacadas, OmniHuman-1 puede animar dibujos, modificar movimientos específicos del cuerpo y recrear expresiones faciales detalladas. Sin embargo, los ingenieros de ByteDance reconocen que aún presenta ciertas limitaciones, como movimientos poco naturales en imágenes de baja calidad o dificultades para procesar acciones muy complejas.
A pesar de que OmniHuman-1 no está disponible para el público general, su lanzamiento ha reavivado el debate sobre los riesgos de los deepfakes. Según informes de seguridad en línea, la proliferación de videos falsos ha aumentado un 550% entre 2019 y 2023, lo que ha impulsado a plataformas como TikTok a implementar medidas de regulación. La compañía ha integrado la tecnología Content Credentials, que añade metadatos a los contenidos generados por IA, ayudando a los usuarios a identificarlos.
El avance de OmniHuman-1 marca un nuevo hito en la generación de contenido con IA, pero también plantea desafíos en la ética, privacidad y regulación de la inteligencia artificial en redes sociales y medios digitales.
Fuente: es.wired.com