Lo que parecía ciencia ficción en películas como Her ahora es una realidad. OpenAI ha anunciado que ChatGPT podrá ver y procesar video en tiempo real, permitiendo al famoso chatbot de inteligencia artificial interactuar con su entorno a través de la cámara de los dispositivos móviles.
Gracias al modelo multimodal GPT-4o, los usuarios podrán acceder a esta funcionalidad desde el modo de voz avanzado de la aplicación. Al activar la cámara, ChatGPT podrá identificar objetos, guiar al usuario en tareas cotidianas e interpretar el entorno, como lo demostró un miembro del equipo al pedir instrucciones para preparar café paso a paso. La latencia, según las pruebas iniciales, es mínima.

Esta nueva capacidad de visión también abre oportunidades para usos educativos y de accesibilidad. Por ejemplo, podría describir escenas a personas con discapacidad visual o asistir a padres al resolver problemas matemáticos junto a sus hijos. Además, permitirá compartir pantallas en tiempo real, ampliando su utilidad para tareas más complejas.
Sin embargo, no todos podrán acceder a esta novedad de inmediato. OpenAI informó que la funcionalidad estará disponible en los próximos días para suscriptores de ChatGPT Plus ($20 USD/mes) y Pro ($200 USD/mes) en la mayoría de los países. Por temas regulatorios, la Unión Europea queda fuera del despliegue inicial, aunque la empresa aseguró que trabaja para implementar la función en esa región lo antes posible.
Con esta actualización, OpenAI reafirma su liderazgo en la carrera por la inteligencia artificial avanzada, acercando cada vez más a ChatGPT a los asistentes digitales del futuro.
Fuente: Xataca.com