Lo último de OpenAI es impresionante. GPT-4o, su nuevo modelo de IA, es capaz de mantener una conversación fluida, entender lo que ve a través de la cámara y lo que le decimos y ofrecer respuestas de viva voz prácticamente en tiempo real. Es lo más cerca que hemos estado de hablar con las máquinas y la pregunta es ¿de dónde sale la voz? ¿Es una voz sintética o pertenece a alguien real? ¿Por qué la voz de la demo suena como la de Scarlet Johansson en ‘Her’?. Lo cierto es que desde septiembre de 2023, ChatGPT tiene voz. Bueno, no voz, voces. Cinco, para ser exactos: Breeze, Cove, Ember, Juniper y Sky. Son voces sintéticas en el sentido de que no es posible doblar todas y cada una de las palabras y frases que se pueden formar en todos los idiomas que admite actualmente (37, el español entre ellos), pero detrás de esas cinco voces hay, efectivamente, personas reales. OpenAI ha explicado de dónde vienen. Cuando OpenAI hizo la demo de GPT-4o no fueron pocos los usuarios que pensaron que la voz sonaba como la de la IA de la película ‘Her’ (que se llama Samantha, por cierto). Pero no. Aunque lo parece, la realidad es que esa voz lleva en ChatGPT desde hace mucho tiempo y su «nombre» es Sky. Según OpenAI, «no es una imitación de Scarlet Johansson, sino que pertenece a una actriz profesional que usó su voz natural». Sin embargo, la compañía, viendo la confusión, ha decidido poner en pausa el uso de la voz Sky. Para proteger su privacidad, OpenAI no ha desvelado el nombre de los actores de voz. Los requisitos. La selección de estas cinco voces fue muy meditada. A principios de 2023, OpenAI se alió con directores de casting y productores independientes, conocidos y galardonados (cuyos nombres tampoco han sido desvelados) para crear una serie de criterios que las voces tenían que cumplir. Al fin y al cabo, van a ser voces escuchadas por muchísimas personas. Para lograrlo, los ejecutivos de Chat GPT buscaron:
-Actores de orígenes diversos o que pudieran hablar varios idiomas
-Una voz atemporal
-Una voz accesible que inspire confianza
-Una voz cálida, atractiva, que inspire confianza, carismática y con un tono rico
-Natural y fácil de escuchar