DESDE LEJOS, CERCA

¿Y si la inteligencia artificial nos cambia la voz?

0

La voz que salió en la demostración que hizo la compañía sonaba bastante humana, a años luz de las primeras voces sintéticas, que sonaban robóticas y mecánicas. Ahora pareciera que vamos a poder tener una conversación agradable y sencilla con una máquina, sin tener la sensación permanente de estar hablando con un robot. 

Ya habíamos podido ver la capacidad de la inteligencia artificial de copiar voces humanas con productos que permiten clonarla, y que se han hecho conocidos por los riesgos que traen. Un caso fue el de un mensaje telefónico generado con inteligencia artificial, en el que supuestamente el presidente de los Estados Unidos, Joe Biden, les decía a votantes de las primarias que no se molesten en ir a votar. Y hay muchísimas advertencias de cómo esto podría crecer y transformarse en el paraíso de los estafadores, que podrían clonar voces de otros para pedirle plata a la familia o amigos. 

Como tantas cosas con la inteligencia artificial, trae enormes posibilidades, desde lo espectacular a lo distópico, sin que sepamos todavía si se van a concretar. En el camino, nos obliga a pensar cómo nos distinguimos los humanos. Y ahora, que entra con más fuerza en el terreno de la voz, invade algo muy propio en lo que solemos pensar poco. 

La voz no es solo el tono de la voz. Es la entonación, la manera de terminar la frase más hacia arriba en tono de duda o más tajante, el volumen al que hablamos, la velocidad y mucho más. Y todos estos aspectos los estamos modificando constantemente, la mayor parte del tiempo sin darnos cuenta. Es muy claro cuando escuchás a una amiga que se acaba de poner en pareja y atiende el teléfono al lado tuyo, poniéndose toda melosa, pero en general no estamos tan atentos a los cambios de voz, propios o ajenos. Sin embargo, está bastante estudiado que la modificamos permanentemente 

Un caso es cuando queremos imponer autoridad, ahí solemos ir hacia tonos más graves. Esto fue lo que encontró un estudio, en el que pusieron a un grupo de personas a hacer un ejercicio en el que tenían que ponerse de acuerdo sobre un tema ficticio -qué necesitaría un astronauta si se quedase varado en la luna- y luego les preguntaron cuán influyente había sido cada uno de sus compañeros en la discusión. Lo que concluyeron fue que quienes llevaban sus voces hacia tonos más graves quedaban más arriba en el ranking. 

Hay bastante evidencia también, de que las voces más graves son las que generan mayor confianza. Se han hecho algunos estudios sobre líderes políticos, por ejemplo, que tendemos a preferir a aquellos con voz más grave, aunque de más está decirlo, el tono de voz no tiene ninguna relación con las capacidades de las personas. 

Más increíble aún, las mujeres volvimos nuestros tonos de voz más graves a lo largo de los años, de generación en generación, probablemente para transmitir una imagen de mayor autoridad en el mercado laboral. Un análisis que hizo un grupo de investigadores en Australia comparó voces de mujeres de 1945 con las de 1993, y encontraron que las más actuales son significativamente más graves. En otros países se hicieron análisis que llegaron a resultados similares. Aunque los estudios no se hicieron en la Argentina, basta ver algunos clips de los años ‘40 para escuchar tonos que ya no se usan (como en este clip de Niní Mashal). 

Si la voz puede tener un efecto tan grande en nuestra percepción de las personas, ¿qué pasaría si pudiéramos cambiarla a voluntad? Hoy podemos modificar un poco los tonos dentro de nuestro registro, pero no podemos cambiar radicalmente cómo sonamos. Pero los desarrollos de la inteligencia artificial, muchos pensados para poder hacer traducciones simultáneas en cualquier momento, o para el doblaje de películas, podrían traer un cambio radical. 

Si todos pudiéramos elegir una voz perfecta, ¿terminaríamos escuchando todo el día variaciones del tono de Scarlett Johansson en la película Her?, ¿O querríamos todos la voz de Morgan Freeman? Si te parece mucho pensar que la tecnología puede cambiar cómo percibimos los tonos de otros, pensá el efecto que ha tenido el autotune en la música. Una herramienta implementada a fines de los años ‘90 para ayudar a tapar errores y afinar el canto, que cambió cómo apreciamos algunos tipos de música. 

“Cambiamos el paradigma de afinación y de musicalidad a partir del autotune, especialmente en algunos géneros como el trap, donde la búsqueda es muy distinta de lo que estábamos acostumbrados”, explica Soledad Sacheri, doctora en fonoaudióloga y vicepresidenta de la Sociedad Argentina de la Voz. 

Sobre la posibilidad de que algo así ocurra con nuestras voces cotidianas, Sacheri señala que “es posible que pase algo similar a lo que ocurrió con Photoshop, que empiece a producirse con la voz esa búsqueda de perfección”, sin embargo, cree que “hoy lo que se busca no son siempre voces perfectas, sino más naturales”. Puede ser que mantengamos el valor de nuestra imperfección natural y al entrar en el mundo de voces sintéticas ansiemos escuchar voces humanas. O que terminemos todos con voces artificiales y perfectas. Como tanto con la inteligencia artificial las oportunidades son enormes y los riesgos también. 

OS/MF