Xiaomi ha dado a conocer su última aplicación de algoritmos avanzados y tecnología de voz de desarrollo propio a nivel de accesibilidad. La tecnología Text-To-Speech de estilo espontáneo, desarrollada por Xiaomi AI Lab, se utiliza para generar una voz única y personalizada para los usuarios con trastornos del habla.
Ahora, gracias a la increíble tecnología de Xiaomi, estos usuarios podrán comunicarse con las demás personas utilizando «su propia voz», en lugar de la típica y monótona voz electrónica. Como parte del proyecto de investigación previa «Own My Voice» dirigido por el Comité Técnico de Xiaomi, este exitoso proyecto demuestra el compromiso de la compañía de «permitir que todas las personas en el mundo disfruten de una vida mejor a través de la tecnología más innovadora».
¿Por qué Xiaomi ha lanzado este proyecto?
Xiaomi se preocupa por las personas y se esfuerza por satisfacer sus diversas necesidades a través de la innovación tecnológica. En ese sentido, la marca se dio cuenta del deseo de muchos usuarios con trastornos del habla de poseer sus voces únicas para la comunicación diaria, por eso decidió crear el proyecto «Own My Voice» para invitar a uno de sus Xiaomi Fans con trastornos de habla a experimentar por primera vez esta solución.
Al respecto, Zhu Xi, coordinador del Comité de Tecnología para el equipo de “Tech for Good” de Xiaomi Corporation, dijo: «Nos entusiasma explorar los múltiples valores que nos aporta la innovación tecnológica, como responder a las demandas de los usuarios en cuanto a la identidad propia y la construcción de la misma».
¿Cómo se llevó a cabo el proyecto?
Para generar la voz más adecuada y personalizada para el destinatario, el equipo del proyecto reclutó a más de 200 voluntarios de Xiaomi para que donaran sus voces. Utilizaron el algoritmo de coincidencia de la huella vocal para comparar las características de las voces donadas por los voluntarios con las de la voz del destinatario.
De este modo, encontraron la voz más adecuada como sonido básico de referencia para el usuario. Teniendo en cuenta la personalización y la protección de la privacidad, la voz real elegida se manipuló con una compleja modificación acústica para formar un sonido de voz nuevo y original.
A continuación, el equipo utilizó la tecnología Text-To-Speech de estilo espontáneo para entrenar el modelo de IA, haciendo que esta nueva voz adquiriera gradualmente un ritmo y una entonación naturales que pudieran expresar con veracidad la emoción y el tono de una persona.
El proyecto «Own My Voice» combina los algoritmos más avanzados con la tecnología de voz desarrollada por Xiaomi para garantizar la especificidad, seguridad y autenticidad de la voz sintetizada, creando una nueva idea de síntesis de voz personalizada para los usuarios con trastornos del habla.
¿Cuál es la importancia del proyecto?
La columna vertebral de este proyecto es un grupo de expertos en tecnología del habla de Xiaomi AI Lab. Desde 2017, han publicado 37 artículos sobre el lenguaje en las actas de las principales conferencias internacionales, como la Conferencia Internacional sobre Acústica, Habla y Procesamiento de Señales (ICASSP). El éxito de «Own My Voice» depende principalmente de la tecnología Text-To-Speech de estilo espontáneo desarrollada por ellos.
Esta tecnología hace que la voz sintetizada se parezca a la de un humano real en su entonación, pausa, velocidad y otras características. Así se sustituye la sensación monótona y antinatural de la voz electrónica por otra más natural. Actualmente, esta tecnología se aplica a muchos dispositivos inteligentes equipados con Xiaoai, el asistente de voz de IA de Xiaomi. El proyecto «Own My Voice» demuestra que la tecnología Text-To-Speech de estilo espontáneo también puede adoptarse ampliamente en áreas de accesibilidad y mejorar la experiencia del usuario.
Zhu Xi añadió: «Si advertimos y atendemos las necesidades de los grupos minoritarios en una fase temprana, el proceso de difusión de la tecnología podría acortarse en gran medida. Esto permite que los beneficios de las nuevas tecnologías sean accesibles a los usuarios con necesidades especiales sin demora».
En el futuro, Xiaomi seguirá recibiendo las opiniones de los destinatarios de la voz y estudiará la viabilidad de este proyecto en un ámbito más amplio. Xiaomi seguirá potenciando la accesibilidad a través de la tecnología de vanguardia, esforzándose por satisfacer las diversas necesidades de las personas a través de la innovación tecnológica.