Acceder al contenido
Esto es Google

Proyecto Euphonia: La investigación del reconocimiento automático del habla se amplía para incluir nuevos idiomas, entre ellos, el español



Cuando las computadoras son capaces de reconocer patrones de habla más diversos, pueden ayudar a proporcionar más recursos para las personas con discapacidades y dificultades del habla en su vida diaria. En 2019, comenzamos a trabajar hacia este objetivo a través del Proyecto Euphonia, una iniciativa de investigación que tiene como objetivo hacer que el reconocimiento de voz sea más accesible para las personas con discapacidades del habla. Hoy, en honor al Día mundial de concientización sobre la accesibilidad, estamos ampliando nuestros esfuerzos de investigación a idiomas más allá del inglés, comenzando con pilotos en francés, hindi, japonés y español.

En muchos casos, cuando alguien con una discapacidad del habla usa cualquier asistente activado por voz, éste no lo entiende. Esto se debe en gran medida a que estas tecnologías de reconocimiento de voz no fueron entrenadas con un conjunto suficientemente diverso de muestras de habla, incluidas las muestras de personas con discapacidades del habla. Desde el lanzamiento de nuestra investigación, los voluntarios han contribuido con más de 1600 horas de muestras de habla, creando el conjunto de datos de habla desordenada más grande conocido en el mundo.

Estas contribuciones han permitido a los equipos de habla e investigación de Google llevar a cabo una investigación de aprendizaje automático de vanguardia en el reconocimiento de voz, que incluye la capacidad de crear modelos personalizados que comprendan a las personas individuales y el reconocimiento de voz a voz que permita la repetición de palabras en una voz sintetizada clara. Esta investigación también nos ayudó a lanzar Project Relate, una aplicación para Android actualmente en fase beta, que permite a las personas acceder a un modelo personalizado que ayuda a que la comunicación sea más accesible.

Estamos emocionados por el éxito de nuestra investigación en inglés y esperamos poder hacer progresos similares en otros idiomas, comenzando con francés, hindi, japonés y español, pero necesitamos tu ayuda. Hemos aprendido a través de nuestro trabajo que cuantas más muestras de habla exponemos a nuestros modelos de reconocimiento de voz, más personas son capaces de ser potencialmente entendidas.

Si a tu teléfono, computadora o dispositivo inteligente le resulta difícil responderte, o a las personas que acabas de conocer les cuesta entenderte, considera contribuir con este esfuerzo de investigación registrándote a través de nuestros formularios de interés en francés, hindi, japonés y español.