Acceder al contenido
Esto es Google

Una linda historia para contar en el Día Internacional de la Audición



Google research scientist Dimitri Kanvesky and engineer Chet Gnegy worked together to bring Live Transcribe, a new Android app, to life to accomplish just that.
10:25

En el Día Internacional de la Audición, hablamos con uno de los Googlers detrás de nuestra tecnología de asistencia.

Dimitri Kanevsky, un científico investigador de Google con una amplia experiencia en matemáticas, sabe el impacto que la tecnología puede tener en la vida de las personas cuando se desarrolla teniendo en cuenta la accesibilidad. Después de haber perdido la audición en la primera infancia, él imagina un mundo en el que la tecnología hace que sea más fácil para las personas con problemas de audición participar en conversaciones diarias en persona con gente que escucha, como pedir café en una cafetería, conversar con compañeros de trabajo o hacer las compras en la tienda.

Dimitri ha estado convirtiendo esa idea en una realidad. Fue co-creador de Live Transcribe, nuestra tecnología de voz a texto que se lanzó en 2019. Hoy, más de un millón de personas utilizan Live Transcribe todos los días para comunicarse, y con el lanzamiento del modo sin conexión en las próximas semanas, las personas podrán acceder a él incluso cuando el Wi-Fi y los datos no estén disponibles.

En el Día Internacional de la Audición, hablamos con Dimitri sobre su trabajo, por qué es importante desarrollar soluciones para todos y qué predice para el futuro de la tecnología de accesibilidad.

Cuéntanos más sobre tus antecedentes y tu trabajo en Google.

Me enfoco en optimizar el reconocimiento del habla y el lenguaje para todos. En 1984, cuando me mudé a los Estados Unidos, no había servicios de transcripción para personas con problemas de audición. Quería cambiar eso, así que decidí trabajar en tecnologías de reconocimiento de voz para ayudar a que las personas que no escuchan puedan comunicarse. Después de pasar de la academia para trabajar en esta área directamente, me mudé al equipo de reconocimiento de voz de Google en 2014. Pasé este tiempo enfocado en desarrollar algoritmos de reconocimiento de voz que podrían mejorar la precisión. Este enfoque es lo que permitió a nuestros equipos comenzar a desarrollar aplicaciones prácticas para ayudar a las personas a comunicarse, como Live Transcribe y Live Caption.

¿Cómo ha moldeado tu carrera tu experiencia personal?

Perdí completamente la audición cuando tenía un año. Aún así, asistí a escuelas para personas oyentes. Aprendí a leer los labios muy bien para poder comunicarme con otros estudiantes y maestros, y mi familia fue de gran ayuda, lo que me facilitó las cosas. Cuando cambié de escuela, mi padre, que era maestro en mi escuela, se aseguró de que estuviera en una clase con niños que conocía para que fuera una transición más ligera.

Pero en octavo grado, me mudé a una escuela de matemáticas con nuevos maestros, y ya no podía leer sus labios para saber qué enseñaban en clase ni comunicarme con mis nuevos compañeros de clase. Me senté día tras día sin entender lo que estaban explicando, y tuve que aprender a partir del material de los libros de texto. Si hubiera tenido una tecnología como Live Transcribe cuando estaba creciendo, mi experiencia hubiera sido muy diferente.

¿Por qué te apasiona la creación de tecnologías de asistencia?

La tecnología ofrece enormes oportunidades para ayudar a las personas con capacidades diversas. Sé esto de primera mano. Cuando lanzamos Live Transcribe por primera vez en 2019, que ahora es sólo una de las muchas tecnologías desarrolladas para apoyar a personas sordas o con problemas de audición, me ayudó a resolver los desafíos diarios.

Mi sueño es usar la tecnología de reconocimiento de voz para ayudar a las personas a comunicarse: puede ayudar a las personas con pérdida auditiva como un mecanismo para una comunicación más sencilla y a que las personas con problemas de habla sean entendidas por otros.

¿Qué te emociona cuando piensas en la tecnología de reconocimiento de voz dentro de diez años?

A medida que la tecnología avanza, desbloqueará nuevas posibilidades, como la capacidad de transcribir el habla de las personas mientras cambian de idioma, comprender a las personas con todos los acentos y habilidades motoras del habla, indicar eventos sonoros con símbolos visuales e integrar automáticamente tecnologías de reconocimiento de signos o retroalimentación háptica adicional.

Aún más en el futuro, quiero ver que la transcripción esté disponible en tecnologías prácticas que se usen en dispositivos para los ojos. El reconocimiento de voz se volverá ubicua para que la interacción entre sí sea posible a través de una red de comunicación, sin tener que usar o sostener ningún dispositivo especial.

¿Qué quieres que otros aprendan del Día Internacional de la Audición?

El Día Internacional de la Audición es una oportunidad para hablar sobre las oportunidades tecnológicas que tendrán un tremendo impacto en la vida de las personas en todo el mundo. Según la OMS, una de cada diez personas experimentará pérdida auditiva para el 2050.

Por: Sagar Savla, Gerente sénior de producto, Google Research