El desarrollo de software para la asistencia por voz continúa avanzando junto con los algoritmos de inteligencia artificial

La tecnología de asistencia por voz es una industria competitiva en la que algunos de los principales actores tienen una gran aceptación. Google tiene Asistente, Amazon tiene Alexa, Apple tiene Siri y Microsoft tiene Cortana.

A pesar de que la gran tecnología tiene un punto de apoyo en los principales servicios disponibles para los consumidores, así como en los altavoces inteligentes que acompañan a esta tecnología, hay espacio para que las nuevas empresas ingresen a este campo. Servicios de subcontratación de TI son una excelente manera de hacerlo, ya que los desarrolladores de software pueden hacer uso de varios avances de reconocimiento de voz disponibles y crear software atractivo para segmentos de mercado especializados.

Gigantes del consumidor allanando el camino con Voice Bots

La mayoría de las empresas se centran en los consumidores en lugar de en los usuarios comerciales con su software de servicio de asistencia. Esto se debe a que se dirigen en su mayor parte a los usuarios de altavoces inteligentes y no solo a las aplicaciones individuales que ejecutan los usuarios.

Asistencia de voz

Microsoft ha recientemente Cortana degradado desde un asistente de voz integral hasta una aplicación independiente que se centra principalmente en la búsqueda de Windows 10. Cortana fue despegado Varias plataformas de Microsoft como Xbox a favor de ser un servicio de asistente de voz complementario a otros del mercado. Seguirá existiendo en el futuro, pero tendrá una naturaleza menos abarcadora mientras se enfoca en la búsqueda o en tareas particulares.

Este movimiento parece haber tomado desprevenidos a muchos usuarios. También ocurrió a pesar de que Cortana mostró un potencial temprano, con una gran base de usuarios de Microsoft y se centró en la asistencia en lugar de simplemente en la navegación centrada en el consumidor y manos libres.

El cambio de relevancia de Cortana muestra cuán competitivo es entrar en la industria y cuán difícil puede ser para las empresas seguir siendo competitivas a largo plazo. Microsoft preferiría centrarse en otros servicios y productos y permitir que empresas como Google inviertan recursos en mejorar el software de reconocimiento de voz.

Los avances en inteligencia artificial de reconocimiento de voz marcan el camino hacia el futuro de la tecnología de voz

La voz y el reconocimiento de voz están vinculados al aprendizaje automático y sus algoritmos. Estas tecnologías están allanando el camino para los avances relacionados con el reconocimiento de voz y la capacidad de un robot de voz para descifrar o comprender el habla y el sonido humanos de manera eficiente.

Como los algoritmos son capaces de interpretar voces, acentos y diferentes formas en que las personas hacen una sola pregunta y responden no solo correctamente, sino de varias formas matizadas para obtener información más específica, más fácil será atraer a los usuarios a un software que aproveche las tecnologías de voz. Piense en todas las formas en que alguien puede hacer una sola pregunta. No es tarea fácil, incluso para los humanos, entender a veces lo que se les pregunta sin tener la capacidad de decir: «¿vuelves?» o «¿puedes repetir eso por favor?»

Los usuarios esperan que la tecnología sea perfecta y haga instantáneamente lo que se espera sin fallas ni errores de ningún tipo. No quieren repetir sus respuestas o tener que bajar la voz y el tono para que un robot de voz interprete correctamente sus preguntas.

«Lo que impide que el reconocimiento de voz se convierta en una forma dominante de computación es su falta de fiabilidad», según C ª. «Los acentos regionales y los impedimentos del habla pueden alterar las plataformas de reconocimiento de palabras y el ruido de fondo puede ser difícil de penetrar».

Los usuarios de tecnología más jóvenes de hoy crecerán con Voice Bots

Este es realmente un campo donde los jóvenes de hoy crecerán sin manos. Cosas como la radio, la música, incluso mecanografiar por dictado serán la norma del mañana.

Definitivamente, el dinero está ahí para tomarlo y hacer inversiones ahora en tecnologías de voz puede significar grandes ganancias para el futuro a medida que más usuarios se sientan cómodos usando la voz y sus algoritmos de reconocimiento maduren.

Existen varios ejemplos de avances de tecnología de voz en software

Las empresas más pequeñas y las nuevas empresas también tienen algunas ideas interesantes en este campo que vale la pena considerar. Incluso hay algunas soluciones disponibles que son de código abierto. Sin embargo, también es posible aprovechar lo que otros grandes actores están haciendo con la tecnología actualmente con servicios que se destacan por sí mismos o se dirigen a herramientas o usuarios de interfaz específicos.

Un ejemplo de esto es el texto a voz. Esto es algo en lo que Google ha estado trabajando y específicamente permite que otros desarrolladores se aprovechen. La compañía tiene un servicio de síntesis de voz basado en la nube disponible llamado Google Cloud Text to Speech y puede tener una idea de lo que hace. aquí.

Google (Now) y Apple (Siri) parecen estar el más lejano adelante cuando se trata de tecnología de voz impulsada por algoritmos de inteligencia artificial. Sin embargo, este es un campo dinámico y hay muchas formas diferentes de usar la voz en el software para ayudar a los usuarios. Se están probando muchas ideas y, a medida que avanza la tecnología, también lo harán sus implementaciones.

El gigante de Mountain View también tiene disponibles servicios de traducción de voz aprovechando estos algoritmos y el software de reconocimiento de voz que ha estado desarrollando. Hay algunas empresas rivales y nuevas empresas con sus propias versiones de traducción de voz disponibles, como iTranslate, pero les resulta difícil competir con los recursos, los ingenieros y el poder de mercado de Google.

Todas estas diferentes tecnologías de voz son el resultado de los avances en los algoritmos de IA junto con el desarrollo de software eficiente y el análisis de big data. Este último incluye grandes conjuntos de datos de voz y habla que varían según la persona, la geografía, el idioma y muchos otros matices. La clave para avanzar en el reconocimiento de voz es recopilar datos sobre los usuarios y sus hábitos y poder utilizar estos datos de manera eficaz. Cuando se trata de aprendizaje automático, los robots de voz se encuentran en una etapa en la que deberían mejorar cuanto más tiempo se utilicen y poder adaptar sus capacidades de reconocimiento de voz a sus usuarios a lo largo del tiempo.

Deja un comentario