Cómo construir una aplicación de reconocimiento de voz (En 7 Pasos)

Por editorial team

Stockbyte/Stockbyte/Getty Images

Cómo construir una aplicación de reconocimiento de voz. La construcción del reconocimiento de voz en tus aplicaciones puede simplificar la entrada de texto o hacer más fácil el control del texto sin utilizar el teclado o el ratón. Aunque puede ser muy difícil construir un programa de reconocimiento de voz por ti mismo, puede ser muy fácil integrar un motor de reconocimiento de voz ya existente a tu programa, especialmente para aquellos con conocimientos de programación informática.

Preparación del software de reconocimiento de voz

Paso 1

Agrupa tu software con un programa de reconocimiento de voz, como Dragon NaturallySpeaking o ViaVoice de IBM. Si eres un desarrollador de software, da la opción al usuario de comprar el software. Como parte del proceso de instalación de la aplicación, haz que el usuario también instale el programa de reconocimiento de voz.

Paso 2

Configura el software de reconocimiento de voz. Para que tu aplicación sea capaz de sacar el máximo provecho del reconocimiento de voz, el programa debe estar correctamente configurado. Esto significa que la configuración del micrófono e idioma debe ajustarse adecuadamente para aprovechar de forma óptima las capacidades del programa.

Paso 3

Entrena el programa de reconocimiento de voz. Esto puede tener que hacerse fuera de la aplicación, dependiendo de su naturaleza. Si este es el caso, la mayoría de los programas de reconocimiento de voz incluye programas de formación y pantallas, o el programa puede entrenarse en un procesador de textos.

Integrar entrada de texto

Paso 1

Construye un control de texto o de texto enriquecido en tu aplicación. Muchos de los programas de reconocimiento de voz funcionan con todos los programas que tienen opciones de entrada de texto. Si lo que necesitas es la introducción de palabras, la aplicación probablemente no necesite ninguna modificación para trabajar con un programa de reconocimiento de voz.

Paso 2

Incluye espacio adicional en el control de entrada de texto. Dado que los programas de reconocimiento de voz pueden reconocer el habla a un ritmo más rápido de lo que muchos pueden escribir, puede que sea necesario aumentar el tamaño de los controles de entrada de texto. Deja suficiente espacio para escribir texto y revisa en tiempo real.

Interacción a través de un API

Paso 1

Utiliza una interfaz de programación de aplicaciones (API) para interactuar con el software de reconocimiento de voz. Muchos de los programas de reconocimiento de voz incluyen una API para que otras aplicaciones la utilicen. La utilización de una permitirá que tu aplicación tenga acceso total a todas las funciones de reconocimiento de voz y dará al usuario un control total sobre la aplicación a través del habla.

Paso 2

Integra la API con la aplicación. Esto puede incluir hacer más de un "modo" de control por voz. Crea palabras de comando, como "guardar archivo" o "crear nuevo archivo". Al introducir el texto, los usuarios también deben poder corregir sin tener que tocar el teclado y activar las características de texto enriquecido, como negrita, cursiva, subrayado y otros cambios de fuente.