Texto a voz (TTS) se atribuye a la eficiencia de convertir sin problemas un archivo de texto de entrada en un archivo de audio de salida con una claridad razonable. Estas soluciones permiten a los usuarios participar en un entorno informático sin tener que leer manualmente archivos de texto o archivos de documentos.
Por ejemplo, las herramientas de texto a voz son una solución invaluable para usuarios con problemas de lectura y audición, lo que las hace perfectas para proyectos de aprendizaje electrónico. También es una alternativa a la contratación de un locutor, ya que ahorra en costes de contratación.
Por lo tanto, podemos resumir los beneficios de una solución de texto a voz con los siguientes puntos:
- Mejor experiencia de usuario, ya que cualquier transcripción de video se puede convertir en un archivo de audio con sonido natural.
- Mejorar la accesibilidad y comprensión de los materiales de aprendizaje, especialmente para los usuarios con problemas de lectura y audición.
- Dado que la mayoría de las soluciones de texto a voz se pueden realizar en varios idiomas, se mejoran las habilidades de lectura y estudio.
ansarino es una herramienta de texto a voz de sonido natural que se puede implementar en el entorno de terminal del sistema operativo Linux. Si está familiarizado con la API de Google Cloud Text-to-Speech, gosling es más un envoltorio a su alrededor.
Tabla de Contenidos
requisitos previos
- La última versión del sistema operativo Linux.
- Privilegios de usuario sudoer/root.
- Familiarícese con el uso del entorno de línea de comandos de Linux.
- Una cuenta de GCP La facturación está habilitada (obtienes 1 millón de caracteres por mes gratis y solo se te cobra cuando los excedes).
- Una vez que tenga una cuenta de GCP, habilite la API de TTS y Obtener cuenta de servicio.
Este artículo nos guía a través de la instalación y prueba de gosling como una solución de texto a voz con sonido natural.
Instalar gosling texto a voz en Linux
Necesitaremos un archivo de texto de muestra para demostrar nuestra solución de texto a voz.
$ nano speech.txt
A continuación, vaya a Página de liberación de ganso y descargar Archivo El archivo que mejor se adapte a la arquitectura del sistema de la distribución del sistema operativo Linux que está utilizando.
Finalmente, ejecutaré el siguiente comando wget para descargar la versión gosling 0.1.1 (según la última versión publicada en este artículo).
$ wget
Continuar para descomprimir el archivo pedido de alquitrán.
$ tar -xvzf gosling-v0.1.1-linux-amd64.tar.gz
archivo extraído ansarino de Archivo Un archivo es un archivo binario y, por lo tanto, ejecutable.Por lo tanto, para correr ansarinonecesitaremos implementar la siguiente sintaxis de comando en la terminal de Linux.
Además, asegúrese de estar en el mismo directorio que el directorio extraído ansarino binarios al hacer referencia ansarino Usa la sintaxis.
Generar audio desde un archivo de texto en Linux
En nuestro caso, la implementación anterior ansarino La sintaxis del comando es la siguiente:
$ ./gosling speech.txt speech.mp3
El archivo de audio de salida debe crearse y reproducirse en cualquier reproductor multimedia.
$ ls -l speech.mp3
Generar audio desde la entrada estándar
No necesariamente necesitamos generar archivos de audio a partir de archivos de texto. Podemos lograr lo mismo desde la entrada estándar de la siguiente manera:
$ echo "Hello and welcome to linuxshelltips" | ./gosling - new.mp3
Genere y reproduzca audio directamente desde la entrada estándar
Aquí podemos usar jugar de ffmpeg De la siguiente manera:
$ echo "LinuxShellTips is awesome" | ./gosling - - | ffplay -nodisp -autoexit -
más ansarino Las opciones se pueden encontrar ejecutando el comando:
$ ./gosling --help
si usted tiene ir lenguaje de programación instalado, listo para instalar ansarino Directamente desde el comando:
$ go install github.com/Samyak2/[email protected]
Todo va bien en su proyecto gosling de texto a voz. Si encuentra útil esta guía de artículos, no dude en dejar un comentario o retroalimentación.