Tutoriales

Speech Note: aplicación de traducción, conversión de texto a voz y reconocimiento de voz sin conexión para Linux

Notas de la conferencia es una aplicación de código abierto centrada en la privacidad que proporciona sin conexión voz a texto (TST), texto a voz (síntesis de voz), y traducción automática (MT) capacidades. Con las notas de voz, puedes tomar, leer y traducir notas en varios idiomas.

Las notas de voz son completamente válidas. Desconectadotodo el procesamiento de texto y voz se realiza localmente en su dispositivo. Este no envía datos a Internet, garantizando su privacidad.

Admite reconocimiento de voz, síntesis y traducción en varios idiomas, y se agregan nuevos idiomas periódicamente.

Cada función de Speech Note utiliza un motor de procesamiento diferente, lo que brinda a los usuarios flexibilidad y opciones. Actualmente, las anotaciones de voz utilizan los siguientes motores de procesamiento:

  • Voz a texto (STT)
    • Coqui STT (una bifurcación de Mozilla DeepSpeech)
    • wask
    • susurro.cpp
    • susurro más rápido
    • festival de la tarde de abril
  • Texto a voz (TTS)
    • hablando-ng
    • mbrora
    • Flautista
    • Voz RH
    • Koki TTS
    • Imitación 3
    • susurro
  • Traducción automática (MT)

Los usuarios avanzados pueden habilitar modelos personalizados compatibles con motores compatibles editando el archivo de configuración y reiniciando la aplicación.

Anotación de voz completa libre de usar El código fuente está disponible públicamente bajo la licencia pública de Mozilla versión 2.0.

escrito en doLas anotaciones de voz están disponibles para linux y Sistema operativo pez vela.

En este artículo discutiremos cómo Instalar y usar notas de voz en Linux.

Instalar notas de voz en Linux

Las anotaciones de voz están disponibles en varias distribuciones de Linux y sistemas operativos Sailfish.

Para plataformas Linux, las anotaciones de voz están disponibles en Flathub. Asegúrese de que Flatpak esté instalado en su sistema Linux.

Después de instalar Flatpak, puedes instalar la anotación de voz usando el comando:

flatpak install flathub net.mkiol.SpeechNote

La distribución Flatpak de Speech Note brinda flexibilidad a través de diferentes paquetes que satisfacen necesidades específicas:

  • Paquete básico (net.mkiol.SpeechNote): Contiene todas las dependencias para una funcionalidad completa, incluidas las bibliotecas «pesadas». Requiere mucho espacio en disco después de la instalación.
  • Paquetes complementarios: Proporciona aceleración de GPU para AMD (net.mkiol.SpeechNote.Addon.amd) y NVIDIA (net.mkiol.SpeechNote.Addon.nvidia) y acelera ciertas operaciones.
  • Paquete pequeño: Las alternativas más pequeñas ofrecen sólo una funcionalidad básica y son ideales para usuarios con espacio en disco limitado. También se puede utilizar junto con complementos de aceleración de GPU.

Una tabla comparativa que describe el tamaño y las características de cada suite está disponible en el repositorio oficial de GitHub de Voice Notes.

si lo eres ArquitecturaLinux y sus variaciones, p.e. Sistema operativo Endeavour y ManjaroLinuxEl paquete de anotaciones de voz está disponible como dsnote y dsnote-git En el repositorio de usuarios de Arch (AUR). Puede instalarlo utilizando cualquier programa auxiliar de AUR, como Palú;

paru -S dsnote

o .

yay -S dsnote

Cómo utilizar notas de voz

Una vez instalada, puede iniciar la aplicación Voice Notes desde el menú o ejecutando el siguiente comando:

flatpak run net.mkiol.SpeechNote

Cuando se inicia por primera vez, Voice Annotation le pedirá que seleccione el idioma que desea usar:

Asistente de mensajes de bienvenida para anotaciones de voz

Haga clic en el botón Cerrar para cerrar el asistente de bienvenida. Ir a idioma y seleccione el idioma de su elección.

Seleccionar idioma
Seleccionar idioma

A continuación, deberá descargar los archivos modelo para los motores de traducción de voz a texto, de texto a voz y de traducción de texto. Asegúrese de descargar al menos un modelo para cada motor. Si no estás seguro de qué modelo elegir, simplemente haz clic en el botón de información para ver más detalles sobre cada modelo.

Descargar modelo
Descargar modelo

Puedes descargar varios modelos, probar diferentes opciones y elegir la que más te convenga.

Después de descargar los archivos de idioma para cada modelo, puede comenzar a usar anotaciones de voz para realizar conversión de texto a voz, voz a texto o traducir el texto proporcionado.

Convertir texto a voz o voz a texto

Para probar la conversión de texto a voz, escriba algo de texto en la sección Notas y haga clic en el botón Leer. La aplicación leerá el texto en voz alta por ti.

Pruebas de texto a voz con anotaciones de voz
Pruebas de texto a voz con anotaciones de voz

Asimismo, puedes probar la función de voz a texto haciendo clic en el botón Escuchar. Hable por el micrófono y Voice Notes reconocerá su voz y la convertirá en texto en tiempo real.

Del mismo modo, si descargaste varios modelos, selecciona tu modelo preferido en el menú desplegable.

Traducir texto

Para traducir texto de un idioma a otro, vaya a la sección Traductor en la esquina superior derecha. Ingrese el texto a la izquierda y haga clic en el botón Traducir (flecha). Luego, la anotación de voz se traduce al idioma de salida correspondiente.

Traducir texto usando anotaciones de voz
Traducir texto usando anotaciones de voz

Como se muestra en la captura de pantalla, traduje el texto del inglés al alemán.

Si descargaste varios modelos, recuerda seleccionar el modelo que deseas en el menú desplegable.

Para habilitar la traducción instantánea, simplemente active la opción «Traducir mientras escribe». Cuando está habilitada, la anotación de voz traducirá el texto a medida que escribe, eliminando la necesidad de hacer clic en los botones de flecha para traducir.

mi veredicto

Probé Speech Note en una computadora de escritorio Debian 12 con 32 GB de RAM y un procesador Intel Core i3 de 11.a generación. Pero no tiene GPU.

Descargué el modelo «English (Piper Bryce Medium Male)» para la funcionalidad de texto a voz y el modelo «English Indian (Vosk Small)» para la funcionalidad de voz a texto. Para la traducción, descargué el modelo «inglés al alemán».

Si bien las funciones de traducción y de texto a voz funcionan como se esperaba, la función de voz a texto no funciona como se esperaba. Esto puede deberse a un problema de modelo. Planeo probar diferentes modelos más adelante para ver si se puede mejorar la funcionalidad.

Continuaré realizando más pruebas en los próximos días y actualizaré esta publicación en consecuencia.

en conclusión

Speech Note es una aplicación TTS, STT y de traducción potente y versátil que prioriza la privacidad del usuario. Sus capacidades fuera de línea, soporte en varios idiomas y características de código abierto lo convierten en una excelente opción para los usuarios de Linux y Sailfish OS.

Si está buscando una aplicación de reconocimiento de voz o TTS segura y sin conexión, definitivamente vale la pena probar Speech Note.

recurso:

LEER  3 cosas sorprendentes que puedes hacer con el comando wc de Linux

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba