Una voz para tu IA que no cuesta nada
Un modelo de código abierto pequeñísimo que da voz a tu IA con sonido natural, sin suscripciones caras ni hardware especial, solo tu ordenador.
Una voz que vive en tu propia máquina
Si alguna vez has usado ElevenLabs — ese servicio que convierte texto en una voz hablada muy natural — ya sabes lo que se siente. También sabes que tiene una factura mensual y que tu audio pasa por los servidores de otra empresa.
MOSS-TTS-Nano es una alternativa gratuita y de código abierto que puedes ejecutar tú mismo. Cabe en un servidor básico o en tu portátil de siempre, y no necesita hardware gráfico especial para funcionar. Eso es genuinamente raro: la mayoría de las herramientas de voz con IA requieren computación en la nube bastante cara para arrancar.
Lo que hace es discretamente impresionante. Habla varios idiomas. Puede clonar una voz a partir de un clip de audio corto — así que si quieres que tu asistente de IA suene como un narrador concreto, le das una muestra y listo. Y la calidad de audio es de 48kHz estéreo, perfectamente válida para producción.
Para quienes están construyendo funciones de voz en un producto, generando resúmenes en audio, creando podcasts con IA, o simplemente quieren que su chatbot de atención al cliente hable de verdad — esto merece atención. Obtienes un motor de voz alojado en tus propias máquinas que se comporta como los servicios de pago, sin el coste recurrente ni el compromiso de privacidad.
Palabras que vale la pena conocer
Texto a voz (TTS): Tecnología que lee texto escrito en voz alta con un sonido humano.
Clonación de voz: Darle a la IA una muestra de audio corta de alguien hablando para que genere nuevo audio que suene como esa persona.
Autoalojado: Ejecutar el software en tu propio servidor o ordenador, en lugar de usar el servicio en la nube de un tercero. Tus datos se quedan contigo.
Código abierto: El código es libre de usar, revisar y modificar — sin cuotas de licencia ni dependencia de un proveedor.
Algo en lo que pensar: si tu negocio se comunica a través del audio — atención al cliente, vídeos de formación, demostraciones de producto — ¿cuánto te está costando esa voz ahora mismo, y quién la controla realmente?