· Notas de Campo5 de junio de 2026

Una IA de voz que suena de verdad

MisoTTS es un modelo de voz gratuito que lee la emoción del contexto sonoro y genera un habla con una calidez que pocas herramientas consiguen.

AIopen-sourcetoolsvia github · @@AodenTeoMT

Algo que merece atención

La mayoría de las herramientas de voz con IA suenan bien... hasta que no suenan bien. Una palabra con el acento equivocado, una frase plana donde debería haber calidez — y de repente parece una máquina. Eso es exactamente lo que MisoTTS intenta resolver.

Publicado esta semana por Miso Labs, MisoTTS es un modelo de voz que puedes descargar y usar tú mismo, sin coste. Lo que lo distingue es que no se limita a leer las palabras que le das — también escucha el tono del audio de referencia que le proporcionas. ¿Emocionado? ¿Tranquilo? ¿Un poco cansado? El resultado intenta capturar ese matiz emocional, no solo las sílabas.

Para alguien que gestiona un negocio, esto importa más de lo que parece. Imagina un bot de atención al cliente que no desespera a la gente, o una demo de producto que no suena al contestador automático de una aseguradora. O incluso una versión en audio de tu manual de bienvenida, narrada con algo parecido a un ritmo humano.

Hasta ahora, las voces expresivas con IA significaban pagar APIs de los grandes laboratorios y aceptar sus limitaciones. MisoTTS es la primera alternativa gratuita realmente sólida sobre la que cualquiera puede construir.

Es pronto. Pero vale la pena seguirle la pista.

Palabras que conviene conocer

Modelo open-weight — Un modelo de IA cuyos componentes internos están disponibles públicamente. Como tener la receta en lugar de solo el plato — puedes ejecutarlo tú mismo o adaptarlo.

Texto a voz (TTS) — Software que convierte texto escrito en audio hablado. Lo que usa tu móvil cuando te lee un mensaje en voz alta.

Contexto de audio — Una muestra de voz real (una grabación, un clip) que el modelo usa como referencia de tono y emoción, en lugar de adivinarlo solo a partir del texto.

API — La forma en que un programa habla con otro. Cuando una empresa usa un servicio de voz externo, normalmente está llamando a una API — y pagando por cada uso.

Ver el proyecto →

Escrito por David en AC0.AI. Sígueme en @ac0hero

Field Notes en tu bandeja

Las herramientas y movimientos de IA que de verdad uso para ganar más negocio. Un par por semana, nada que no haya probado yo mismo.

session0
histórico0
Pulsado0