API de Conversión de Voz a Texto de Alto Rendimiento

API de Reconocimiento de Voz

Integrado en tus herramientas conversacionales: el mejor reconocimiento de voz del mercado, diseñado para desarrolladores.

Tasa de error por palabra

< 5 %

El motor más preciso de Francia, tras LMF

Latencia

< 600 ms

En streams conversacionales en directo, en condiciones reales

Precio

El más bajo

Del mercado, compromiso por minuto

Con la confianza de empresas líderes, integradores e investigadores

Language Model Factory

Adaptación de modelo lingüístico, exprés

Con nuestra Language Model Factory (LMF), ningún vocabulario de dominio queda sin reconocer. Entrena modelos personalizados en tan solo 15 minutos y selecciona el que mejor se adapte a tu caso de uso.

Un modelo listo para producción en 15 minutos

Jerga, nombres propios, acrónimos del sector

Modelos verticales preentrenados listos para usar

Modelos verticales

Preentrenados en verticales específicos del sector.

Jerga y nombres propios

Vocabulario propio de tu negocio.

Acrónimos

Reconocimiento y expansión automáticos.

Expresiones de negocio

Específicas de tus procesos y casos de uso.

Vocal Cookie

Proteger y anonimizar los datos sensibles

Anonimización automática en tiempo real de la información sensible según tus casos de uso: datos personales, bancarios y de salud.

Transcripción sin anonimización / Transcripción con anonimización

Batch

API Speech-to-Text para grabaciones de audio

Deposita tus conversaciones telefónicas en un FTP seguro para transcribirlas en minutos, o utiliza nuestros conectores:

Idiomas disponibles

Francés, inglés, español, alemán, italiano, +5 más (Europa)

Python SDK

# Subida FTP segura
import uhlive

client = uhlive.connect("api.uh.live")

# Transcripción batch
job = client.transcribe_file(
  file="call_2026-04-28.wav",
  model="es-telephony-v3",
  redaction=True
)

# Resultado
transcript = job.result()
print(transcript.text)

Streaming · En directo

API Streaming para humanos

Conecta tus streams de audio directamente vía WebSocket y recibe transcripción multilocutor en tiempo real, o vía Trunk SIP / SIP REC.

Idiomas disponibles

Francés, inglés, español y alemán

Streaming · Bot

API Streaming para bots

API Streaming para IVR y voicebots. Transcribe tus interacciones en directo con nuestras soluciones avanzadas.

Nuestros protocolos

›MRCP v2

›WebSocket

Integrado en cada interacción

Detección de actividad vocal, selección de modelo lingüístico, gramáticas, reconocimiento de direcciones, fechas, números y respuestas booleanas.

Idiomas disponibles

Francés, inglés, español y alemán

WER < 5 %

Motor más preciso de Francia

100 M

Llamadas analizadas al año

40 %

De análisis en tiempo real

¿Listo para transcribir tus primeras llamadas?

Accede a la API Speech-to-Text de uh!ive. Configuración en minutos.

Con la confianza de empresas líderes, integradores e investigadores

Proteger y anonimizar los datos sensibles

¿Listo para transcribir tus primeras llamadas?

Pruébalo gratis

Estatuto

Demostración

Contact