API Speech Recognition

Integrato nei tuoi strumenti conversazionali: riconoscimento vocale di riferimento, pensato per gli sviluppatori.

Word Error Rate

< 5 %

Il motore piu preciso in Francia, post-LMF

Latency

< 600 ms

Su flussi conversazionali live, in condizioni reali

Pricing

Lowest

Sul mercato, con impegno al minuto

La fiducia di grandi aziende, integratori e ricercatori

Language Model Factory
Adattamento rapido del modello linguistico

Con la nostra Language Model Factory (LMF), nessun vocabolario di settore resta irriconosciuto. Addestra modelli personalizzati in soli 15 minuti e seleziona quello piu adatto al tuo caso d’uso.

Un modello pronto per la produzione in 15 minuti

Gergo, nomi propri, acronimi di settore

Modelli verticali pre-addestrati disponibili immediatamente

01

Modelli verticali

Pre-addestrati su verticali di settore.

02

Gergo e nomi propri

Vocabolario legato al tuo business.

03

Acronimi

Riconoscimento ed espansione automatici.

04

Espressioni aziendali

Specifiche ai tuoi processi e casi d’uso.

Vocal Cookie

Protezione e anonimizzazione dei dati sensibili

Anonimizzazione automatica in tempo reale delle informazioni sensibili in base ai tuoi casi d’uso: dati personali, bancari e sanitari.

Trascrizione senza anonimizzazione / Trascrizione con anonimizzazione

Batch
API Speech-to-Text per registrazioni audio

Carica semplicemente le tue conversazioni telefoniche su un FTP sicuro per ottenere la trascrizione in pochi minuti, oppure utilizza i nostri connettori:

Lingue disponibili

Francese, Inglese, Spagnolo, Tedesco, Italiano, +5 altre (Europa)

Python SDK
# Secure FTP upload
import uhlive

client = uhlive.connect("api.uh.live")

# Batch transcription
job = client.transcribe_file(
  file="call_2026-04-28.wav",
  model="en-telephony-v3",
  redaction=True
)

# Result
transcript = job.result()
print(transcript.text)
Streaming — Live
API Streaming per gli esseri umani

Connetti i tuoi flussi audio direttamente tramite WebSocket per ricevere la trascrizione multi-speaker in tempo reale, oppure tramite Trunk SIP / SIP REC.

Lingue disponibili

Francese, Inglese, Spagnolo e Tedesco

Streaming — Bot
API Streaming per bot

API Streaming per IVR e voicebot. Trascrivi le tue interazioni live con le nostre soluzioni avanzate.

I nostri protocolli

MRCP v2

WebSocket

Integrato in ogni interazione

Rilevamento dell’attivita vocale, selezione del modello linguistico, grammatiche, riconoscimento degli indirizzi, date, numeri e risposte booleane.

Lingue disponibili

Francese, Inglese, Spagnolo e Tedesco

WER < 5 %

Il motore piu preciso in Francia

100 M

Chiamate analizzate all’anno

40 %

Delle analisi in tempo reale

Pronto a trascrivere le tue prime chiamate?

Accedi all’API Speech-to-Text di uh!ive. Configurazione in pochi minuti.