Sichere und leistungsstarke Speech-to-Text API

API Speech Recognition

Nahtlos in Ihre Gesprächswerkzeuge integriert: erstklassige Spracherkennung, entwickelt für Entwickler.

Word Error Rate

< 5 %

Praeziseste Engine in Frankreich, nach LMF

Latenz

< 600 ms

Bei Live-Gespraechsstreams, unter realen Bedingungen

Preis

Lowest

Am Markt, bei minutengenauer Abrechnung

Das Vertrauen fuehrender Unternehmen, Integratoren und Forschungseinrichtungen

Language Model Factory

Sprachmodellanpassung, auf Knopfdruck

Mit unserer Language Model Factory (LMF) bleibt kein Fachvokabular unerkannt. Trainieren Sie individuelle Modelle in nur 15 Minuten und waehlen Sie das Modell, das am besten zu Ihrem Anwendungsfall passt.

Ein produktionsreifes Modell in 15 Minuten

Fachjargon, Eigennamen, Branchenakronyme

Vortrainierte Vertikalmodelle sofort einsatzbereit

Vertikalmodelle

Vortrainiert auf branchenspezifischen Daten.

Jargon und Eigennamen

Vokabular, das zu Ihrem Unternehmen passt.

Akronyme

Automatische Erkennung und Auflosung.

Geschaeftsausdruecke

Spezifisch fuer Ihre Prozesse und Anwendungsfaelle.

Vocal Cookie

Schutz und Schwaerzung sensibler Daten

Automatische Echtzeit-Schwaerzung sensibler Informationen gemaess Ihren Anwendungsfaellen: personenbezogene Daten, Bank- und Gesundheitsdaten.

Transkript ohne Schwaerzung / Transkript mit Schwaerzung

Batch

Speech-to-Text-API fuer Audioaufzeichnungen

Laden Sie Ihre Telefongespräche einfach auf einen sicheren FTP-Server hoch und erhalten Sie Transkripte in wenigen Minuten, oder nutzen Sie unsere Konnektoren:

Verfuegbare Sprachen

Franzoesisch, Englisch, Spanisch, Deutsch, Italienisch, +5 weitere (Europa)

Python SDK

# Sicherer FTP-Upload
import uhlive

client = uhlive.connect("api.uh.live")

# Batch-Transkription
job = client.transcribe_file(
  file="call_2026-04-28.wav",
  model="de-telephony-v3",
  redaction=True
)

# Ergebnis
transcript = job.result()
print(transcript.text)

Streaming – Live

Streaming-API fuer Menschen

Verbinden Sie Ihre Audiostreams direkt ueber WebSocket fuer Echtzeit-Mehrsprecherdialog-Transkription, oder ueber Trunk SIP / SIP REC.

Verfuegbare Sprachen

Franzoesisch, Englisch, Spanisch und Deutsch

Streaming – Bot

Streaming-API fuer Bots

Streaming-API fuer IVR und Voicebots. Transkribieren Sie Ihre Live-Interaktionen mit unseren fortschrittlichen Loesungen.

Unsere Protokolle

>MRCP v2

>WebSocket

Standardmaessig in jeder Interaktion

Sprachaktivitaetserkennung, Sprachmodellauswahl, Grammatiken, Adresserkennung, Daten, Zahlen und boolesche Antworten.

Verfuegbare Sprachen

Franzoesisch, Englisch, Spanisch und Deutsch

WER < 5 %

Praeziseste Engine in Frankreich

100 M

Analysierte Anrufe pro Jahr

40 %

Der Analysen in Echtzeit

Bereit, Ihre ersten Anrufe zu transkribieren?

Nutzen Sie die uh!ive Speech-to-Text-API. Einrichtung in wenigen Minuten.

Das Vertrauen fuehrender Unternehmen, Integratoren und Forschungseinrichtungen

Schutz und Schwaerzung sensibler Daten

Bereit, Ihre ersten Anrufe zu transkribieren?

Kostenlos testen

Status

Demo

Kontakt