Plataforma de processamento de voz: transcreva audio com identificacao de falantes e timestamps por palavra. Tudo via API.
Converta audio em texto com alta precisao, suporte a 99 idiomas e deteccao automatica de idioma.
Identifique automaticamente quem falou cada trecho, sem nenhum treinamento previo.
Envie um ZIP com ate 10.000 arquivos de audio e receba todos os resultados em um unico webhook.
API keys com permissao por servico (ASR, OCR). Gerencie clientes com acesso granular via CLI.
Transcricao rapida para audios curtos (ate 40s) com timeout de 60s. Ideal para assistentes de voz.
Receba resultados via webhook com retries automaticos ou consulte o status por polling. Voce escolhe.
Metricas Prometheus, health checks por worker e logging estruturado. Visibilidade total da operacao.
Upload via API REST. Suporta WAV, MP3, FLAC, OGG e M4A ate 500MB.
O audio e transcrito com timestamps por palavra em ate 99 idiomas.
Falantes sao identificados e alinhados com a transcricao automaticamente.
JSON com texto, segmentos, falantes e timings. Sync ou via webhook.
Envie o audio e receba o resultado na mesma requisicao. Ideal para fluxos interativos.
Receba 202 imediatamente e o resultado via POST na sua URL quando pronto. Retries automaticos.
Consulte o status do processamento a qualquer momento. Resultados em cache por 10 minutos.
Integre transcricao e diarizacao no seu produto em minutos.