AI Phone Gateway Live Call Demo

Start one continuous live call

한 번 연결하면 일반 전화처럼 계속 말할 수 있습니다. 브라우저는 마이크 오디오를 계속 게이트웨이로 스트리밍하고, 발화 종료 감지와 답변 생성은 live backend가 처리합니다.

Secret은 URL, query, 브라우저 저장소에 저장하지 않고 WebSocket subprotocol 헤더로만 전달합니다. raw caller ID도 보내지 않습니다.

Backend WebSocket

Disconnected

Gateway WebSocket URL Call ID Shared secret

Response prompt 선택 입력입니다. 통화 시작 시 response_prompt로 backend에 전달되어 이번 데모 콜의 답변 스타일과 제약을 제어합니다.

브라우저는 Authorization 헤더를 설정할 수 없어 ai-phone-gateway.demo + bearer.<base64url-secret> subprotocol로 인증합니다.

Voice cloning lab

Not loaded

10~20초 정도의 깨끗한 WAV 또는 M4A reference audio와 실제 발화 transcript를 업로드하면 Baseten에 named cloned voice를 등록하고, 선택한 voice로 live call 답변 음성을 테스트합니다.

Voice name Reference audio (WAV/M4A) Reference transcript Selected TTS voice

이 reference audio를 voice cloning 테스트에 사용할 권한이 있으며, 등록된 cloned voice는 Remove selected voice로 삭제할 때까지 Baseten에 남는다는 점을 확인합니다.

Input (mic)

0%Level

Idle

00:00:00

Start live call을 누르면 마이크 권한 요청 후 같은 연결에서 계속 음성을 스트리밍합니다.

Mic noise gate 3.0% RMS 이하를 무음으로 처리

↔

gateway-backend-stream

8kHz G.711 μ-lawDisconnected

허용 전

마이크 권한은 Start live call을 누를 때만 요청됩니다.

Response monitoring

각 발화 턴마다 backend가 보내는 call.stats를 누적해 답변 음성이 생성되어 처음 들리기까지의 시간을 확인합니다.