STTSamsung Galaxy Wide3 서버형 음성인식

Server STT Intake

음성·녹음 파일을 서버 대기열로

삼성폰에서 바로 녹음하거나 음성·영상 파일을 올리면 197 서버가 작업을 보관하고, STT 엔진이 준비되는 즉시 텍스트 변환과 CODEX 기사화 흐름으로 넘길 수 있게 구성합니다.

전체 작업0
등록 미디어0
처리 중0
Codex 명령0
실패0
01 입력 수집스마트폰 녹음, 녹취 파일, 영상 음성을 한 대기열에 묶어 서버에 저장합니다.
02 음성 정규화FFmpeg 단계에서 영상·음성 포맷을 STT가 읽기 좋은 형태로 통일하는 구조입니다.
03 Whisper STTWhisper 또는 faster-whisper가 준비되면 대기열을 순서대로 전사하도록 이어집니다.
04 CODEX 기사화전사문과 메모를 묶어 제목, 요약, 기사 초안, 매체 등록 대기 흐름으로 넘깁니다.
스마트폰 녹음 멀티 업로드 FFmpeg 정규화 Whisper STT CODEX 기사화

Codex Command Queue

말로 남기는 Codex 명령

스마트폰 Chrome에서 음성 인식이 지원되면 바로 텍스트 명령으로 변환해 Codex 대기열에 저장합니다. STT 엔진 없이도 간단한 지시는 이 경로로 먼저 쌓을 수 있습니다.

음성 명령은 지원되는 모바일 Chrome에서 바로 텍스트로 변환됩니다.

Mobile Upload

음성 인식 작업 등록

다용도 서버형 멀티업로드

음성 파일, 스마트폰 녹음, 영상 파일을 등록합니다. mp3, wav, m4a, webm, mp4, 3gp, amr 등을 인식 대기열에 넣습니다.

드래그앤드롭 여러 파일 동시 등록 스마트폰 직접 녹음