무료 AI 더빙(TTS) 사용법과 추천

쇼츠메이커 2026. 6. 24. 14:31

쇼츠를 만들다 보면 결국 마주치는 게 "내 목소리를 넣어야 하나"입니다. 매번 녹음하는 건 환경·발음·편집 부담이 크고, 외주 성우는 단가가 부담됩니다. 그래서 요즘은 AI 더빙(TTS, Text-to-Speech)으로 텍스트를 음성으로 바꿔 내레이션을 입히는 게 표준이 됐습니다. 이 글에서는 TTS 무료로 시작하는 법, 쇼츠에 맞는 음성 고르는 법, 그리고 쇼츠메이커 내장 TTS까지 정리합니다.

TTS(AI 더빙)란

TTS는 입력한 글을 사람 목소리처럼 읽어 주는 기술입니다. 과거에는 기계음 티가 났지만, 2026년 현재의 AI 음성은 억양·호흡·감정 표현까지 자연스러워져 쇼츠 내레이션에 바로 쓸 수 있는 수준입니다.

쇼츠에서 AI 더빙이 특히 잘 맞는 이유:

녹음 환경이 필요 없다 — 마이크·방음·NG 재녹음에서 해방됩니다.
수정이 즉시 — 대본 한 줄만 고쳐도 음성이 바로 다시 생성됩니다.
일관된 톤 — 시리즈 채널에서 매 편 같은 목소리를 유지할 수 있습니다.
자막 싱크가 쉽다 — 음성 길이를 기준으로 자막을 정확히 맞출 수 있습니다.

쇼츠용 음성 고를 때 체크할 것

속도 — 쇼츠는 약간 빠른 호흡이 유지율에 유리합니다.
성별·톤 — 채널 콘셉트와 맞춰야 합니다. 정보형은 또렷한 톤, 감성형은 부드러운 톤.
한국어 자연스러움 — 외국어 베이스 음성은 한국어에서 어색할 수 있어 미리듣기 확인이 필수입니다.
자막과의 합 — 발화 길이가 안정적이어야 자막 싱크가 깔끔합니다.

무료로 TTS 시작하는 법

여러 무료 TTS 서비스가 있지만, 따로 음성을 뽑아 영상 편집기에 끼워 넣는 과정이 번거롭습니다. 음성 파일 다운로드 → 타임라인에 배치 → 자막 수동 싱크를 매번 반복해야 하기 때문입니다.

영상 제작 도구에 TTS가 내장돼 있으면 이 과정이 한 번에 끝납니다. 쇼츠메이커는 무료 플랜(Free, ₩0)에서도 내장 TTS를 제공합니다. 대본이 생성되면 그 문장을 AI 음성이 바로 읽고, 자막까지 자동 싱크되므로 음성 파일을 따로 만질 필요가 없습니다.

쇼츠메이커 내장 TTS — 플랜별 음성 종류

쇼츠메이커는 플랜에 따라 사용할 수 있는 음성 수가 다릅니다. 모든 음성은 미리듣기로 톤을 확인한 뒤 고를 수 있습니다.

플랜	음성 수	구성
Free	4종	남성 2 · 여성 2
Starter	9종	OpenAI 음성 9종
Pro	22종	OpenAI 9종 + ElevenLabs 한국어 13종

Free 4종은 채널 톤을 정하고 워크플로우를 익히기에 충분합니다.
Starter 9종은 콘텐츠 유형별로 음성을 바꿔 가며 쓸 때 여유가 생깁니다.
Pro 22종은 OpenAI에 더해 ElevenLabs 한국어 음성까지 포함돼, 시리즈마다 캐릭터별 목소리를 분리하거나 더 풍부한 감정 표현이 필요할 때 강력합니다.

더빙을 자연스럽게 쓰는 팁

문장을 짧게 — 한 호흡에 읽히는 길이로 끊으면 부자연스러운 억양이 줄어듭니다.
숫자·영어는 표기 확인 — 읽는 방식이 의도와 다를 수 있어 미리듣기로 검수합니다.
시리즈는 음성 고정 — 채널 정체성을 위해 같은 목소리를 유지합니다.
BGM 볼륨 조절 — 내레이션이 묻히지 않도록 배경음악은 낮게 깝니다.

녹음 없이 일관된 음질의 내레이션을 매일 뽑아낼 수 있다는 건, 쇼츠를 꾸준히 발행하는 데 생각보다 큰 차이를 만듭니다.

직접 만들기 귀찮다면?

쇼츠메이커가 대본·영상·더빙까지 자동으로 만들어 드립니다.

쇼츠메이커 무료로 시작하기 →