AI 이미지로 영상 만드는 법 (i2v) — 사진 한 장으로 쇼츠 완성하기
이미지로 영상을 만드는 기술, 즉 i2v(image-to-video)는 2026년 숏폼 제작에서 가장 빠르게 자리 잡은 워크플로우입니다. 사진 한 장만 있으면 거기서 움직임을 생성해 영상으로 바꾸는 방식이죠. 이 글에서는 이미지로 영상을 만드는 원리부터, 실제로 i2v 워크플로우를 돌리는 순서, 그리고 쇼츠메이커의 '이미지로 영상' 기능으로 바로 적용하는 법까지 정리합니다.
i2v(이미지로 영상)란 무엇인가
i2v는 정지 이미지를 입력으로 받아, AI가 그 안의 피사체·배경에 자연스러운 움직임(카메라 무빙, 인물·사물 모션)을 부여해 짧은 영상 클립으로 만들어 주는 기술입니다. 텍스트만으로 영상을 만드는 t2v(text-to-video)와 달리, 이미 확정된 한 장의 비주얼에서 출발하기 때문에 결과물이 의도한 그림에서 크게 벗어나지 않는다는 장점이 있습니다.
- t2v: 글(프롬프트) → 영상. 자유도는 높지만 결과 예측이 어려움
- i2v: 이미지 → 영상. 비주얼이 고정돼 일관성이 좋음
쇼츠처럼 "한 컷의 분위기"가 중요한 콘텐츠에서는 i2v가 특히 강력합니다.
이미지로 영상 만드는 워크플로우 4단계
1. 소스 이미지 준비
영상의 첫 장면이 될 이미지를 고릅니다. 직접 촬영한 사진, AI로 생성한 이미지, 일러스트 모두 가능합니다. 세로 쇼츠라면 9:16 비율 이미지가 가장 깔끔합니다.
2. 모션(움직임) 방향 정하기
"카메라가 천천히 줌인", "인물이 고개를 돌림", "연기가 피어오름"처럼 동작은 1개로 단순하게 잡는 것이 핵심입니다. i2v 모델은 한 클립에 동작이 여러 개면 형태가 무너지기 쉽습니다.
3. i2v 모델로 클립 생성
이미지와 모션 지시를 AI 모델에 넣어 5초 내외의 클립을 생성합니다. 모델에 따라 품질·길이·비용이 달라집니다.
4. 클립 이어붙이기 + 자막·음성
여러 장면을 만들었다면 클립을 이어 붙이고, 자막과 음성(TTS)을 얹어 완성합니다.
좋은 i2v 결과를 얻는 팁
- 동작은 한 컷에 1개만: 복잡한 상호작용(밀치기·여러 인물 동시 동작)은 깨집니다. 스토리는 여러 컷으로 쪼개세요.
- 일관성이 중요하면 장면을 나눠라: 같은 캐릭터가 여러 장면에 나와야 한다면, 단일 이미지에서 모든 각도를 만들려 하지 말고 장면별 이미지를 따로 준비하는 편이 안정적입니다.
- 루프를 노려라: 시작과 끝이 비슷한 모션은 반복 재생 시 자연스러워 쇼츠 유지율에 유리합니다.
쇼츠메이커의 '이미지로 영상(i2v)' 기능으로 바로 만들기
위 워크플로우를 직접 도구를 갈아타며 하면 번거롭습니다. 쇼츠메이커의 '이미지로 영상' 기능은 이 과정을 한 화면에서 처리합니다.
- 이미지를 올리면 자동으로 대본·멀티 장면 흐름을 구성해 i2v로 연결합니다.
- 영상 모델은 Seedance 1.5 Pro(가성비 기본)·Wan 2.2 a14b·Kling·Veo·Luma 등에서 선택할 수 있고, 크레딧은 모델별로 차등 적용됩니다.
- 이미지 스타일은 실사·시네마틱·클레이·미니어처·애니·수채화 등 15종을 제공합니다.
- 영상 길이는 15·30·45·60·90초 중 선택(Free는 15·30초)할 수 있고, 완성 영상에 자막과 음성(TTS)까지 한 번에 얹습니다.
무료 플랜(월 3,000 크레딧)으로도 이미지로 영상 만들기를 충분히 시험해 볼 수 있습니다. Seedance 1.5 Pro 같은 고급 모델 해금과 워터마크 제거는 Starter(₩14,900), 전체 모델·시리즈 메이커·일관성 기능은 Pro(₩39,900)에서 열립니다.
정리
이미지로 영상을 만드는 i2v는 "비주얼을 먼저 고정하고 움직임을 입히는" 방식이라, 결과 예측이 쉽고 쇼츠에 잘 맞습니다. 핵심은 ① 좋은 소스 이미지, ② 한 컷 1동작, ③ 장면 분할입니다. 도구를 직접 조합하기 어렵다면 쇼츠메이커의 '이미지로 영상' 기능으로 업로드 한 번에 완성할 수 있습니다.
함께 보면 좋은 가이드