【2026年最新】画像から動画を生成するAIツール比較
無料・商用OK・実機検証済み 完全ガイド
このページでわかること
- 画像から動画を生成できるAIツール7選の比較(Seedance 2.0 / Kling 3.0 / Runway Gen-4.5 / Hailuo 02 / Pika / Luma / Firefly)
- 無料枠・料金・商用利用可否・透かしの有無を8項目で一覧比較(2026-05-18確認)
- コピペ可能なimage-to-video専用プロンプト10サンプル付き(成功例・失敗例・改善ポイント)
AI動画生成の中でも「手持ちの写真を動画にする」image-to-videoは、EC商品・ブランド動画・SNS投稿に即活用できる実用性の高い技術です。 2026年5月時点では、Seedance 2.0(ByteDance)のキャラクター一貫性とKling 3.0の無料枠が特に注目されています。 このガイドでは実機検証をもとに、用途別の最適ツールを選ぶための情報を提供します。
画像から動画生成AI(image-to-video)とは
仕組みの概要
image-to-video AIは、静止画像を起点に「次のフレーム」をAIが予測・生成して動画を作る技術です。 2024年以前は動きが不自然でしたが、2025〜2026年に開発された最新モデルは物理法則・光の変化・人物の自然な動きを高精度で学習しています。
text-to-videoとの違い
| 比較項目 | image-to-video | text-to-video |
|---|---|---|
| 起点 | 静止画像(自分で用意) | テキストプロンプトのみ |
| 被写体の一貫性 | 高(同じ人物・物が続く) | 低(毎回異なる外見になりやすい) |
| 制御しやすさ | 高(「この写真を動かす」) | 中(想像通りにならないことが多い) |
| 向いている用途 | 商品動画・ポートレート・ブランド素材 | 創作・フィクション・ストーリー映像 |
2026年の最新動向
- Seedance 2.0(ByteDance)がキャラクター一貫性・物理表現でArteficial Analysis 1位を獲得
- Kling 3.0が最大30秒の長尺image-to-videoを実現
- Runway Act One/Act Twoが演技転写・カメラ制御を追加
- 全主要サービスが1080p以上の高解像度出力に対応
対応ツール比較表(7ツール・8項目)
以下の比較表は2026-05-18時点の公式情報をもとに作成しています。 料金は年払い最安プランを基準としています。
| ツール | 最新モデル | 無料枠 | 画質・品質 | 最大秒数 | 透かし | 商用利用 | 最安有料プラン | image-to-video の強み |
|---|---|---|---|---|---|---|---|---|
| Seedance 2.0 ByteDance / Dreamina・Jimeng 編集部評価最高 | Seedance 2.0 Pro | 毎日225クレジット相当 | 最高(2K対応) | 最大15秒 | 無料でも基本なし | 有料プランで可 | $9.60〜/月(Jimeng) | キャラクター一貫性・布地ダイナミクス・物理現象が業界首位。ロゴ・テキスト保持が最強。 |
| Kling AI 可灵(Kuaishou)/ Kling 3.0 | Kling 3.0 / 2.6 | 毎日66クレジット | 高(1080p) | 最大30秒(Proモード) | 無料は有・Standard以上は無 | Standard以上で可 | $6.99〜/月 | 長尺対応・複雑な人物モーション・Reference保持が得意。毎日無料クレジットが最多。 |
| Runway Gen-4.5 / Gen-4 Turbo | Gen-4.5 | 125クレジット(一度のみ) | 高(4K Pro以上) | 最大10秒 | 無料は有・有料は無 | 有料プランで可 | $12〜/月(年払い) | 映像編集との一体化・Act One(演技転写)・Act Two(カメラ制御)が独自強み。 |
| Hailuo 02 MiniMax / Hailuo AI | Hailuo 02 / 2.3 | 毎日無料クレジット(2〜3本目安) | 高(1080p) | 最大10秒 | 無料は有・有料は無 | 有料プランで可 | $9.99〜/月 | $0.28/本のコスパ最強。Artificial Analysis 世界2位のコストパフォーマンス。 |
| Pika Pika 2.1 / Pikaframes | Pika 2.1 | 80クレジット/月 | 中〜高(1080p) | 最大10秒 | 無料は有 | Standard以上で可 | $8〜/月(年払い) | Pikaffectsの特殊エフェクト・Pikaframes(2画像間補間)が独自機能。 |
| Luma Dream Machine Ray 3.14 / Keyframes | Ray 3.14 | 体験クレジットのみ | 高(1080p HDR) | 最大10秒 | 無料は有・Plus以上は無 | Plus以上で可 | $30〜/月 | Keyframes機能で開始画像+終了画像の間を完璧な3D補間。シネマティックな光の表現。 |
| Adobe Firefly Video Premiere連携 / Image to Video | Firefly Video (2026年版) | 無料2本(5秒相当) | 高(1080p) | 最大5〜10秒 | 無 | 可(商用安全モデル) | $9.99〜/月 | 商用安全モデル+企業向け著作権補償付き。Premiere Pro・After Effects との直接連携。 |
各ツールの実機画面
編集部が実際に操作した画面です(2026-05-18時点)。
使い方ステップ(Runway Gen-4.5 実機解説)
最もシェアが高いRunway Gen-4.5を例に、画像から動画を生成する手順を解説します。 他のサービスも基本的な流れは同様です。
- 01 Runwayにアクセス・アカウント作成
runwayml.com にアクセス。 GoogleアカウントまたはメールアドレスでSign upします。 無料プランは125クレジットが付与されます(1回限り)。
- 02 「Gen-4.5 Image to Video」を選択
ダッシュボードから「Video」→「Gen-4.5」→「Image to Video」を選択します。 「Gen-4 Turbo」は生成が速いモデル、「Gen-4.5」は品質優先モデルです。
- 03 画像をアップロード
起点となる静止画をドラッグ&ドロップまたはクリックしてアップロードします。 対応形式: JPG / PNG / WebP。推奨解像度: 1,000px以上。
- 04 プロンプトで動きを指定
テキストボックスに「どう動かすか」を入力します。 英語・日本語どちらでも対応しています。 プロンプト例:
The woman's hair gently blows in the wind, slow camera dolly forwardAct Two(カメラ制御)を使うと、ドリー・パン・チルト・ズームを視覚的に設定できます。
- 05 秒数・アスペクト比を選択して生成
秒数(5秒 or 10秒)とアスペクト比(16:9 / 9:16 / 1:1)を選択。 「Generate」をクリックすると20〜60秒で動画が生成されます。
- 06 ダウンロード(MP4)
生成完了後、「Download」ボタンでMP4形式でダウンロードします。 無料プランは透かし(Runwayロゴ)が入ります。 Standard以上は透かしなし・商用利用可能です。
無料プランの限界を感じたら
Runway Standardプランで透かしなし・商用利用解放
月額$12(年払い)でクレジット625/月・透かしなし・商用利用可。 image-to-video・text-to-video・映像編集を一体化した最強AIクリエイティブスイート。
Runway公式サイトで確認する公式サイト(runwayml.com)で最新料金をご確認ください。
image-to-video プロンプト集10選(コピペ可)
実機検証で効果を確認したプロンプトです。 各カードの「コピー」ボタンで即座にクリップボードにコピーできます。
人物の髪を風になびかせる
(写真をアップロード) 何も指示しないとAIが「らしい動き」を想像で補います。髪の毛・衣服・目など「どのパーツを」「どう動かすか」を明示することが重要です。
人物の長い髪が右から左への穏やかな風でゆっくりなびく、瞬きを1回、口角がわずかに上がる微笑み、カメラはフレームを維持、動きの強度は弱〜中程度 料理・食べ物から湯気を立たせる
ラーメンの写真を動かして 「動かす」だけでは方向・速度・量が曖昧です。湯気の発生場所・流れ方向・カメラのわずかな動きを追加すると一気にリアルになります。
ラーメン丼のスープ表面から白い湯気がゆっくり上昇して右上方向に流れる、上からの俯瞰ショット、カメラはわずかに前進ズーム(0.5秒で5%程度)、背景はソフトボケ 商品写真をゆっくり回転させる(EC向け)
商品を回転させて EC・LP用の商品動画は回転軸・速度・光の変化を細かく指定します。ロゴ・テキスト保持が必要な場合はSeedance 2.0が最適です。
ガラス製の香水ボトルが白い背景の上でゆっくり時計回りに1回転(5秒)、上からのソフトライトが回転に合わせて光の反射が変わる、シャドウ控えめ、カメラ固定、ロゴは常に鮮明に保持 建物・不動産写真にカメラドリーを加える
建物の写真を動かして 不動産・建築写真は「どのカメラワーク」かを指定することで格段にプロらしい動画になります。ドリーイン・パン・チルトを具体的に記載しましょう。
モダンな戸建住宅の外観写真、カメラが正面から建物に向かってゆっくりドリーイン(5秒)、朝の柔らかい光、空の雲がわずかに動く、芝生がそよ風でなびく 2枚の画像を滑らかに補間する(Luma Keyframes)
(1枚目: 昼の写真 / 2枚目: 夜の写真) Luma Dream MachineのKeyframes機能は開始画像と終了画像を指定して中間を補間します。時間帯・シーズン変化など劇的なビフォーアフターに最適です。
(Luma Keyframes機能を使用。Start: 昼の東京スカイツリー写真 / End: 夜景写真)昼から夜へのタイムラプス遷移、街灯が順番に点灯する演出、雲が流れる、カメラ固定 人物の表情・目の動きをリアルにする
ポートレート写真を動かして AI動画で顔の自然さを出すには「瞬きの回数・タイミング」「視線の向き」「呼吸による胸・肩の微妙な動き」を指定します。
人物のバストショット、自然な呼吸で胸・肩がわずかに上下する、2秒ごとに自然な瞬き、視線はわずかに左上から正面に戻る、カメラはごく微妙なハンドヘルド感(ほぼ固定)、柔らかい自然光 ペット写真に動きをつける(動物向け)
犬の写真を動かして 動物は「どの部位を」「どう動かすか」と「カメラの距離」を明示することで自然さが増します。耳・尻尾など小さな動きが重要です。
柴犬のポートレート、耳が右から左への音に反応するようにわずかに動く、尻尾が左右に2回ゆっくりふる、瞳が軽くキラリと光る、カメラはほぼ固定・わずかにズームイン、自然光 風景写真に雲の動きと木の揺れを加える
山の風景を動かして 風景のimage-to-videoは「大気の動き(雲・霧)」「植物の揺れ」「光の変化」を組み合わせると最もリアルになります。
緑の山々の風景写真、白い雲が左から右にゆっくり流れる、手前の木々の葉がそよ風で揺れる、光が雲の動きで変化する、広角固定ショット、穏やかで牧歌的な雰囲気 失敗しない「手・指の崩壊」対策
手を振っている写真を動かして AI動画では手・指の崩壊が最も起きやすいです。対策は「手が動く範囲を小さく」「手を画面の端に配置」「ぼかしや衣類で隠す」の3点です。
人物の上半身ショット、右手は体の横に軽く添えているだけで基本動かさない、頭が軽くうなずく、肩から上の微妙な呼吸の動き、自然光、カメラ固定。(注: 手の動きは最小限に限定) Kling長尺モードで30秒の映像を作る
長い動画にして Kling 3.0の長尺モード(最大30秒)でも、シーン分割の指示がないと中盤で崩壊します。3〜5秒単位でシーンを区切った指示が有効です。
(Kling 3.0 Professionalモード・30秒設定)。3シーン構成。0〜10秒: 夜明けの富士山、雲海がゆっくり流れる。10〜20秒: 山頂に光が当たり始め、雪面が輝く。20〜30秒: 広角引きで富士山全体を映し、オレンジの朝焼け空。共通トーン: 寒色〜暖色グラデーション 失敗しないコツと注意点
入力画像の選び方
- 解像度は1,000px以上が目安(解像度が低いと出力品質も下がる)
- 人物の顔は正面〜やや斜めが最も自然に動く(後ろ向きは不自然になりやすい)
- 背景が複雑すぎる写真は動きが崩れやすい(シンプルな背景が安定)
- 逆光・極端に暗い写真は品質が落ちる(適切な露出の写真を使う)
動きの強度設定
- 強度を低め(1〜3/10)に設定すると崩壊が減り、よりリアルな微動に
- 強度を高め(7〜10/10)にすると派手な動きになるが、不自然になりやすい
- 人物・商品: 低〜中、風景・自然: 中〜高が目安
よくある崩壊パターンと対策
| 崩壊パターン | 原因 | 対策 |
|---|---|---|
| 手・指の変形 | 指の本数・関節の学習が不安定 | 手を画面外へ・動きを最小限に指定 |
| テキスト・ロゴの消失 | モデルがテキストを背景と判断 | Seedance 2.0(テキスト保持が最強)を使う |
| 顔の歪み | 動きの強度が強すぎる | Motion Strengthを3以下に下げる |
| 背景と被写体の混合 | 前景・背景の分離が不十分 | 被写体と背景のコントラストが高い写真を選ぶ |
商用利用可否と著作権の注意点
商用利用の条件(2026年5月確認)
- Seedance 2.0: 有料プランで商用利用可(Jimeng/Dreaminaの規約準拠)
- Kling AI: Standard($6.99/月)以上で商用利用可・透かしなし Kling公式
- Runway: Standard($12/月・年払い)以上で商用利用可 Runway公式料金
- Hailuo AI: 有料プランで商用利用可
- Adobe Firefly Video: 全プランで商用安全モデル(著作権補償付き)
著作権の整理(日本法)
自分が撮影した写真を使ってAI動画を生成した場合、元写真の著作権は撮影者(あなた)に帰属します。 生成動画の著作権は「創作的寄与(プロンプト設計・編集)があれば」ユーザーに帰属する方向で解釈されています。 ただし第三者の写真(ネット上の写真・他人のポートレート等)を無断で使うと著作権・肖像権の侵害になります。
商用用途での安全な使い方3原則
- 自分が撮影した写真・自社で著作権を持つ素材のみを使う
- 有料プランの商用利用可条件を必ず確認・契約する
- 企業広告・法人PR動画にはAdobe Firefly Video(著作権補償付き)を優先検討する
次のステップ:AI動画を本格的に学ぶ
AI動画・画像生成を実務で使いこなすなら
RunwayやKlingの操作だけでなく、プロンプト設計・商用運用まで体系的に学べます。 DMM WEBCAMP AIコースはAI動画生成を仕事に使うためのカリキュラムを提供。
DMM WEBCAMP AIコースを確認するよくある質問(FAQ)
基本・仕組み
「画像から動画生成AI(image-to-video)」とはどういう仕組みですか?
テキストから動画(text-to-video)と画像から動画(image-to-video)の違いは?
- text-to-video: プロンプトだけで0から生成するため自由度が高い反面、毎回異なる出力になりやすい
- image-to-video: 起点画像があるため被写体・構図・色調が固定され、意図した映像に近づきやすい
スマートフォンで撮った写真でも使えますか?
ツール選び
キャラクターや人物の一貫性を保ちたい場合はどれが最適ですか?
無料で毎日使い続けられるサービスはありますか?
- Kling AI: 毎日66クレジット付与(登録のみでOK)。5秒の標準品質動画なら1〜2本/日生成可能
- Hailuo AI: 毎日無料クレジットが付与され、2〜3本の短尺動画が生成可能
YouTubeやInstagramのSNS投稿用コンテンツを量産するには?
商用利用
商用利用OK・透かしなしで使えるのはどのプランですか?
- Kling AI: Standard($6.99/月)以上で商用可・透かしなし
- Runway: Standard($12/月・年払い)以上で商用可・透かしなし
- Pika: Standard($8/月・年払い)以上で商用可
- Adobe Firefly Video: 全プランで商用安全モデル(著作権補償付き)
生成した動画の著作権は誰のものですか?
品質・テクニック
生成した動画の品質が低い・不自然な場合の改善方法は?
- プロンプトを詳細化: 動かすパーツ・速度・カメラワークを具体的に記載
- 動きの強度を下げる: 「Motion Strength」を低め(1〜3/10)に設定すると崩壊が減る
- 入力画像の品質を上げる: 解像度・明るさ・ピントが重要
- モデルを変える: 人物動画はKling、物理表現はSeedance、カメラワークはRunwayと使い分ける
AI動画で「手・指の崩壊」を防ぐ方法は?
- 手の動きを最小限に指定: プロンプトに「手はほとんど動かさない」「体の横に添えるだけ」と明記
- 手を画面外・影で隠すアングル: バストショットで手が映らない構図を選ぶ
- 動きの強度を弱く設定: 全体の動き量を減らすと指の崩壊も連動して減る