Veo プロンプトの書き方コツ7選

この記事でわかること

  • Veoで狙った映像に近づけるプロンプトの型と具体例がわかる
  • 4K制作、60fps書き出し、音声同期を前提にした実践設定がわかる
  • Runway、Kling、Pika、Sora終了後の市場でVeoをどう使うべきか判断できる

結論(先に結論を述べる)

Veo プロンプトの書き方コツは、単に「きれいな動画を作って」と書くのではなく、被写体、動き、カメラ、照明、音、尺、比率、禁止事項を1つの制作指示書として整理することです。2026年時点のVeo 3.1は、Ingredients to Video、縦型9:16、1080p/4Kアップスケール、キャラクターや背景の一貫性、音声表現の強化が重要な進化点です。Google公式ブログでも、Flow、Gemini API、Vertex AIで4Kオプションが利用できること、YouTube Shorts向けの縦型生成が強化されたことが示されています。

特に広告動画やSNS動画では、最初のプロンプトで完成形を狙うより、まず8〜10秒の短いショットを作り、良いカットを固定してから別カットへ展開するほうが安定します。Soraアプリ終了後は、AI動画市場が「面白い生成」から「業務で使える再現性」へ移っています。Veo プロンプトの書き方コツを押さえるほど、少ない生成回数で使える映像に近づけます。

{{internal_link:Veo 始め方}}

本題(H2で3〜5セクション)

1. Veoプロンプトは8要素で書く

Veo プロンプトの書き方コツの基本は、映像を分解して指定することです。最低限、以下の8要素を入れます。

  1. 被写体:誰が、何が映るか
  2. 場所:背景、時間帯、季節、質感
  3. 動作:被写体が何をするか
  4. カメラ:寄り、引き、パン、ドリー、手持ち風など
  5. 照明:自然光、逆光、ネオン、スタジオ照明など
  6. スタイル:実写、シネマ風、商品広告風、ドキュメンタリー風など
  7. 音:会話、効果音、環境音、BGMの方向性
  8. 出力条件:尺、比率、解像度、フレームレート、避けたい表現

悪い例: 「東京のカフェでおしゃれな動画」

良い例: 「朝7時の東京・清澄白河の小さなカフェ。30代の女性バリスタがラテを注ぐ。カメラは手元のクローズアップからゆっくり引き、湯気とラテアートを見せる。自然光、浅い被写界深度、実写CM風。環境音はエスプレッソマシン、静かな店内BGM。8秒、16:9、4Kアップスケール用、人物の顔の崩れや文字化けを避ける。」

専門用語の補足です。浅い被写界深度とは、背景が自然にぼけて被写体が目立つ映像表現です。ドリーとは、カメラが前後に滑らかに移動する撮影方法です。

2. 4K/60fpsを狙う設定とワークフロー

2026年のVeo 3.1では、Flow、Gemini API、Vertex AIで1080p/4K解像度オプションが使えます。ただし、60fpsは生成時に常に指定できる前提で考えるより、生成後の編集工程で60fpsに補間・書き出しするワークフローが現実的です。

おすすめ設定例: - 用途:YouTube広告、WebサイトFV、展示会映像 - 尺:8秒、12秒、または15秒 - 比率:16:9または9:16 - 解像度:生成は高品質設定、最終は4Kアップスケール - fps:生成後に編集ソフトで60fps書き出し - カメラ指定:slow dolly in、smooth tracking shot、no shaky motion

プロンプト例: 「高級スマートウォッチの4K商品広告。黒い金属製ウォッチが濡れた石板の上に置かれ、青白いリムライトが輪郭を照らす。カメラは正面からゆっくりドリーインし、文字盤の反射と水滴を鮮明に見せる。背景は暗いスタジオ、シネマティック、超高精細、滑らかな動き。効果音は低い電子音と水滴。10秒、16:9、4Kアップスケール、最終60fps書き出し向け。ロゴや読めない文字は生成しない。」

Veo プロンプトの書き方コツとして、4Kを指定するときは「高精細」だけでなく、何を細かく見せたいかまで書きます。水滴、布の繊維、金属反射、肌の質感、料理の湯気など、ディテールの対象を指定すると映像の密度が上がります。

3. 音声同期生成は「誰が何をどう話すか」まで書く

Veoの大きな強みは、映像だけでなく会話、環境音、効果音を含む動画生成に向いている点です。音声同期を狙う場合は、セリフを短くし、話者、感情、口調、間を明記します。

音声同期プロンプト例: 「明るいオフィスの会議室。20代の女性マーケターがカメラに向かって自然に話す。口の動きと音声を同期。日本語で『この1本で、商品の魅力が伝わります』と落ち着いた声で話す。話す前に0.5秒の間を置く。背景には小さなキーボード音と空調音。カメラは胸上のミディアムショット、自然光、清潔なB2B広告風。8秒、9:16、SNS広告向け。」

コツは、長いナレーションを一度に言わせないことです。1カット1メッセージに分けると、口元の破綻や不自然な間が減ります。商品名や固有名詞は聞き取りやすいように短くし、字幕はVeo内で無理に生成せず、編集ツールで後付けするほうが安全です。

{{internal_link:Veo 動画生成}}

4. Ingredients to Videoで一貫性を高める

Veo 3.1のIngredients to Videoは、参照画像を使ってキャラクター、背景、物体、テクスチャを維持しやすくする機能です。シリーズ広告、ブランドキャラクター、同じ商品を複数シーンで見せる制作では特に有効です。

使い方の流れ: 1. 商品画像、人物画像、背景画像を用意する 2. 1本目は動きの少ないカットでテストする 3. 良い見た目を基準に、別アングルや別シーンへ展開する 4. 色、服装、形状、背景の固定条件を毎回プロンプトに入れる

プロンプト例: 「参照画像の商品ボトルを中心にした夏向けコスメ広告。ボトルの形状、ラベル色、キャップの質感を維持する。白い砂浜と透明な水面を背景に、ボトルの周囲を水しぶきがスローモーションで舞う。カメラは低い位置から右へスライド。明るい太陽光、爽やか、清潔感。8秒、9:16、YouTube Shorts向け。ラベルの文字は変形させない。新しい文字を追加しない。」

Veo プロンプトの書き方コツとして、参照画像を使うときは「変えてよい部分」と「変えてはいけない部分」を分けて書きます。たとえば背景は変えてよいが商品形状は固定、服装は固定だが表情は変えてよい、という指定です。

5. 失敗を減らすネガティブ指定

AI動画生成では、不要な要素を明示することも重要です。Veo 使い方に慣れていない初心者ほど、ポジティブな指示だけで終わりがちです。

よく使うネガティブ指定: - 余計な文字、ロゴ、透かしを生成しない - 指や顔を歪ませない - カメラを急に揺らさない - 被写体を途中で別人にしない - 商品形状を変えない - 不自然な口の動きを避ける - 背景に無関係な人物を出さない

完成プロンプト例: 「夜の渋谷の交差点を歩く若い男性モデル。黒いジャケット、白いTシャツ、自然な表情。カメラは横から滑らかに追従し、ネオンの反射が濡れた路面に映る。実写映画風、35mmレンズ、浅い被写界深度。環境音は街のざわめきと遠くの車音。12秒、16:9、4Kアップスケール向け。人物の顔を途中で変えない。指を歪ませない。読めない看板文字を強調しない。急なズームや激しい手ぶれは避ける。」

{{internal_link:Google Veo チュートリアル}}

他のAI動画ツールとの比較

Soraは2026年3月24日に終了方針が報じられ、アプリ型のAI動画SNSとしては継続性に課題を残しました。TechCrunchは、Soraアプリの終了と、AIだけの動画フィードが持続的な関心を得にくかった点を報じています。一方で、GoogleはVeoをGemini、Flow、Vertex AI、Google Vids、YouTube系の制作導線に広げており、業務利用ではこちらの統合性が強みです。

ツール 強み 弱み 向いている用途
Veo 3.1 4K対応、縦型、音声、参照画像の一貫性、Google製品との連携 細かな編集は外部ツール併用が必要 広告、SNS、企業動画、商品紹介
Runway 編集機能、映像制作UI、クリエイター向け操作性 長尺や一貫性は設計が必要 MV、映像実験、編集込み制作
Kling 動きの派手さ、人物・アクション表現 商用ワークフローや権利確認は要注意 SNS向け短尺、ダイナミック映像
Pika 手軽な生成、テンプレート的な使いやすさ 高精細な業務品質では調整が必要 ラフ案、短尺ネタ、SNS投稿
Sora(終了) 初期の話題性、動画SNS的体験 アプリ終了、継続利用リスク 過去事例の研究、代替ツール検討

結論として、Veo プロンプトの書き方コツを学ぶ価値が高いのは、Veoが単発の生成ツールではなく、Googleの制作・配信・業務基盤に組み込まれつつあるからです。

参考:Google公式ブログ「Veo 3.1 Ingredients to Video」、TechCrunch「OpenAI’s Sora was the creepiest app on your phone — now it's shutting down」。

ビジネス活用テクニック

広告動画では、1本の完成動画を一気に作るより、フック、商品提示、ベネフィット、CTAの4カットに分けます。たとえば9:16のSNS広告なら、冒頭2秒で課題を見せ、次の4秒で商品を見せ、最後の2秒で行動を促します。CTAの文字はVeoで生成せず、Canva、Premiere Pro、CapCutなどで後付けすると品質が安定します。

SNSコンテンツでは、縦型9:16とループ感が重要です。プロンプトに「最後のフレームが最初の構図に自然につながる」と入れると、リールやショート動画で使いやすくなります。

プロモーション映像では、4Kアップスケール前提で素材感を強く指定します。飲食なら湯気、照り、断面。美容なら肌ではなく容器、泡、液体の質感。B2Bなら人物より画面、手元、会議室の空気感を重視すると、過度にAIっぽい映像を避けやすくなります。

実務では、以下のように管理すると効率的です。 - A案:商品を主役にした静かな高級感 - B案:人物の使用シーンを見せる共感型 - C案:音と動きで目を引くSNS型

この3パターンを同じ商品画像から作ると、広告テストに使いやすい素材がそろいます。

よくある質問(FAQ)

Q1: Veo プロンプトの書き方コツで一番重要なのは何ですか?

A1: 一番重要なのは、被写体、動き、カメラ、音、出力条件を分けて書くことです。「映画風」だけでは抽象的なので、レンズ、照明、カメラ移動、尺、比率まで指定すると安定します。

Q2: Veoで4K/60fps動画は作れますか?

A2: 2026年時点では、Veo 3.1の4KアップスケールはFlow、Gemini API、Vertex AIなどで利用できます。60fpsについては、生成後に編集ソフトで補間・書き出しするワークフローが現実的です。

Q3: 音声同期を自然にするコツはありますか?

A3: セリフを短くし、話者、感情、速度、間を明記します。1カットに長い説明を詰め込まず、8秒前後で1メッセージにすると口の動きが破綻しにくくなります。

Q4: Sora終了後、Veoを選ぶメリットは何ですか?

A4: VeoはGoogleのGemini、Flow、Vertex AI、Google Vids、YouTube系の導線とつながっている点が強みです。継続的な業務利用、広告制作、チーム制作では、単独アプリよりワークフロー化しやすいです。

おすすめサービス・ツール

この記事で紹介した内容を実践するために、以下のサービスがおすすめです。

  • Amazon - AmazonでAI動画生成関連書籍を探す
  • 楽天ブックス - 楽天でAI動画生成関連書籍を探す

※ 上記リンクからご利用いただくと、サイト運営の支援になります。

まとめ

Veo プロンプトの書き方コツは、映像の完成形を「文章の雰囲気」ではなく「制作指示書」として書くことです。被写体、場所、動き、カメラ、照明、音、出力条件、ネガティブ指定を入れるだけで、生成結果は大きく安定します。

2026年のVeoは、4Kアップスケール、縦型9:16、Ingredients to Video、音声表現の強化により、SNS動画から広告、プロモーション映像まで実務で使いやすくなっています。まずは8秒の短い動画で1カットを完成させ、良いプロンプトをテンプレート化し、商品別・媒体別に展開していきましょう。