「アイサレタイ」をテーマにしたAI動画制作
yumchaさん公式TikTokはこちら
「アイサレタイ」とは?
曲名「アイサレタイ」には、片思いの切なさや、誰かに「自分を大切にしてほしい」と願う気持ちが、ストレートに込められています。歌っているのは、日本のシンガーソングライター・Yumcha。日常や恋愛の感情をリアルに切り取ったポップな楽曲を得意とするアーティストです。
「アイサレタイ」は、恋愛のワクワク感と同時に、不安や自己肯定感の揺れ動きまで描いた代表曲のひとつ。だからこそ、短い動画でも感情が伝わりやすく、共感を生みやすい楽曲だと感じました。
一方で、
「動画を作りたいけど、編集スキルがない」
「頭の中にイメージはあるのに形にできない」
そんな悩みを一気に吹き飛ばしてくれるのが、今のAI動画制作環境です。
今回紹介するのは、
ChatGPTで構成を作り、Grokで映像を生成し、Canvaで仕上げる という流れで制作した約30秒のショート動画。
驚くのは、専門的な動画編集ソフトをほとんど使わずに、
アイデア → 映像 → 1本の動画完成 まで進められたことです。
この記事では、実際の制作の流れと、動画作りに使ったプロンプトの考え方を詳しく解説していきます。
今回作った動画のコンセプト
テーマは
「アイサレタイをテーマにした、思わず見入ってしまう、感情が伝わるキャラクター動画」
ただ動くだけの映像ではなく、
・表情に感情がある
・動きにストーリー性がある
・短いのに印象が残る
そんな動画を目指しました。
ショート動画では「情報量」よりも“一瞬で伝わる感情” がとても重要です。
そのため今回の動画は、
▶ 冒頭:目を引くシーン
▶ 中盤:キャラの魅力を見せる動き
▶ 終盤:印象に残る締め
という3部構成で設計しています。

“アイサレタイ”って気持ちが、ちゃんと届く動画にしたかったなも

…だから見入っちゃうんなも
STEP1:ChatGPTで「動画の設計図」を作る
まず最初にやったのは、いきなり映像を作ることではなく動画の流れを文章で設計すること でした。
ここでChatGPTにお願いした内容はこんなイメージです。
- 30秒のショート動画構成
- キャラクターの感情の変化
- カメラワークの流れ
- SNS向けにテンポの良い展開
つまりChatGPTは、「動画の脚本家」ポジション です。
ここで構成が曖昧なまま進むと、後の映像生成がブレやすくなります。
逆に、流れをしっかり決めておくとGrokに出す指示(プロンプト)も具体的になり、映像のクオリティが一気に上がります。
ChatGPTを使うには?
ChatGPTを使うにはこちら⇒https://chatgpt.com/ja-JP/

今回始めにChatGPTに質問した内容はこちら↓
私よりいい子がいるはずないのに アイサレタイ アイサレタイ 垢抜けてリベンジ 沼らせたい 沼らせたい よそ見できないくらい 笑顔 怒った顔 泣き顔もあげるから アイサレタイ 私を君の彼女にしてみない?、という歌詞を使ってGrokで30秒の構成を作るために5つの6秒プロンプトを考えて
STEP2:Grokで映像を作るプロンプトの考え方
次に行ったのが、Grokでの映像生成です。
ここがいわば 「監督への指示出し」 のパート。
映像AIにうまく伝えるコツは、「何が起きているか」ではなく「どう見せたいか」まで書くこと です。
例えば今回意識した要素は…
✔ キャラクターの情報
- 見た目の雰囲気(かわいい・親しみやすい など)
- 表情の変化(笑顔→照れ など)
- 動きのテンポ(ゆっくり・軽やか など)
✔ シーンの雰囲気
- 柔らかい光
- 暖色寄りのライティング
- 背景はふんわりしたボケ感
✔ カメラの動き
- 少しずつ近づく
- 目線の高さに合わせる
- 最後に印象的なアップ
こうした要素を文章でまとめたものが、
動画生成用プロンプトになります。
プロンプト例(考え方ベース)
アニメ調のやわらかい雰囲気のキャラクター。
暖色系のやさしい室内光。
カメラはゆっくり前に近づきながら、キャラクターの表情の変化を丁寧に映す。
最初は少し緊張した表情、徐々にやわらかい笑顔になり、最後は視聴者に語りかけるような目線。
背景はやわらかくボケていて、キャラクターが主役になる構図。
ポイントは、ストーリー+感情+カメラ をセットで書いていることです。
「かわいいキャラが立っている」だけでは
AIは“雰囲気のある動画”を作ってくれません。
でも「どんな気持ちで、どう変化して、どう見せたいか」
まで書くと、映像が一気に“作品”になります。
Gorkを使うには?
Gorkを使うにはこちら⇒https://grok.com/
印①の所で質問ができ、印②の所をクリックすると動画を作るところに飛びます。↓

上の印②に飛ぶと下側に「イメージを入力」と出るのでそこに指示(プロンプト)を入力します。↓

実際に使用したGrokに送る指示(プロンプト)
今回ChatGPTに30秒の構成を作るために5つの6秒プロンプトを考えてもらったので5つのプロンプトを紹介します。
始めのプロンプト↓
アニメ調、やわらかい色味、暖色寄りの室内ライティング。ポップで恋する雰囲気。
部屋の鏡の前で女の子が自分を見つめている。少し拗ねた表情と自信の入り混じった顔。
カメラは鏡越しのバストアップ→ゆっくり寄り。
歌詞テロップ(白太字+黒フチ・中央):
「私よりいい子がいるはずないのに」
表情は強がり気味→少し不安げに揺れる目。
BGM:ポップで恋愛系の軽快な曲スタート。
二番目のプロンプト↓
アニメ調、明るめの背景、キラキラしたハートや光のエフェクト。
女の子がカメラに向かってぐっと近づき、両手を胸の前でぎゅっと握る。
瞳うるうる、真正面目線。
歌詞テロップ中央大きく:
「アイサレタイ アイサレタイ」
カメラ:正面寄り→さらに顔アップ
表情:切実だけど可愛い、ちょっと必死
効果音:キラキラSE、ドキンという心臓音を小さく
三番目のプロンプト↓
アニメ調、背景が一瞬キラキラエフェクトで変化。
女の子が指パチンでイメチェン。髪型・服・メイクが一瞬で垢抜ける演出。
ポーズを決めてウインク。
歌詞テロップ中央:
「垢抜けてリベンジ 沼らせたい 沼らせたい」
カメラ:全身→回転トランジション→決めポーズでストップ
効果音:ポンッという変身音+キラッ
雰囲気:一気に自信MAX
四番目のプロンプト↓
アニメ調、背景はシンプルで表情が目立つ構図。
画面が3分割やポップなカット割りになり、
笑顔→怒った顔→泣き顔がテンポよく切り替わる。
歌詞テロップ中央:
「よそ見できないくらい 笑顔 怒った顔 泣き顔もあげるから」
カメラ:顔アップ固定、表情だけ高速変化
効果音:ぴょん・ぷんすか・ポロロン(涙)などコミカルSE
最後のプロンプト↓
アニメ調、夕方の街並みや教室の窓辺などロマンチックな暖色背景。
女の子が少し照れながらもまっすぐカメラ(=好きな人)を見る。
一歩近づいて微笑む。
歌詞テロップ中央大きく:
「アイサレタイ」
その後少し間をあけて
「私を君の彼女にしてみない?」
カメラ:バストアップ→ゆっくり寄り→瞳アップで止め
表情:照れ+本気の笑顔
BGM:ここで一瞬静かになり、最後にキラキラした余韻音
STEP3:Canvaで動画をつなげて1本に仕上げる
Grokで作った動画は、短いカットごとに出力されます。
そこで最後に使うのが Canva です。
Canvaの良いところは、とにかく
- ドラッグするだけで動画を並べられる
- カットの順番を直感的に入れ替えられる
- テキストや効果音も簡単に追加できる
という手軽さ。
今回は、
1️⃣ 冒頭の引きカット
2️⃣ キャラの魅力が伝わる動き
3️⃣ 印象的なラストシーン
この順番で並べ、テンポが悪い部分を少しカットして
約30秒の動画に仕上げました。
難しい編集ソフトがなくても、
「見やすい流れ」に整えるだけで動画の完成度は大きく上がります。
Canvaを使うには?
Canvaを使うにはこちら⇒https://www.canva.com/

動画完成‼
TikTokで見るにはこちら
AI動画制作をやって感じたこと
一番感じたのは、「動画制作は技術より、イメージ力の時代になった」ということ。
- 映像スキルがなくても
- アニメーション知識がなくても
- 高価な編集ソフトがなくても
頭の中のイメージを、AIへの言葉(プロンプト)に変換できればここまで形になる時代になっています。
つまり今の動画制作は
✖ 編集ができる人が有利ではなく
⭕ イメージを言語化できる人が強い
という世界に変わり始めているんです。

“作れる人”の定義が変わったんだと思うなも

想像できる人、全員チャンスあるなも!
これから動画を作ってみたい人へ
もしあなたが「動画作りは難しそう」「センスがないと無理そう」
と思っているなら、それはもう昔の話かもしれません。
今回は
ChatGPTが構成を考え
Grokが映像を作り
Canvaが仕上げてくれます。
あなたがやることはたった一つ。
「どんな動画を見てみたいか想像すること」
それさえできれば、あとはAIが一緒に形にしてくれます。
次にバズる動画を作るのは、もしかしたらあなたかもしれません。

