最近、SNSを見ていると
ある言葉をよく見かけませんか?

▲「これAI?」
イラスト、動画、写真、発言する声まで。
少しでも完成度が高かったり、現実離れした滑らかさがあると
👆すぐに飛んでくるこの一言……
今回話題になったネットニュースも、まさにその象徴でした。
発端は「懐かしCM動画のシェア」
今回話題となったのは、
過去に放映されていた『燃焼系アミノ式のCM映像』
▲当時の動画シェア投稿が、大きな反響を呼んだ
印象的だったのは、これがAIに見えるという
この現代ならではの受け止められ方。
確かに今の生成AIは、プロンプト次第で
現実離れしているのに、現実のように見える──
そんな映像表現すら、個人レベルで生成できる時代です。
「AIでは」断定は少し危うい
「AIでは?」
と、疑ってしまう感覚自体は
ある意味仕方ない部分もあります。
ただ、それを確証もないまま
本人に向けて断定的にぶつけてしまうのは、
少し話が変わってきます……
生身の身体表現や技術で制作している
クリエイターやパフォーマーにとって、
それは日々の努力や、鍛錬の積み重ねそのもの。

▲「AIでしょ」
それを、この一言で片付けられてしまう感覚。
時間をかけて磨き上げた自己表現の結晶が、
瞬間的に生成される画像や映像と
=(イコール)として捉えられてしまう。
それは場合によっては、
本人の技術や表現へのリスペクトを欠いた
受け取られ方をしてしまう可能性もあります。
実際、AI技術的にはどこまで再現できる?
こうした議論が生まれる背景には、
AI技術そのものの急速な進化があります。
実際、現在の動画生成AIは
プロンプト次第で人間の身体表現に近い
モーション生成も可能になってきています。
では、実際にどこまで再現できるのか?

今回、動画生成AI:Grok を使用し、
燃焼系アミノ式CM風の動きをテーマに、再現検証を行ってみました!
結果:同一プロンプトでも結果は変わる
まずは、シンプルな
日本語での共通プロンプト👇
画像のキャラがハイ!と片手をあげた後、立った状態から足を上方へ回して回転、再び着地する技(その際、手は地面につかない宙返りのような感じ)を連続でこなしていく。場所は駅のホーム。
生成結果:パターンA
【動画A】
▲ロングヘア化は動きに映える…けども!
回転動作そのものは再現。ただし構図は正面寄りで、
回転の軌道がやや分かりづらい結果に。
さらに、キャラクターデザインにも
若干の揺らぎが見られました。
▼改めて、こんなキャラデザです

そこで、共通プロンプトに以下の一文を追加👇
横から回転が見える構図。
生成結果:パターンB
【動画B】
▲最初は前回転だったはずなのに…!?
浮遊中の顔が不安定になり、
気付けば後ろ回転へ変化。
一方で、回転軌道や足さばきの再現度は向上。
アミノ式CMらしい軽快さには近づいた印象です。
しかしその分、顔の補間処理や
滞空挙動に浮遊感が残る結果に。
生成結果:パターンC
【動画C】
▲フォームが美しい…かも?
重心挙動が明らかに改善。
回転中の身体軸や、着地動作は
かなり人間的な挙動となりました。
ただしAIは安定性を優先し、
手を支点とした回転モーションを選択。
「手をつかない宙返り」という指示よりも、
物理的に破綻しにくい動きを優先する傾向が見られます。
検証:指示を増やしすぎるとどうなるか
では、さらに制御を強めたらどうなるのか。
以下の要素まで細かく指定した
英文ロングプロンプトを生成し、再検証を実施しました。
- カメラ固定
- 回転軸の明示指定
- 物理挙動の制約
- 演出抑制(浮遊・誇張禁止)
生成結果:パターンE
【動画E】
▲長文プロンプトのわりには…ウーン…
回転軌道やフォーム精度は確かに向上。
しかしその一方で、
次のような破綻も発生しました。
- 顔補間の崩れ
- 帽子デザインの変形
- 後半モーションの雑化
つまり、
制御項目を増やせば増やすほど精度が上がるわけではない
という結果に。
むしろ、制御過多による不安定化が確認されました。
なぜこうなるのか?
AIは「命令を理解している」のではなく、
大量の条件の中から最も整合的な解を推定しています。
条件が増えすぎると、
これらが起きやすくなります。
- 優先順位の競合
- トークン圧縮による解像度低下
- 物理制約と演出指示の衝突
その結果、一部精度が上がる代わりに
別の部分が崩れる。まさにトレードオフです。
実際に使用した英文プロンプトがコチラ👇
Create a video of the character performing an energetic Amino-style commercial athletic move sequence on a Japanese train station platform. The character’s identity must stay cute and fully consistent with the reference design. Do not change the character’s face, eyes, mouth, hairstyle, cap, outfit, or proportions. No face distortion, no facial morphing, no monster-like deformation. Preserve cuteness and facial stability even during fast motion and rotation. --- Scene: - realistic Japanese train station platform - empty platform - no crowd - no background characters - no readable text signage Environment should remain secondary, with focus on the character’s movement. --- Camera (STRICT SIDE VIEW ONLY): - strict side profile view only - character body facing left or right - camera perpendicular to character motion - full body always visible - rotation trajectory must be clearly visible from the side - no front view - no angled view - no camera movement - no zoom - no camera shake --- Action Sequence (8–10 seconds): 1. Character stands upright in a relaxed pose. 2. Character raises one arm straight upward with an open palm and energetically says “Hi!” (No pointing finger, no fist gesture.) 3. Character bends knees deeply and swings both arms backward to prepare jump momentum. 4. Character performs a controlled but powerful vertical jump from a standing position. 5. While airborne, character executes a clean standing backflip rotation: - full backward somersault - tight rotation axis - leg-driven torque - NO hands touching the ground at any time Not allowed: - side flips - spin kicks - breakdance moves - floating rotations 6. Character lands firmly with visible knee compression and ground impact absorption. 7. Character immediately transitions into the next standing backflip in rhythmic commercial pacing. --- Motion Style: - energetic fitness commercial choreography - athletic but light and rhythmic - continuous flip performance - playful and cute presentation - NOT explosive bombing motion - NOT overly aggressive power jumps --- Physics & Timing: - realistic gravity - short airtime - fast ascent and descent - firm landing friction - feet stop naturally on landing - visible ground reaction force - no hovering - not floaty - no slow motion - no wire-action effect
検証して見えてきたこと
今回の再現検証から見えてきたこと。
- 指示が曖昧だと再現度は限定的になる
- 構図指定は精度に直結する
- AIは安定フォームを優先する傾向がある
- 指示過多は挙動破綻を招きやすい
- 同一プロンプトでも個体差は生まれる
つまり、
「プロンプトを出せば思い通りに再現できる」
というほど単純な構造ではないということ。

『AIっぽく見える動き』が、生まれる理由も
実際に生成して検証することで、具体的に理解できました。
見るだけでは曖昧だった違和感が、構造として見えてくる。
ここが、今回いちばん大きな収穫です。
まとめ:これAI?の前に
AI疑惑を抱くこと自体は、
技術がここまで進化した今、
ある意味自然な反応なのかもしれません。
実際に生成してみると『AIっぽさ』が
どこから来るのかも少しずつ見えてきます。
ですが同時に……、

人間の身体表現や、技術の積み重ねが、
どれほど繊細で、どれほど再現が難しいものなのかも、
改めて実感する結果となりました。
AIと人間の境界が曖昧になっていく時代。

だからこそ「これAI?」という一言の扱い方も、
ほんの少しだけ慎重さが求められるのかもしれません。
一方で、
AI技術は個人創作の可能性を広げる
刺激的なツールでもあります。

疑うだけで終わるのではなく、自分でもやってみる。
その一歩が、AI時代をいちばん面白くするのかもしれません✨
👇AI使ってみようかな?となった初心者さん!コチラを要チェック!!


