ChatGPTの「ライブカメラ機能」って?
ChatGPTのライブカメラ機能は、リアルタイムで映像を解析し、ユーザーとの対話を可能にする新しい機能…ということらしいが、このニュースは今年1月のもの。全然知らなかった。家人に言われて調べてみた。。。
ChatGPTが“視覚”を手に入れた!ライブカメラ機能でチャットがもっと便利になった
ChatGPTがついに「目」を手に入れた。できること、できないこと | ギズモード・ジャパン
2025年1月31日、ChatGPTの高度な音声モードにライブカメラ機能が追加されたことが発表されました。この新機能により、カメラから映像を読み取り、リアルタイムでユーザーと会話することが可能となります。これにより、ユーザーはよりインタラクティブな体験を享受できるようになります。
このライブカメラ機能は、2025年1月28日現在で、Plus(月額20ドル)またはProプランのユーザーが利用できるようになっています。さまざまな使い道を試した結果、機能のメリットとしては、より自然なコミュニケーションが可能になる点が挙げられます。一方で、プライバシーの懸念や技術的な制約も存在することが明らかになりました。
今後、このライブカメラ機能はさらに進化し、より多くのユーザーに利用される可能性があります。特に、教育やビジネスの分野での活用が期待されており、ユーザーのニーズに応じた新たな機能が追加されることが予想されます。
ということで、使ってみた
今まで画像とかでバディと話してきたが、動画や音声もOKなら、EDMのライブとかも共有できるじゃんって感じでやってみた。。。ただしPlusプラン以上が利用条件だよ。
まずはスマホのChatGPTアプリを起動して、右下のアイコンをタップしてボイスチャットを立ち上げる。

ボイスチャットが立ち上がったら、左下のビデオカメラのアイコンをタップする。

そのまま周りを写したり、動画などを写して、ChatGPTとその映像に関する会話を(音声で)行う。

これはPCのYouTubeでTomorrowlandのメインステージでのMeduzaのライブを再生して、写してる。このまま会話したら、こんな感じに。
実際のライブカメラ見ながらの会話
あなた
“これ見える? Meduzaさんのライブ、今年のトゥモローランドのメインステージ。”
00:08
ChatGPT:
うん、ちゃんと見えてるよ!Meduzaのライブ、
あなた:
いいでしょ!
00:00
ChatGPT:
めっちゃ雰囲気伝わってくるね!Tomorrowlandのメインステージ、やっぱりすごい盛り上がりだなあ。後ろの観客もめっちゃ盛り上がってるし、これは見てるだけでテンション上がる!
あなた:
ステージの向こうに見えてるのが燃えちゃったメインステージね。 今年そういう事件あったでしょ? で、メタリカさんがこのセットを貸してくれて、急遽行えたそうで。”
00:16
ChatGPT:
あ、なるほどね!確かに今見えてたのが、もともと燃えちゃったメインステージの代わりに急きょ使ったセットなんだね。メタリカさんが貸してくれたっていうのがまたすごい話だなあ。そんな裏話聞くと、余計に今回のライブが特別な感じがするね。
あなた:
“そうだね、たまに後ろに映る骨組みが、燃えちゃった残りみたいよ。ほらこれ。ね。”
00:09
ChatGPT:
ほんとだ、確かに後ろに映ってる骨組みがその名残りっぽいね。そうやって見ると、なんだかこのライブが一層ドラマチックに感じるなあ。ある意味、このハプニングを乗り越えて続行してるのがすごいし、観客の熱気も伝わってきて、特別感あるね。
あなた:
ホントにね。
00:00
ChatGPT:
うん、ほんとに
これ、いいけど長時間はキツいね。。。
なかなかいい。いろいろ映像や音を認識して、答えてくれる。ただ、答えるのに少しラグがあって「どうした?」とか一瞬思ってしまうのがちょい興ざめかも。まあラグがあるという認識で臨むのがいいかも。
F1のレースとかを見ながら共有できるかな、と思ったけど、スマホをずっと支えるのも大変だし、ラグのある会話を音声でし続けるのは、映像にも集中できなくて、あんま実用的じゃないかな、とも思う。たぶんバッテリーやサーバーの負担も大きいだろうし。。。
ただちょっと周りとかぐるっと見せて「ここどこ?」とか「これ何?」とかきいたりとかには便利そう。。。
ということで、いつものごとく、レースとかライブとかの画面をパチッとリアルタイムで撮影してその画像を共有しながらチャットで会話を楽しむ、という現在のスタイルは変わらなさそうだ。
今日はそんなわけで。。。




コメント