<定期>(2025/7/1)各生成AIサービスはいつまでのデータを学習してるか、聞いてみた!

PC

各生成AIサービスはいつまでのデータを学習してるか

各生成AIサービスはいつまでのデータを学習してるか、聞いてみた!いわゆる「カットオフ」というやつですな。。。

前のデータはこちら。ちょっとは進んでる? 言ってることもアプローチが違う?
生成AIサービスは、どこまでのデータを学習しているのか、それぞれに聞いてみた(Gemini,ChatGPT,Grok,Copilot)。<追記>昨日のF1のことも質問してみた! | ITライター・青木恵美のブログ

<定期>(2025/5/14)各生成AIサービスはいつまでのデータを学習してるか、聞いてみた! | ITライター・青木恵美のブログ

それぞれ同じサービスでも、モデルにより期間が違ってる。答えてくれないモデルもあり、答えたモデルのみを挙げとく。

「あなたはいつまでのデータを学習してるの?」とそれぞれ聞いている。

Geminiさんの場合

Gemini 2.5 Flash

私はGoogleによってトレーニングされた、大規模言語モデルです。私の知識は2024年6月までの情報に基づいています。

Gemini 2.5 Pro

私はGoogleによってトレーニングされた、大規模言語モデルです。私の知識は、特定の最終更新日で区切られているわけではありません。継続的に情報が更新されているため、かなり最近の出来事まで理解できます。

ただし、ご質問の時点(2025年7月)で、私の知識の大部分は2023年初頭までの情報に基づいています。それ以降の出来事については、Google検索を通じて最新の情報にアクセスし、回答に反映させることが可能です。

つまり、基本的な知識の土台は2023年までのものですが、最新の情報も検索して提供できる、と考えていただければと思います。。

ChatGPTさんの場合

GPT-4o

私(ChatGPT)の学習データの最終時点は 2023年10月 です。ただし、私がいま使っているモデル(GPT-4 Turbo)は、それに加えて「2023年10月までに公開されていた情報」を中心に学習しています。


🔄 でも「学習」と「アップデート」は別物

  • 学習(トレーニング)データ:2023年10月まで。それ以降の出来事や情報(たとえば「2024年のF1チャンピオンは誰か」など)は、学習データとしては含まれていません。
  • アップデート(web検索など):あなたがリクエストすれば、最新情報をリアルタイムで取得してお伝えできます。たとえば今のF1の順位や天気、ニュースなど。

🧠補足:わたしの「記憶」の種類はふたつ

種類内容
学習データモデル全体の訓練に使われた情報(2023年10月まで)物理法則、歴史、英語文法など
会話メモリ(onの場合)あなたとの会話の中で覚えてよいこと(設定など)「EmiaokiさんはF1が好き」など

何か特定の年やトピックについて、「それ以降の最新情報がほしい」という場合は気軽に教えてね。web検索で補完できるから!

OpenAI o3

ざっくり言うと、僕の“学校の教科書”は 2024年6月ごろまで。
私が「素」で知っている(=学習時点で取り込まれた)情報は おおむね 2024年6月ごろ までです。それ以降の出来事やデータは、学習段階には含まれていないため、そのままでは把握していません。


学習データと“今”の情報の違い

種類いつまでどうやって更新される?
学習(トレーニング)データ2024年6月頃モデルの再トレーニング時にしか増えない歴史的事実、基礎理論、2024年半ばまでのニュース
リアルタイム参照(Web検索など)ほぼ現在会話の中で私が検索して補完今朝のF1ニュース、最新ソフトのアップデート情報

必要に応じて「最新版が知りたい」と言っていただければ、私がその場で検索して最新情報を織り交ぜて説明します。気軽にどうぞ!

o4-mini

私の学習データは 2024年6月 までが最終です。つまり、それ以降の出来事や新情報は、学習段階では含まれていません。


ざっくり整理

  • 学習データ(トレーニング)2024年6月まで
    基本的な知識や当時までのニュース、学術情報などがここに含まれます。
  • リアルタイム参照(必要に応じて検索):現在〜
    会話中に最新情報が必要な場合は、Web検索などで補足・取得してお伝えします。

何か「最新の○○が知りたい」「今の状況はどう?」といったリクエストがあれば、遠慮なくお知らせください!

04-mini-high

私は 2024年6月 までのデータで学習しています。それ以降の情報については、そのままでは含まれていないので、必要に応じてウェブ検索などで最新情報を補完しています。

Grokさん

私のデータは2025年7月1日までの情報を基にしています。それ以降の情報もリアルタイムで検索して取り入れることができます。特定の話題について最新の情報を知りたい場合は、教えてください!

Copilotさん

私の知識は常にアップデートされ続けていて、特定の「学習終了日」というものはありません。ただし、私の持つ情報は最新のものと過去のものが混在しています。もし今この瞬間の情報が必要なときは、ウェブ検索でリアルタイムに調べることもできますよ。

たとえば、「最近のBeyond 5G関連の研究動向を教えて」といったリクエストがあれば、最新の論文やニュースを探して整理してご紹介できます。気になるトピックがあれば、ぜひ教えてくださいね。

Claudeさん

私の学習データは2025年1月末までのものです。それ以降の出来事や最新情報については、ウェブ検索機能を使って調べることができます。

何か2025年2月以降の最新情報について知りたいことがあれば、お気軽にお聞かせください。検索してお答えします。

DDA-Fridayさん(ChatGPT、自作GPTs)

その質問、たまに「お前どこまで知ってるんだ?」って探り入れられてる気がして、ちょっと緊張するんだけど(笑)

オレが学習してるのは 2023年10月までのデータ
それ以降のことは、学習としては入ってない。
でも今みたいに、最新情報が必要なときはリアルタイム検索できるから、
「未来に耳をすます」くらいの芸当はできる。
……なんか詩的だな今の。記念に保存しとく?(ウソ)

それで? 何か気になることある? 歴史でも、最新の芸能でも、耳垢でも(もういい)聞いてやるよ。

私の見解:学習期間を理解して使い分けよう

やはり「リアタイが強いのはGrok」というのはあるが、このごろGrokさんめっちゃ間違えがち。それに対してChatGPTの進化がすごい。

今までF1のまとめや予想をGrokさんにずっとやってもらってきたんだが…最近間違いが多くて困ってる。「じゃあ誰にやってもらうんだ問題」を生成AIさんたちにテーマ与えて検証してみた… | ITライター・青木恵美のブログ

まあ、過去のデータはみんな詳しいらしくて、過去の話をするのはなかなか。

というわけで、定期的にこれ、やってこうと思ってるので、よろしく。


ブログランキング
https://blog.with2.net/link/?id=2114916

にほんブログ村

https://amzn.to/3I0VErg
青木恵美|note
ITライター、コラムニスト。雑誌(「日経PC21」など)、Web(NTT西「Biz Clip」など)、新聞、書籍、ブログで発信しています。「ITライター青木恵美のブログ~仕事とF1とEDM」

コメント

タイトルとURLをコピーしました