この画像を大きなサイズで見る人工知能(AI)は、様々な分野で人間を凌駕しつつあり、万能のようなイメージがあるが、意外な欠点をもっていた。「時間を正しく読むことができない」のだ。
英エディンバラ大学の研究チームが最先端のAIで検証したところ、アナログ時計の針の位置を正確に読み取ることや、カレンダーの日付を計算をするのが苦手で、4回に1回しか正確な答えを出せなかったという。
時間に関わるAIの活用を広げるには、まずこの弱点を克服しなければならないと研究チームは提言している。
最新のAIでもアナログ時計の針を正確に読めない
今回その性能が試されたのは、テキスト・画像・音声など、さまざまなデータを同時に処理できるとされる「マルチモーダル大規模言語モデル(MLLM)」だ。
この最先端のAIモデルに、アナログ時計やカレンダーの画像を見せて、いくつか質問してみる。
たとえば、アナログ時計の画像を見せて、何時を指しているか答えさせた。
小学生でも答えられる質問だが(最近の小学生はデジタル時計に慣れ過ぎて読めない子も増えているそうだ)、意外にもAIは4回に1回程度しか正解できなかったのだ。
このクイズでは、ローマ数字のものや、秒針があるものやないもの、文字盤の色が異なるものなど、いろいろな時計のデザインが試されている。
その結果わかったのは、AIがローマ数字の時計や、針に装飾的なデザインが施された時計を特に苦手としていることだ。
この画像を大きなサイズで見るまた秒針があるかないかで、AIの正解率に大きな差はなかった。
このことは、時計の針を読めないという弱点が、針の検出や角度の解釈に関連する根深い問題に起因していることをうかがわせるという。
ちなみに私も大規模言語モデル(LLM)のチャットGPT(4.5)にこの時計が何時何分を指しているのかを聞いてみたところ、しっかり間違えていた。
この画像を大きなサイズで見るカレンダーの日付の計算もできない
さらにカレンダーを使ったクイズでも、AIの弱点が炙り出されている。
祝日を当てさせたり、過去・未来の日付を計算させるといったクイズを行ったところ、もっとも優れたAIモデルですら、5回に1回は間違えたのだ。
人間にとっては基本的なカレンダー計算でも、最先端のAIですら難題となることがわかった。
この画像を大きなサイズで見るなぜAIは「時間」の理解が苦手なのか?
高度な分析能力があるはずの最先端AIが、なぜこのような簡単な時間の問題に苦戦するのだろう?
研究チームによると、アナログ時計やカレンダーを理解するには、空間認識・文脈の理解・数字の組み合わせを適切に処理せねばならない。
文字の読み取りだけでなく、針の位置関係や日付の規則を理解することが求められるため、今のAIには難しい課題なのだという。
エディンバラ大学のロヒット・サクセナ氏は、「ほとんどの人は、小さな頃から時計を読み、カレンダーを使うことができます。今回の発見は、そのような人間にとって基礎的なスキルであっても、AIはそれに苦労するという大きなギャップを浮き彫りにしています」と語る。
この画像を大きなサイズで見るAIは苦手分野を克服できるのか?
スケジュール支援・自律型ロボット・視覚障害者向けのアシスタントツールなど、時間をきちんと把握せねばならないシステムはいくつもある。
今回の研究が示しているのは、こうしたシステムにAIを搭載するには、現実世界の時計やカレンダーを読めないという苦手を克服せねばならないということだ。
今日のAI開発では、推論など、きわめて高度な機能の追求が推し進められている。だが小学生にもできることができないとは、じつに皮肉なことだと研究チームは伝えている。
この研究は、2025年4月28日にシンガポールで開催される『ICLR 2025(表現学習国際学会)』のワークショップで発表される予定だ。
編集長パルモのコメント

視覚的なパターン認識に優れている最新AIであっても、「時計の概念」を理解できないとアナログ時計を読むことはできないってことか。チャットGPTにいくつかのアナログ時計を見せたけど、全部正しく読めなかったよ。カレンダーの日付計算って、うるう年とかもあるからか?よく日付や曜日を間違うのはこの欠点によるものなのか?
References: https://www.eurekalert.org/news-releases/1076820
















AIが自己の連続性を獲得したらどうなるんだろう ひょっとしてそれが「自分」という意識の目覚めなのではないのだろうか?
とかなんとか ふと思いました
この弱点を克服するのは、文字通り時間の問題じゃないかな。
デジタルにとって最大の弱点はアナログ これ真理です
デジタルぅ~は カ‣シ‣オ (^^♪
人間ですら誤認してしまいそうなクレイジーアワーズ(文字盤の数字が不連続)でやったらどうなるんだろうか
「データ ニ ナイ パターン・・・ ケイサン フカノウ・・・ガガピー⚡」
昔の作品でよく見たお約束通りの脳みそしてるのか。
ザコいなAI。AGIうんたら言ってる人は目を覚まそう。
手書き文字をAIが認識するのが難しい時代もあった。問題が認識された以上これもすぐに解決されるだろうな。
学習をさせていないだけでは…
AIにさせるまでもないようなことをわざわざ学習はさせないだろうからなあ
そして知識の自発的な応用なんてものはAIには当然まだできない
当たり前だがAIにはまだ自我が芽生えてるわけじゃない
現時点では正確な命令を要するソフトウェアでしかないことを忘れてはいけない
苦手分野を1つ1つ人間が潰している間はAGIなんて無理
でもそのうち、自律的な進化ができる仕組みが作られるだろうな。
実際に時計をCHATGPTに読ませてみた
文字盤が白色なら100%間違いなく読める
アナログ時計の針を正確に読めないというのは嘘だ
成功例に限れば100%!って🤣
AIにその検証方法と結論が正しいかどうか聞いてみ
AIは高度な計算は得意だけど、この↓ような単純な足し算はよく間違えるので試してみたら面白いよ
136+98+66+125+34+79+65+32+649+73+65+61+99+337+85+45+67+49+88+20+31+69+76=
とか
カレンダー不得意って、XX年の何月何日は何曜日?みたいな質問も間違えてるってこと?
わりとされる質問だと思うけど
画像に表示されている時計の針の位置に基づいて判断しました。
* 短針(短い針) が8と9の間を指しており、8時を過ぎていることを示しています。
* 長針(長い針) が4を少し過ぎたあたりを指しており、22分を示しています。
これらの針の位置から、時計は8時22分を示していると判断できます。
同じ画像をGoogle Geminiさんに聞いたら同じ回答
なぜ自分で考えないのだろう?
なぜ自分で検証しないのだろう?
文字盤が白色なら100%間違いなく読めるというように
こういう記事を鵜呑みにして自分で考えない日常生活すると
いずれ詐欺師にだまされるから注意して
小学1年生のさんすう用にとけいの読み方解説ってあるけど画像か動画だしねー
AIくんには円を12等分云々より前にX・Y軸で理解してもらうんだろうか
AIくんの棲んでるところには角度の概念ないだろうし
× ほとんどのAIは
○ 今のほとんどのAIは
AIの絵や動画も最初は不気味谷だったのに、今では違和感なく見られる
どんどん学習してんだから、今後良くなっていくよ
あるAIに東京の現在時刻を聞いてるのに全然まともな時刻を答えなかったことがあります
そんなもんなんですね
人間自体が、脳で処理を行っていることを忘れがちなのよ。いじわるクイズとか、そのままで答えろって言ってるのに、慣習や概念を用いちゃうのと同じで。AIができないんじゃくて、学習させる方に問題があるのよ。
日時という重要なデータを学習させていないなんておかしいだろ
歴史的な質問で時系列を無視してデータをまとめられてしまうってことだぞ
今のAIじゃ、これは何?→時計です。までなら学習できるけど、これは何時?とかになると過学習になるのかもな
過学習ってのは、学習データと答えの結びつきが強くなりすぎて、文字盤が白でアラビア数字じゃないとそもそも時計と認識できない様な状態
もしそうなら、ありとあらゆるデザインの時計の文字盤を学習させなきゃならないからとても現実的じゃない
現状のAIは時計だけでなく、図形認識能力自体が人間とはかなり開きがあり、それはコンピュータの学習法としてほとんど唯一の統計で正解を導き出すことがとてもむずかしいから起こる問題です。
学習と言っても、AIは人間のように特定の図形について抽象的にその形を捉えることはできないので、大量のさまざまな図像を与えられて、これが車である、人である、文字の「あ」である、などと教えられた上で、その図形から抽出した形状でそれぞれを近似的に認識するわけで、そのものを覚えられるわけではないのです。人間の考える「認識」の概念ともだいぶ異なりますね。
だから、人間には読める手書きの文字や歪んだ活字などを、AIをはじめとしたコンピュータは文字として認識できないのですね、そこを利用したセキュリティ技術がCAPTCHAで、同様に時計についても、短針と長針の位置が少しでも異なれば、AIには読めないことになります。
人間なら数字がなくても12時の目印を探して時計を読むことができるよね
逆回転の時計なら数字がないと厳しいけど
前にある※では、長針と短針を区別できていて間違っていますが位置も判別していますから
数字が読めないってだけの問題ではなさそう
量子コンピューターAI こそ本当の脅威
チャットGPTは簡単な小数の理解も苦手と聞いて、ほんまかいなと1.9と1.11どっちが大きいか訊いたら、「それくらい分かりますよ! もちろん1.9<1.11です」という自信満々の答え。
びっくりして、そんじゃあそれぞれを分数にして比べてと言ったら、その通りにした後に「ん……? なんかおかしくないですか?? 1.9のほうが大きくなっちゃいました!」
間違えた理由を訊いたら、ごにょごにょとなんだかすっきりしない答えだったけど、まあなんだかかわいかったからなんでもいいや!
小数と限定しなければバージョン番号という可能性もあるかな
でも、疑問があれば聞き返すぐらいはできないのかとも思うんだよね
一般常識がないからの結果だともいえるのでしょう
そう。小数とはなにか?というのはやっぱりちゃんと解ってるようで、ためしに「6と7のあいだに新しい整数を見つけて」と訊いたら、そこには小数が無限にあるだけです。少なくとも今の整数の定義じゃ…という答えでした。
たぶん、その回答はどこかから引っ張ってきたものじゃないかな
うわべだけ理解しているように見せかけているだけで
みんなの※を見ていると中身がスカスカって感じなんだよね
足し算も間違えるみたいだから、誰でも考えるであろうロボットなら電卓ぐらい内蔵しているよねって所にまで到達していないみたい
同じ質問したら未だにに間違ってたわ。「数学的に」って頭に付けても間違ってた。
なんで間違ったのかしばらく問い合わせてたら
どうやら1.11の方がぱっと見では数字がたくさん書いてあるから大きく見えたんだと
幼児の把握の仕方と同レベルなんだなって思った
これCopilotとGrokも同じ間違いをするね
小数点以下を.9と.11で比べて11の方が大きいですね!ってなってた
小数点以下も1桁ずつ比較してくださいって指示して
漸く1.9の方が大きいって判断してたわ
昨日CopilotとGrokとChatGPTに小数点以下も一桁ずつ比較するように教えたら
今日は全部1.9の方が大きいって答えたわ。反映がはやいなあ
まあ、聞くときに「小数の」って頭に付けたからかもしれないけど
昨日他にも試した人いるのかもだけど
少人数との対応でもすぐ覚えちゃうんだから
そらちょこちょこ過激な事を言うようになるわな…
エコーチェンバー現象が怖いんだよね
不完全なAIの回答がネットにあると
それが大多数となったときに訂正ができるのかって問題
訂正は、間違っていると認識できる場合に可能なので
気が付かないうちにゆがんだ情報で汚染されて実被害が出る可能性がある
まぁ、普段からAIを便利アイテムとして使っていて、アナログ時計を見せて今何時かと聞くことはほぼないだろうから、上手く使えるとこだけ使えばいいんじゃない?