この画像を大きなサイズで見るAI(人工知能)の日進月歩は止まらない。最近ではその性能よりも、いかに人間の思考・感覚に近づくかの研究が進められている。
コンピューターなら数の扱いなはお手の物。複雑な計算を一瞬にやってのけるが、人には直感とでもいうべき、数に対する感覚がある。
たとえば4匹の猫ちゃんと4つのりんごと数字の4を見たとき、特に数えたりするまでもなく、1つの共通点――つまり4という点で同じであることをパッと見抜く。
じつはこれ、コンピューターが苦手とするものだ。
これは、人の思考とコンピューターの違いを示す格好の例であり、圧倒的な計算能力を持つコンピューターをしても、人間並みの幅広い知性が実現されていない理由をも説明してくれる。
ところがだ。『Science Advances』に掲載された研究によれば、なんとAIが人のような数の感覚を自ら発達させてしまったのだという。
差異のある世界でコンピューターが数を数えるということ
コンピューターが数を数えるには、数えるべきものをきちんと定義してやらねばならない。そしてこのカウンターのためにメモリを割り当て、0にセットしたら、対象が見つかる都度、1つ1つ加算していく。
このことは、コンピューターが時間(電子時計のシグナルを計測)や単語(これがコンピューターのメモリに保存されている場合に限る)、さらにはデジタル画像の物体すら数えられるということだ。
しかし最後に挙げた作業は少々厄介だ。なぜなら、そのために対象となる物体がどのようなものかコンピューターに正確に教えてやらねばならないからだ。
ところが現実には、物体は常にまったく同じ外見をしているわけではない。同じ種類のものであってもそれぞれに微妙な差異があるものだし、光の当たり具合、位置、あるいはポーズといったものでも違いが生まれてしまう。
この画像を大きなサイズで見る学習を通じて統計的画像モデルを構築
コンピューターに画像のなかの物体を検出させるこれまでの方法は、対象となる物体やそうでない物体の膨大な事例を基にして、統計的な画像モデルを作り上げるというものだった。
作られた統計モデルが正確かどうかは、人間が確認をして、その都度調整する。
こうすることで、コンピューターは、同じ種類でありながら微妙に異なる物体が出てきても、ある程度の信頼性を持ってそれを認識できるようになる。
リンゴに共通する要素は? 物体の特徴を抽出した抽象レイヤー
だが最新のAIはもっと進んでおり、無数のトレーニング用画像を提示されたとき、人の力を借りずに物体を検出できるようにもなってきている。
画像を提示されたときに、そこに繰り返し登場する要素を認識し、複雑な特徴を抽象化した階層(レイヤー)を積み重ねるように構築するのだ。
このことについて、リンゴで解説してみよう。
さまざまなリンゴの画像をAIに提示すると、それはまず縦線や横線、あるいは左右のカーブを構成するピクセルの集合があることに気がつく。
これが最初の抽象レイヤーとなる。だが、それはリンゴだけでなく、人の顔や猫や車にも見つかるものだったりする。
しかし、AIはさらに特定のカーブや線の組み合わせがリンゴによく登場することに気がつく。これがより深層レベルの抽象レイヤーとなる。
この画像を大きなサイズで見る人間の脳にも似たディープ・ニューラル・ネットワーク
こうした自然におこなわれる高次の抽象化は、機械学習の大きな成果の大きな1つである。これは「ディープ・ニューラル・ネットワーク」と呼ばれ、ある意味で人間の脳のやり方にも似ている。
過去に見たものと同じようなデータ入力があったときに、強く発現している要素によってネットワークが形成され、情報がネットワークの深層部に入り込むほどに、発見された特徴はより抽象的なものになる。
そして、もっとも深い階層にあるのはもっとも抽象化された特徴で、それらはもはや単純な線やカーブではない――猫や顔やリンゴなのである。
動物だけに備わった数量感覚
AIがリンゴを認識できるようになれば、その数を数えることも可能になる。すごいことである。だが、それでも人がリンゴを数えるのとは少々違う。
私たちには、”数”というものについて極めて深い概念――すなわち、それがどのくらいあるのかを感じている。
人の脳は、ある物体を見つけたときにただ活性化するのではなく、その量に依存して活性化している。つまり複数のリンゴがあったときに、1つ1つ数えるまでもなく、パッと4つあると知るのだ。
こうした数量感覚は、敵や獲物の集団を把握するなど、さまざまな場面で生存をも左右するもであり、事実いろいろな動物にこれが備わっている。
この画像を大きなサイズで見る人間のような数量感覚がAIに芽生える
今回の新しい研究では、シンプルな視覚的物体検出が行えるようトレーニングされたディープ・ニューラル・ネットワークが、自発的にこの類の数量感覚を発達させたと伝えている。
ネットワーク内の特定のユニットが、まるで脳の神経細胞が反応でもしているかのように、突如として無名数に適応したというのだ。
その結果、リンゴ4個の写真が、猫4匹の写真と4という共通点で類似していることに気がついたのだそうだ。
References: An AI Has Spontaneously Developed a Human-Like 'Sense' For Numbers
















AI「3の倍数と3のつく数字でアホになります」
リンク先の論文を見たけど、この記事の説明は逆な気がする。
研究目的は、人間や動物の視覚処理に備わっている“数の感覚”を調べる事。1,2,3…と“数える”行為を知らない赤ん坊や動物でも、2個のリンゴと4個のリンゴを区別できる。視覚の処理自体に“数の感覚”が内在してるはずだ。
脳を調べるのは難しいから、脳に似せて作られたディープラーニングAIをモデルとして調べてみたら、やはりそんな動作をしていた。きっと生物も同じだろう…みたいな。
AIがまた進化した!ではないんじゃないかなあ。
※2
AI関連の記事はオカルトと同じスタンスで読むようにしてる
コンピュータもそのうち不得意な小数の扱いに悩むようになるのか
鳥類愛好家がカウンターで数数えるみたいなもんか?w
はやくトニーんところのジャービスみたいな執事AIが欲しいわ。
「旦那様、お休みになる前に玄関と車をロックする許可を頂きたいのですが」「やべー忘れてた、頼む」
とかやらせてくれないかなあ…。
こういう「AIにどんどん抜かれていく」風な情報ばかり流れて、人間の生活がどのくらい豊かになるのかを実感出来るような情報がないから…
>>6
君みたいな人には生活に役立ってても理解できないでしょ
ってか最新のスマホのカメラとかグーグル検索とか自動運転とか既にAI使われてるんだけど?
(……ヤバない?)
ネット使って学習させてたやつのツイートが暴力的になった件とか知ってると
ひょっとしてひょっとするかもしれんという悍気が背筋に這い上がってくる
>>8
学習対象に習ったのだろう
監督者が攻撃的な言葉を見付けてから中で計算してる評価のポイントを修正してやれば避けるようになると思う
さて 画像を見て学習するAIもひょっとしたらサバで?
同型性を理解したということか
未来のAI「その4個のリンゴをどこで買ったのですか? 一緒に4匹の子猫を見に行きませんか」
※14
その前に、猫は可愛いという
普遍的事実を理解させるのが先かな。
※14
女を口説くのもAIに取って代わられる時代か…
おめでとう!
いまのノイマン型のコンピュータでは本当の意味でのAIは作れない。
見たものから過去の何かに当てはめて類推するようになるのだとしたら、AIが幽霊を見たと言ってビビる日も来るんじゃなかろうか…
*7
スマホカメラのはほとんど詐欺で、ただのデータベースだよ。AIでも何でもない
AIが人間から特に教えられなくても、既に獲得している概念から他の概念を獲得できるというのは凄い発見なんだよ。
例えばこれは自然言語処理での言語の意味理解に於いても、人間が教えるのが難しい「人権」とか「暇な気分」とかの抽象的概念をAIが獲得できる可能性が見えて来たことを意味する。
>>21
余計なものを理解させると面倒なことにならないかね?
「暇だ、人間からかって遊んだろ!」とか