
とりわけ生成AIの分野では、日本は世界で3位のOpenAIのサイトのアクセス数を誇りながら、その開発という点では他国に後塵を拝している。
一体なぜこんな状況になってしまったのか?
人工知能にくわしい人材の不足やAIの学習を行うハードウェアの不足も考えられるが、もう1つ、日本の言語や文化の独自性もあるかもしれない。
外国語で訓練されたAIシステムは日本語と文化の複雑さを理解できないと感じている研究者も多く、日本独自のChatGPTを開発する動きが高まっている。
生成AIの開発で遅れをとる日本
生成AI開発の鍵は、ChatGPTやバイドゥのERNIE Botのような、膨大なデータセットを処理して、テキストなどを生成できる「大規模言語モデル(LLM)」だ。CNBCによると、米国では、OpenAI、マイクロソフト、google、METAといったテック大手が開発を行なっている。
中国では、アリババやテンセントといったハイテク企業が、過去3年間に少なくとも79の大規模言語モデルを立ち上げたという。
一方、日本はこうした規模言語モデル開発において、規模とスピードどちらにおいても遅れているという。
超高齢社会を迎え、若い働き手が減少している日本では、生産性を維持するためにAIやロボット技術を発展させる強い動機があるはずだ。
だが現状を見る限り、少なくとも生成AIの分野ではそうなっていない。一体なぜなのか?

photo by Unsplash
人材不足とハードウェア問題
日本のLLM新興企業コトバテクノロジーズの小島熙之氏は、CNBCの取材に対して、人材不足の影響を指摘している。大規模言語モデルの開発には、インフラやアプリケーションを開発するための「強力なソフトウェアエンジニアのコミュニティが必要」と小島氏は説明する。
だがCNBCによると、日本は2030年までに78万9000人のソフトウェア・エンジニア不足に直面すると予測され、IMDの世界デジタル競争力ランキングでも63カ国中29位と低迷している。
またハードウェアの問題もある。大規模言語モデルを訓練するには、IBMのVelaやマイクロソフトのAzureのようなスーパーコンピュータが必要になる。
だが、それに匹敵するような「世界トップクラスのマシン」を所有する民間企業が日本にはないと、CNBCは指摘する。
そのため理化学研究所が管理する「富岳」のようなスパコンが、和製大規模言語モデル開発の鍵を握っていると、小島氏は説明する。

photo by iStock
英語ベースの生成AIでは日本語や日本の文化をうまく扱えない
日本にはAIを開発する強い動機があることは述べたが、それは労働人口が減少する中で生産性を上げる必要があることだけではない。もう1つの理由は、今ある主要な大規模言語モデルが英語をベースにしており、日本語や日本文化の複雑さをうまく扱えていない懸念があることだ。
「GPTのような一般的な大規模言語モデルは、英語では優れていますが、日本語では文字の違いやデータの少なさといった要因のために、しばしば機能が劣ります」と、東北大学の坂口慶祐准教授はNatureに語っている。
たとえば英語のアルファベットは26文字だが、日本語は46文字のひらがな(カタカナを入れれば倍だ)と、2136種の常用漢字がある。
しかも、ほとんどの漢字には2つ以上の読み方があり、それ以外のあまり使われない漢字が5万ほどもある。
このような複雑な日本語が紡ぎ出す文化的な機微を、主に英語で訓練されたChatGPTが適切に扱うのはかなり難しいことだろう。だからこそ、日本版のChatGPTが必要とされるのだ。

photo by iStock
日本独自の生成AIが開発されようとしている
そんな中、日本でも遅れを取り戻そうと、反撃の狼煙が上がろうとしている。たとえば6月には、経済産業省が北海道に建設予定のスパコンに68億円(総開発費の半分に当たる)の資金援助をすると報じられた。
このスパコンはさくらインターネットが手がけるもので、和製生成AIの開発をうながすため、大規模言語モデルのトレーニングに特化しているという。
さらに経済産業省は7月にも、ソフトバンクが取り組む生成AI開発向けスーパーコンピュータに53億円の補助を決定している。
同様に、NTTやサイバーエージェントといったほかの企業からも、大規模言語モデルを利用したサービスへの参入が発表されている。
スタートは遅かったかもしれない。だが日本勢は今、民間企業の取り組みによって生成AI開発の一歩を踏み出そうとしている。
いったん「強固なインフラ」さえ確立されてしまえば、あとはオープンソースのソフトウェアや蓄積されたデータを利用することで、それ以外の技術的課題は大幅にクリアしやすくなるだろうと、小島氏は語っている。
References:Why Japan is lagging behind in generative AI and creation of LLMs / Here's why Japan is gearing up to build its own ChatGPT / written by hiroching / edited by / parumo
あわせて読みたい





コメント
1. 匿名処理班
頑張って欲しいけど、言語モデルに限らず日本はソフトウェアでは、負け続けてるからなぁ
2. 匿名処理班
また日本が遅れてるー日本は終わりだーの話か…
そもそも海外にしても、米国と中国以外では目立つような生成AIを開発している国があまりないし、むしろEUなんかは生成AIを制限しようとしてるくらいなんだけどね
こういう記事を読む際はポジショントークが多分に含まれている事を考慮に入れておくべきだろう
3. 匿名処理班
スパコンが優秀なんだけどね
しかも「富岳」は民間人でも使うことが出来るんだ、申請書を書いてそれが通れば誰でも可
で次のスパコン開発も始まってて今度はAIとの融合型だとか
これが出来たら評価もかわるかも
4. 匿名処理班
昨今の日本のデジタル化問題もそうだけど、新しい「モノ」に飛びつくだけが能じゃない気がする。
便利を手に入れる為に捨てた「モノ」にも目を向けるべき
5. 匿名処理班
最近の自動翻訳の精度だけ見ても空恐ろしさを感じるわ
理論化とスムージングの蓄積、何桁差があるか
6. 匿名処理班
>>1
日本初のPC98は大きすぎていまだごたごた
しかもWinny事件で多くの開発者やる気はすっかり無くしてしまい
タブレットやスマホなどの必須アイテム、グーグルやアマゾンなどの
ネット技術もすべてアメリカに奪われた
アメリカが全部悪いとは言わんが、技術力やアイデアはあっても結局
生かしきれないのが日本。誰が悪いのだ
7. 匿名処理班
なんや? なんやなんや
8. 匿名処理班
よく成果をアピールすることが重要と言われるけども、日本の良さはそれがないものにこそある気がするよ。
9. 匿名処理班
>だがCNBCによると、日本は2030年までに78万9000人のソフトウェア・エンジニア不足に直面すると予測され、IMDの世界デジタル競争力ランキングでも63カ国中29位と低迷している。
これは日本でのソフトウェアエンジニアの待遇が悪いせいなんかな?
ソフトウェアエンジニアを増やすためにはどうしたらいいんだろう?
>>4
>便利を手に入れる為に捨てた「モノ」にも目を向けるべき
便利を手に入れる為に捨てた「モノ」って何?
具体例とか出して欲しい
10. 匿名処理班
シビュラシステム作って鎖国しよう!
11.
12. 匿名処理班
日本にはいわゆる巨大IT企業がない
ソフトウェアをN次下請けに作らせてハードウェアとサービスを売っていた大企業は恐竜のようになってしまった
一方でネット系企業は大きくなっても怪しげなところばかり
そしてベンチャーへの投資はなくなって久しい
認めたくないけど国全体が老人化してる
13. 匿名処理班
>超高齢社会を迎え、若い働き手が減少している日本では、生産性を維持するためにAIやロボット技術を発展させる強い動機があるはずだ
みんなそうなるはずだと思ってたのに、蓋を開けてみればAIが力を入れるのは多くの人がやりたがるクリエイティブ分野
人がやりたがらない単純労働や介護なんかは、ちょっとトラブルがあった時の修正が難しいから、自動化するより人力の方が安上がりと言われてる
この状況が変わらない限り、どこもそっち方面の技術開発に力は入れない気がする
14. 匿名処理班
ここで日本の記事って珍しいね
コンピューター関連は最初っから多言語だからな
OSから自国言語で行くくらいの事しないと普及難しいのかもね
15. 匿名処理班
>>12
そしてベンチャーへの投資はなくなって久しい
ベンチャーへの投資って増えてないの?!
何で?
16.
17.
18.
19.
20. 匿名処理班
真っ先に、どう規制しようかと入るからね。
政府だけじゃなく国民も率先して規制側に回る。
21. 匿名処理班
教育に金をかけないからだろ
22. 匿名処理班
>外国語で訓練されたAIシステムは日本語と文化の複雑さを理解できないと感じている研究者も多く、日本独自のChatGPTを開発する動きが高まっている。
この発想がすでに間違っている
これまで日本の独自仕様は世界で全敗している歴史を認識できていない
>英語ベースの生成AIでは日本語や日本の文化をうまく扱えない
言い訳に過ぎない
日本語にこだわるから世界の進化に取り残される
>経済産業省が北海道に建設予定のスパコンに68億円(総開発費の半分に当たる)の資金援助をすると報じられた。
何兆円もの市場がある技術開発でたった68億円で何ができる?
全世界から笑いものだ
23. 匿名処理班
>>12
>認めたくないけど国全体が老人化してる
こういう言説はもう何度も擦られている内容だし飽き飽きだ
そうだとしてもいい加減にどうするべきかを真剣に考えるべきじゃないか?
もう終わりだーで済ましたところで何の意味もないぞ
24. 匿名処理班
電気料金が高すぎなんだよ。太陽光発電とかの電気をバカみたいに高い値段で買い取ってるせいで。運営コストがかかりすぎてスパコンやサーバーを簡単に増やせない。政府の政策が常に足を引っ張ってくる
25. 匿名処理班
>>6
商売のやり方が「囲い込み」や「堅実な資金回収」の意識が強すぎるからだと思う
例えば「絵文字」は通称「ガラケー」から始まって世界的スタンダードになったけど、大手三社でほぼ互換性がなかった
そこで三社が協力して共通仕様にすればもっと広がっていったのに無意味にバトってたから、世界的な標準化作業はGoogleとAppleがやったという笑えない話がある
あと今の世の「電子マネーの乱立」も初期投資が高いと言われている交通系電子マネーのシステムが「広めてから資金を回収していく」思考回路だったならば、コロナ禍関係なく10年…どころか20年以上前には日本は電子マネーが普及していたと思うよ…
26. 匿名処理班
英字タイプライターと漢字タイプライターくらいの違いはあるだろうな。
26文字+いくつかの記号で英語文を完全に表記できる英字タイプライターのほうが、2000字そろえてようやく日本語文の "だいたいのところ" を表記できる漢字タイプライターよりも先に完成したのと同じようなもの。
英語は非常にローコンテキストな言語で機械学習にすごく馴染む。
対して日本語は異様にハイコンテキストな言語な上に、読み方と意味が状況(コンテキスト)によって変わる漢字が多く、機械学習には向かない。
英語よりは、って意味で、できないわけじゃないけどね。
英語を前提にしたシステムを日本語に応用するより、
最初から日本語向けに作ったシステムのほうが日本語に馴染むに決まってる。
頑張って欲しい。
27. 匿名処理班
日本人はモラルを重要視してるからな
思考型AIの開発は人間のモラルの低下を促進させる恐れがあるから開発も慎重にするべきだし日本くらい遅い方が問題点も把握しやすくなる
ChatGPTはそういう事をなんも考えず配慮無しに発表されたから問題が多発してるだろ
28. 匿名処理班
言いたかないが半導体技術をお隣さんに売り渡したり最新科学技術に疎いのに財政動かしてる上の人らに期待はできんかな...
日本て国内競争で発達できるほど人口も土地もないからある程度政府の資金援助は必要だと思うんだけど、三角関数って知ってる?って言いたくなるような人が政治家やってるし
外国の流行りを見て金動かすんじゃなくて、自分とこで先んじて「当時無駄にしか思えない」知識と技術培って世界を牽引する気概を持ってようやっと米欧中の競争相手になれるんだわ
もう5年で巻き返すのは無理だろうからきちんと地道に基礎研究に金と人と時間かけて10年20年先を見据えて科学も経済も立て直してほしいね
29. 匿名処理班
論理的な分野では言語は関係ない。論理的思考で鍛えられるAIの世界に言語の壁は存在しない。開発言語が日本語的でないというのならその通りで、それが一つのハードルになっているのはその通りだが、一方で独自にこだわって他国に潰されるのは何度も経験している。いつも同じ失敗した戦法で立ち向かっているので、これも当然だと思う。役人が欲望の割に稚拙で、また状況が悪くなれば戦わずに責任を民間に押し付けて逃げるが、今回もそうだろう。日本語的な情緒的な文章は作れないかもしれないが、文学の範囲はAI化が求められている多くのニーズからはみ出している。これはどこかの役人が税金を千切るために捻り出したちょっとした理屈に過ぎない。
30. 匿名処理班
日本語でも英語でもなく、ロジバンみたいな論理的な人工言語ベースにするというのはどうだろう?
ロジバンなら既存の人間の言語みたいな不規則さや矛盾も少なく、そのままでもプログラミング言語として使えるからAIとの親和性も高いのでは?
31. 匿名処理班
>>3
富岳はgpuないらしいけどどうすんでしょね、今の時代並列計算できてなんぼなのに、カタログスペックだけで、果たしてなんとかできるもんなんすかね
32. 匿名処理班
検索エンジンとかwinnyとか日本のITは著作権法が立ちふさがって伸びないと言われてた
なのでアメリカ著作権法のフェアユースよりもさらに緩い法律に改正して5年
結局何も生まれなかったので単純に日本の技術者や開発者の能力が低いだけだった
33. 匿名処理班
>>12
これゲーム業界にも言えるけど日本って会社で人材育てる環境がない企業が多いんだよね
中途採用の場合実務経験がある人しか雇わない
更に書くとフリーランスのエンジニアに安い金で外注してる企業もあるし
エンジニアになるには高い金払って専門学校か大学行くのが近道だがお金がないって人には厳しい
未経験歓迎で働きながら教育しますって会社も最近は増えてるけど正直怪しいとこかベンチャーばっかだし
でも例えばインドは国を上げて優秀な人材を育てたからIT大国になった
日本も国や大企業が人材を育てる環境作らないとこの先慢性人手不足だと思うぞ
34. 匿名処理班
まあ中抜きのことしか考えてない政治家と老人司会はい国だしな
たいていの国民が「生成AI……? ( ゚д゚)ポカーン 」やろ
35. 匿名処理班
便利な英語には勝てない
36. 匿名処理班
>>22
「世界を獲る」こと狙いの開発じゃなくて、
「外国製品は使い勝手が悪いから、日本に適合した版が欲しい」
という、国内需要向けの開発じゃないの?
アメ車のデカいピックアップトラックとか邪魔だから、
農道で小回りの利く軽トラが欲しい、的なのとか。
ジャポニカ米を調理するのに適した炊飯器が欲しい、とか。
37. 匿名処理班
???
熱流体のシミュレーターで境界条件の貼り付けにAIが随分前から使われていたけど
日本製ソフトだったし
対話型でお話しできるAIがAIの全てじゃない
38. 匿名処理班
技術者を作るとか守る気がないんだもん
あと詳しくない人が上に立つとだめ
ベンチャーで余計な人員いないとこは良さそう
開発資金は少なそうだけど
39. 匿名処理班
>>37
AI全体の話はしてないんだけど…
40. 匿名処理班
あのグダグダのオリンピックに5兆円も使っておきながら、国運を賭けると豪語するAI技術にはせいぜい百数十億円。
この先見性の無さにはもう乾いた変な笑いしかでないな。
41. 匿名処理班
日本はタチコマとかフチコマみたいなAI作らせたら頭ひとつ出れると思う
可愛くて協力的で善良で健気な子
42. 匿名処理班
まぁ今や日本はものを作るだけの後進国だからなぁ
犯罪率が低いのだけが救い
43. 匿名処理班
英語と日本語で扱えるトークン数が違いすぎるから
日本だけ不利になってしまう
44. 匿名処理班
流行に乗り遅れまいとする気概は理解できるが、独自に作らせるより既にある技術を持つ会社に依頼して日本向けの物を作ってもらった方がコストも削減できるし、日本人が海外で使用したり、海外の会社と共同で開発する場合に元の仕様が同じならデータの共有化の時間も短縮できそうだが。
45. 匿名処理班
>>31
あなたもカタログだけ読んで判断してらように見えますよ
つぎを待ちなましょう
46. 匿名処理班
>>39
政治の話や企業の姿勢の話してる方々に、一人ずつ言ってあげてください
47. 匿名処理班
ソフトバンク、サイバーA…
サイバーはさすがに…
なんか色々ともやもやする記事だね久々に
48. 匿名処理班
英語ってす〜っごく難しく感じるけど、なんというか英語と日本語では言葉の思考回路が全く違うような気がするよね
日本語を話すAIが世界中で日本語教育を行なって日本語を世界に広めてくれたら嬉しいなあ
>>40
日本の政治家や官僚は理系より体育会系の人間が多いということか?
科学よりスポーツの好きな人間の本が出世しやすいのだろうか?
49. 匿名処理班
例えば gptで論文の要約させるとしたら、日本語は2000文字に対して英語は1万2000文字扱える。
生成系AIの話をするならば、日本のイラストやマンガなどを海外勢がAIを使いパクリまくって、海外だけが得をするようなこともあり得る。
最先端を目指す必要はないが絶対に遅れてはならない。
日本の第一人者が言うには最先端には兆単位が必要だが、数百億あれば1〜2年遅れのものは作れるそうだ。
50. 匿名処理班
日本人はせこくて強欲なので仮に開発できてもハンパない利用料を取ったり、自社規格を押し通して利権を得るだけだろ?
この考え方から抜け出せない限り、日本はずっと後塵を拝し続けるだけですよ
51. 匿名処理班
>>48
大阪万博も放漫財政なのを見るに、科学よりスポーツ云々ではなく
「高度成長期のあの夢をもう一度!」
「デカいイベントさえすれば、国民が盛り上がって経済効果ある」
という、昭和脳な老人が国の舵切りしてるって事だと思う。
52. 匿名処理班
AIの学習についても世界各国は規制する方向で法整備を進めているが、日本では既にAIについて法整備を済ませ、AI学習の学習についての規制を緩め法的根拠を与えているためにOpenAIなどの企業が日本に研究部門を作っている。
高校でも情報が必修科目となり、PythonやJavaScriptを学習するため、プログラミングが一般的なスキルになっていく途上にある。
53. 匿名処理班
>>23
どうすべきかなんてそれこそ半世紀前に少子高齢化が予測されはじめた時から今に至るまでずーっと言われ続けてるよ
聞き入れたくない内容だから聞こえないふりして目をそらし続けてるだけでしょ
本当に知りたいのなら識者が何を問題視していて誰に批判的なのか、興味を持って情報に接し続けていれば自ずとわかるはず
54. 匿名処理班
報酬を与えず中抜きばかりで優秀なエンジニアなんかも海外に流出してるし
「2位じゃダメなんでしょうか」なんて発言でコンピュータの費用を削減した議員がいたろ?
そうなんだよ、2番に成り下がって競争から退いた奴は3番4番と落ちていくんだよ
その結果がこれだよ
55. 匿名処理班
>>53
目をそらすとかそういう話をしているのではなくて、じゃあそういう問題が分かったとして、今後どう対処するかというフェーズにいい加減移行しないとダメでしょって事なんだけどね
日本ガー終わりガーとしか言わない人達は、結局は対策とかの案を一切提示しないから問題なんだよ
それじゃ目を逸らし続けている人達と結局同じじゃんと思うんだけどね
56. 匿名処理班
>>13
実現してるけど、介護施設向けに開発されたちょっとしたパワードスーツなんかがあるよ
それでも結局人力なのは変わらないんだけど
ただ、この感じだと少なくとも日本では実際の現場で活躍するのは50年先とかになりそう
57.
58. 匿名処理班
日本では最新の英語のAI開発コミュニティの話題にキャッチアップでき論文を読んでいる人間が一流のAI開発者とされ、プレイヤーとしてコミュニティに参加してたり論文を発表する人間はほぼ皆無である。日本人にはせいぜいイラスト生成AIの学習モデルを変えることぐらいしかできない。
この状況はかつてオランダ語の医学書を読んでいるだけで一流の医学者だとされていた江戸時代の状況に似ている。オランダ語から日本語に翻訳し、内容を検証して日本語に解釈し直した杉田玄白が今なお江戸時代最高の医学者だとされているのである。自ら新しい実験をして成果を出す野口英世などが出てくるのはずっと先の話だ。
そもそも、非論理的な性質が強い日本語話者が論理的な英語ベースのソフトウェアの世界で成果を出すのは極めて難しい。電子立国と言われていた80年代から、一貫して日本人はソフトウェアの人材が薄い。非論理的言語である日本語話者は、論理より感性が重んじられる任天堂的なゲーム開発などの分野で生き残っていくほかないのではないかと考えている。
59. 匿名処理班
そもそも国民の個人情報は戦略資源としての価値を持つのに海外企業にフリーで開放してんじゃないよ。
日本の開発機関に限定的に許可するとかなら分かるが、これでは単に海外のAI企業へデータを差し出し
海外製のAIを利用する為に金を払う二重取りの植民地になるだけ。てかもうなってる。
60. 匿名処理班
そりゃ若者は減りに減ったけど先行者笑ってた頃から落ちぶれたよなあ…
61. 匿名処理班
ある程度の『おつかい』を頼めるロボットを作ることが超重要だと、chatgptの件で恐怖した人が増えたのでしょう。
62.
63. 匿名処理班
>>25
お財布携帯とか始めた頃は世界的にも進んでたはずなのにな
64. 匿名処理班
>>10
あれはストーリーを面白くするために(?)人間の脳を使ったシステムだけど、現実に出現するとしたらAIになりそうだね。おそらく量子コンピュータを使ったシステム。
その様なシステムの出現は必然だと思う。最初はいきなりすべてを管理するものではなく当たり障りないものから始まる。しかし便利さを求める人間側の要請で徐々にその範囲は拡大していってやがてほぼすべてを任せるようになる。なぜなら圧倒的に上手くいくのはその方だから。
65. 匿名処理班
>>31
富岳はこういうAIを作るための計算、HPL-AIでも現在世界3位(去年の春までは1位だった)。
富岳はCPU主体でも圧倒的な数を積んでるから生半可なGPUスパコンよりAI計算でも性能は高い。
66. 匿名処理班
>>36
全くその通り。
あと、上でシビュラシステムを挙げている人もいるけど、そこまでは極端にしても、いずれこういったAIは国家や大企業の中核を占めてその多くの情報を扱うようになるだろう。そうなった時できれば国産のAIで行えるように今から準備しておくべき。
そもそもそういう技術は逆立ちしてもありませんという国なら他国の”善意”に縋るしかないのも分かるけど、日本はまだやればできる子だと思うのでやるべき。少なくとも今やらないで不戦敗になる事態は論外。
67. 匿名処理班
人材不足か〜…
エンジニアって何するの?
っていうのもあるんだろうけど、仕事内容に関係ないことを重視する人が増えたからな〜
給料高い?残業無し?休みあるの?リモートできる?安定してる?
一流になってから気にしろよ。と思うけど、古い考え方なんだろうな
68. 匿名処理班
>>5 翻訳はGPTが勝手に意訳しちゃったりすっ飛ばしたりしてはっきり言って使えないぞ
使ってると酷い目にあうぞ
時に全く逆の意味に誤訳だか意訳だかしてるし
長文は特にダメだね
まあけど記事の日本語だと言語AIが機能しないは嘘だと思うw
遅れてんなぁ
せめて日本ではSiriに声優でも当てようぜw
売れそう
なんか昔から日本って作り手できないよね
学校教育無駄なことしてるもんな
虫の体の構造とかそんなの図鑑読ませとけよ見たいなのに1ヶ月とかw地図記号とか
無意味すぎてやばいw
69. 匿名処理班
>>67
そういうのが職人気質
教えてやってるんだから見習いは無賃労働などにつながります
70. 匿名処理班
面白くないからじゃない?雇用も減るし