そこから3回ぐらい変身して今のStable Diffusionとかがある
画像認識もそんな感じで3回ぐらい変身した結果、今やどこでも使えるようになった
自然言語はAIより簡単に見えるけれど入出力の情報量が圧倒的に少ないから画像より断然難しい
画像は256x256でも65536あるわけでRGB三色なら三倍の情報量がある
昔はそれを処理するのが大変だったがGPUで並列処理することで一気に進展した
それに対して自然言語は「お前の好きなラーメンは何?」っていう少ない情報量から演算しないといけないので大変に難しい
GPT-3でかなり進展したがそれでもまだまだでChatGPTもまだまだ始まったばかり
後2回は変身するだろう、という楽観的な予測があるし、2回変身したぐらいでようやくビジネス的な価値が出てくると思う
それまではまぁ投資だと思って頑張って欲しい