見出し画像

ChatGPTをはじめとする生成AIの可能性と限界——「新時代の教養」を最も平易に解説!

ジャーナリスト・西田宗千佳さんによる新書『生成AIの核心』が刊行になりました。
ChatGPTに代表される「生成AI」は、急速に浸透しましたが、内容の間違いへの対応や著作権保護等、多数の課題があります。さらには、一層の開発をめぐる企業間、国同士の覇権争いまで、多くの論点も。
生成AIをどう活かすべきなのか、AIの歴史や動作の理由も知り、その本質をあぶりだす一書です。
今回は刊行を記念し、本書の一部を特別公開します。


はじめに

 テクノロジーの発達は、幾度も世界を変えてきた。ただしその多くは、事前に予想されたような形で生まれたわけでも、世の中に浸透していったわけでもない。
 1940年代には「コンピュータは世界に5台あればいい」という言説があったという。コンピュータとは巨大かつ維持にコストがかかるもので、政府や大企業にしかニーズはないから極端には増えない……という発想だ。
 「爪先で押せない。物理的なボタンがないと、電話としては使いづらい」「マイクが口の近くまで来ないと通話しづらい」
 2007年にiPhoneが発表された時、そんな風に否定し、「スマートフォンは普及しない」という人々がいた。
 言うまでもなく、どちらも間違っている。コンピュータはパーソナルコンピュータという形で世界に数限りなく拡散し、スマートフォンは誰もが使うものになった。物理的なテンキーのある電話の方がもはや少数派だ。
 それまでの生活に存在していなかった要素が出てくると、多くの人は保守的に考える。実際、大半のものは生まれては消えていくものなので、それでもいいのだろう。だが時に、想像を遥かに超える形で普及し、生活に定着し、進化を続けるものもある。コンピュータとその進化系であるスマートフォンは、その最たるものであり、今日、あらゆる産業で使用されている。
 一方、同じテクノロジーでもSFの中では常に描かれつつも、いまだ実現していないものも少なくない。二足歩行で人間をサポートしてくれるロボットはその代表である。描かれたSF作品をリストアップするまでもなかろう。そして、「人間と同等か、凌駕する能力を備えた汎用人工知能」もまた、いまだSFの中の存在と言える。
 パーソナルコンピュータやスマートフォンの普及を正確に予測したSFはほとんどない。一部を言い当てたものはあっても、現在の我々の生活を言い当てることはできなかった。一方で、ヒューマノイドロボットの活躍はSFの中で多数描かれ、現実が追いついていない。これらの存在は「人間」をベースに考察して描いていくことが可能なので、より想像力を刺激しやすいのだろう。
 だが、現在我々の目の前では、フィクションの中にしか存在しなかったものの一つであった「人間にかなり近い能力を備えた人工知能」が実現に近づきつつある。その特性は、SFで描かれた汎用人工知能と同じではない。しかし、使った人の多くが「人工知能」すなわちAIという言葉で感じるイメージに近い文章や画像を生成していて、我々の生活を助けてくれる存在になっていくことを予感させる。
 本書の中でも述べるが、AIの進化は突然起こったものではない。だが、変化の可視化は急激に起きた。何十年にもわたる試行錯誤とコンピュータの性能向上がうまく噛み合い始め、2022年に入ると「文章から絵を描く」AIが注目され、そして、人間並みの文章を生成する「ChatGPT」が生まれた。
 精緻な絵を描き、人間に近い精度で文章を作る「生成(ジェネレーティブ)AI」は、人間の想像を超える速度で進化してきたコンピュータの能力を最大限に活かすことではじめて実現された。いよいよ「人間が夢見てきたもの」が生まれる瞬間を見ているかに思える。
 想像しにくい事象と想像しやすい事象。この二つが絡み合っていることが、昨今の「生成AIブーム」を巡る一つの特徴である。
 生成AIであるChatGPTは、文章で命令を与えれば使えること、生成されたものの簡明さなどを備えている一方で、回答に間違いが混在する理由は、技術的な部分を理解しなければならないため見えにくい。
 生成AIは現状「人間のように思考するAI」ではない。しかし、人間より素早く、大量の文書や画像を生成し、我々の生活や働き方に否応なく影響を与えてくる。今後、生活や働き方をどう変化させていくのか?
 生成AIはなぜ生まれたのか? 人間とどう違うのか? 生成AIがどのように生活や働き方を変え、結果的にどんな産業を生み出し、国家バランスまでも変えるのか?
 多様な観点を考察するために、今起きていることを整理するところから始めてみよう。

なぜ社会を変えるインパクトを持つのか

ChatGPTという「社会現象」

 2022年11月30日、アメリカで一つのサービスが試験公開された。
 そのサービスの名前は「ChatGPT」。サービスを提供したのはOpenAIとい
う会社だ。今でこそ多くの人が注目する企業だが、当時はAIやITの先端領域ビジネスを追いかけている人くらいしか知らない会社だっただろう。だが、ChatGPTとOpenAIはその後急速に知名度を上げていく。サービス開始から2か月後の2023年1月には、利用者が1億人を超える。これはその後メタがSNSサービス「Threads」で利用者数の記録を更新するまで、過去のどのサービスよりも早いペースだった。
 なぜChatGPTが注目されたのか? 今となっては皆さんもよくおわかりかもしれない。文章を入力すると、その内容や命令に合わせて、クオリティの高い文章で回答を返してくれるからだ。そして、その回答にさらに質問し、対話を続けていくことができる。
 単に質問に答えるだけではなかった。箇条書きの内容から長い文章を完成させたり、命令からコンピュータ・プログラムを作ったりと、「人間が行えるようなこと」をこなしてくれるように見えた。
 その姿は、多くのSF映画などで見た「人工知能」にも近い。
 ここから、ChatGPTを中心とした「生成(ジェネレーティブ)AI」のブームは一気に加速する。新聞やネットのビジネス関連ニュースでは、毎日のように生成AIという言葉が並び、ChatGPTはその代名詞となっていく。
 このような状況を生み出したChatGPTについて、単にブームと呼ぶのはもはや矮小化し過ぎだろう。「社会現象」という表現の方がふさわしい。

生成AIは文章の前に「絵」でブレイクした

 ただし、生成AIという言葉自体は、ChatGPTが登場する1年以上前から話題としては広がり始めていた。
 そこでも発火点となったのはOpenAIである。2021年1月、OpenAIは「DALL-E」というサービスを発表した。これは、文章による命令で画像を生成するサービスだ。「草原の木のそばに立つ女性」といった文章を与えると、その内容に合わせた絵が生成される、というものだった。上手に絵を描くスキルを持っていない人も、命令文だけでクオリティの高い絵ができ上がるわけで、このことは大きな衝撃をもたらした。だが、DALL-Eだけでは、描ける絵の幅が狭かったことなどもあり、話題性は長続きし
なかっただろう。
 だが、2022年7月に「Midjourney」が公開されると、話題は一気に加熱
する。より多彩でリアルな絵を、簡単な命令で描くことができたからだ。
 さらに、同年8月、「Stable Diffusion」がオープンソース形式(誰でも
自由に改良・再配布できる無償のソースコード)で公開されると、話題はさらに拡散していく。DALL-EやMidjourneyは開発情報を公開しておらず、絵を描くために必要なAIの学習の内容も過程も非公開だった。だが、Stable Diffusionはオープンソースとして、ソフトの部分も学習データも公開されていた。すなわち、そこから中身を改良・改変し、独自の「絵を描くAI」が開発可能になったのだ。
 MidjourneyやStable Diffusionの登場・拡散により、「絵を描く生成AI」の存在は一気に広まった。絵を描くスキルを持っていない人でも上手に絵
を描けるだけでなく、生成AI自体が「画風」に近いものを学習していくことで、特定の画家・イラストレーターの作品に近いテイストを持つ画像が生成可能になったからだ。
 しかも、人間が手で描くよりも素早く、大量に作れる。いわゆる絵画・イラストだけでなく、写真のような画像も同様だ。
 このことは、人間と創造物の関わり方を問い直させる、大きなきっかけとなる。その影響については、また後ほど詳しく述べることとしよう。
 ここで重要なのは、いわゆるChatGPTをはじめとした生成AIも、その前段階に「画像を生成するAI」があったからこそ、さらに大きなインパクトを持ちえた、ということだ。
 昔から、AIを中心としたソフトウエアが人間の仕事や作業を代替してくれる、という考え方はあった。しかし、多くの人の目から見ると、「AIといっても人間ほどのことはしてくれない」というイメージが強かったのではないだろうか? 
 AIの技術的実像を正確に知る人は少ないだろうが、「AIが人間の仕事を奪う」「人間が苦労してやってきたことをAIが奪う」というのは、やはりまだまだ現実的でない、未来に起こるかもしれない出来事だと思い込んでいた部分がある。
 しかし、画像からより幅広い用途へと、生成AIが広範囲に活用可能であることが見えてくると、「AIが人間並の作業を行う」ことがもはや絵空事ではないことが、誰の目にも明らかになってきた。サービスを使ってみればその可能性は明白だった。
 この変化にどう対応すればいいのか?
 個人から企業、政治まで巻き込んだ議論が、一気に立ち上がることになった。


続きは『生成AIの核心 「新しい知」といかに向き合うか』でお楽しみください。

西田 宗千佳(にしだ・むねちか)
1971年福井県生まれ。ジャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。朝日新聞、読売新聞、日本経済新聞、文春オンライン、Business Insider Japan、ASCII.jpなどに寄稿する他、書籍も執筆。著書に『メタバース×ビジネス革命』(SBクリエイティブ)、『ネットフリックスの時代』(講談社現代新書)、『クラウド・コンピューティング』(朝日新書)など。

※「本がひらく」公式Twitterでは更新情報などを随時発信しています。ぜひこちらもチェックしてみてください!