ITライター上倉賢のAll About

IT系ライターによる日常

ジェネレーティブAI時代に必要になるのは質問力

ジェネレーティブAI(Generative AI: GA 生成AI)による、人間が答えるようなチャットボットが2022年から話題になっています。
ここ数年のAIは単純に人をアシストする物が多く、たとえば画像の中から不要な物を消すような単純に人の手助けをする物が多かったです。

ジェネレーティブAIでは、人間がつくるようなコンテンツを自動的に作成します。人が作るような文章、人が書くような映像を一瞬で作成してくれます。従来のAIより一段階進んだように見えますが、このような進化するAIに人間はどう対応すべきでしょうか。

そもそもAIとは何か

AIはArtificial Intelligentの略で日本語だと人工知能になります。
現在、開発が進んでいるのはAIの中の機械学習(Machine Learning)の中の、ディープラーニング(Deep Learning: 深層学習)という方法です。

ディープラーニングでは、学習(Learning)と、推論(Inference)があります。手書き文字認識のAIなら、多数の手書き文字を学習し、その学習内容から推論して答えを出します。

文章の場合ならLLM(Large Language Models)という、大量の文章から学習した内容から推論して、それっぽい文章を作成します。

事前に大量のデータから学習する必要があり、その結果から推論しますが、時間もコンピューティングリソースも大量に使うのが学習で、推論は学習に比べればそれほどリソースは使用しません。

近年、学習に比べて推論は精度を落としても良いとか、様々な事がわかりかけていて、ハードウェアの開発から、アルゴリズムなど、AI関連の研究は多くの分野で研究が行われています。

おそらく、チャットボットで驚いていた人達が驚くような次の何かが、数年以内に実現するでしょう。

ジェネレーティブAIと倫理問題

ジェネレーティブAIは人間が行うような事をAIが行えるので、問題のある内容を出力してしまう可能性があります。
そのため、各社倫理上の問題をどう解決するかというのが課題の一つでした。

youtu.be

例えば、このビデオのようにインテルにはAI ethics lead architect(AI倫理リードアーキテクト)がいて、倫理上の問題などを専門に扱っている担当者がいます。

Googleは2018年のGoogle I/Oで、人間のように会話するAIのDuplexを公開しましたが、倫理上の問題点が浮上しました。

www.youtube.com

このビデオの36分くらいから始まるデモではAIはほぼ人間と同等の会話をしています。
しかし、直後から批判を受けて改良することになりました。

MIT Tech Review: グーグルのAI電話予約システム、「不気味」との批判受け改良

その後、このシステムは様々な言語で実際に使われています。コンピュータを普段あまり使わない個人店主向けなど、GoogleビジネスプロフィールでのAIによるお店の情報確認電話など、2020年頃から実際に使用が始まったようです。

その後、画像を作成するAIのStable Diffusionなどが登場しましたが、ここでも著作権問題など様々な問題がありました。2022年に登場したOpenAIのChatGPTで、それが加速することになります。

一般の人にとって、このようなおおむね正しい内容を人が回答してくれるシステムは驚きだったようで、一般メディア含め世界中で大きな話題になりました。実際には何年も前から似たようなシステムはあり、関係者は様々な思いでOpenAIの動きをみていました。
しかし、一般社会でも話題になったことで、各社がこの流れに出遅れないようにと、内部で行われていた開発が一斉に表に出てきたのが2023年です。

内容で人を超えることは無いジェネレーティブAI

大量の花の画像から花の正しい品種を当てるようなAIなら、正確性と速度で人間が太刀打ちする事は不可能です。すべてが太刀打ちできないかというと、そんなことは無く、例えば、ジェネレーティブAIの場合は、速度以外でAIが人間に勝つことはありません。

AIに数学を教えてもらったところ

AIに疑問を尋ねても、人の説明の誰よりもわかりやすく教えてくれるわけではありません。どこかの情報からまとめた情報が得られるだけで、答えた内容自体は取り立ててわかりやすくなっているわけではありません。

また、画像も既存の画像を改良したような物ばかりで、オリジナリティがあるわけでもありません。

しかしながら、速度自体は人を圧倒しており、コンピュータ自体が人の助けになっている用に、ジェネレーティブAIはうまく使えば人の想像力の助けになるのは確実でしょう。

People watching flare stacks coming out of a chemical plant at nightという内容でAdobe Firefly(Beta)で生成した画像

現時点ではクオリティも問題があり、Adobe FireflyやBeta版とはいえ、化学プラントのフレアスタックとはほど遠い画像が普通に生成されたり、人がおかしな画像になったりしています。

それのおかしな画像も、生成する画像自体、生成用の文章次第です。いかに、そのジェネレーティブAIのクセをつかんだ文章を入力できるかが、良い結果を出すポイントとなります。

Aerial view of a small uninhabited coastal island with palm trees in a Pacific atollという内容でAdobe Firefly(Beta)で生成した画像

太平洋の無人島の画像が欲しい場合に現時点で「uninhabited island in the Pacific Ocean」などで入力すると、小山の島みたいなのが出てきたりしますが、結構長い文章を入れると、個人的な望みの画像に近くなりました。(それでも不自然ですが)

ジェネレーティブAI時代に必要なスキルは質問力

a man who don't know what to Search for in front of a computerという内容でAdobe Fireflyで生成した画像

今まで何か調べる際には、検索キーワードが重要でした。基本はキーワードで、いくつかのキーワードを入力するだけなので、検索自体はそこまで難しい物ではありません。その結果から取捨選択する能力や、基本的な読解力があれば情報を調べて自分なりに理解する事は可能でした。

今までは検索能力自体よりも、通常の読解力、理解能力が必要でした。

ジェネレーティブAIでは何か生成させる際に重要になるのが、生成用に最適な文章を入力する事です。

現時点でのジェネレーティブAIは、単純な単語をいくつか入れるだけの検索とは違い、文章で入力します。少し変えただけで、全く異なる結果になります。Stable Diffusionでも様々な解決法が考案されていますが、これも良い結果を出すことが簡単ではない事を表しています。

ジェネレーティブAIは、人だとかなり時間がかかる物を瞬時に出せるため、使いこなせばかなり便利になります。そのためには、AIに自分が望む内容を表現するための質問力が重要になっていくでしょう。

この生成用の文章入力ではCUIと同様にプロンプトから文字を入力するため、AIへの適切な命令方法については、プロンプトエンジニアリングとも総称されています。

もちろん、AI使用時には著作権の問題がどうなっているのか、倫理上問題の無いかなどを判断する能力も必要です。

従来の読解力等に加えて、質問する能力も重要ということは、AIを使えば単純に人間が楽できるわけでもないということです。能力がある人ほど、コンピュータやAIを使いこなせるようになるのは、従来から変わらない流れです。

今後のクライアント向けNPU

スマートフォンで先行して搭載されているNPU(Neural network Processing Unit)は、AI関連の半導体です。コンピュータの基本的な機能のCPU、映像関連機能のGPUに加え、AI関連機能はNPU(AIアクセラレータ、Neural Engineなど他の呼び方もある)となります。
このNPUは2023年から順次PCにも搭載され、各種ソフトでAI関連機能が活用されていくようです。

NPUを何に使うかは最終的なアプリケーション毎によって異なります。
画像生成、質問の回答の元になる学習では、大量の演算が必要になります。NPUが搭載されていても、学習はクラウド、その学習結果から答えを出す推論はクライアントで行うというのが一般的でした。

音声認識、画像から不要な部分を除去するような用途ではクライアントのNPUでも可能でした。画像作成などのジェネレーティブAIになると、従来のクライアント向けNPUでは性能が足らないため、推論もクラウドが中心にになりそうです。

NVIDIA、大規模言語モデルとジェネレーティブ AI のワークロードに向けた推論プラットフォームを発表

実際にNVIDIAはGTC 2023で推論向けプラットフォーム提供を発表しました。クラウド側はこのようなプラットフォームを導入し、ユーザーのリクエストに応え、様々な分野で使われていくようになるでしょう。

ジェネレーティブAIの活用は、まだまだ始まったばかりで、これからさらに進んでいきます。
大規模な計算が必要な画像生成はクラウド。もっと単純な簡単な機能、例えば喋ったり文字入力してアシストするような機能は、クライアント側のNPUを使うようなハイブリッドな形になるでしょう。

今後、様々なアプリケーションでAI関連の様々な機能が追加、今まで無かった用途も新しく登場していくでしょう。

開発者としては新たなアルゴリズムの開発、AI関連ハードウェアの活用、新しいサービスの考案など出来る事は無数にあります。
ユーザーとしては、今後登場する様々なAIを使いこなすため、自分のスキルをどう向上するかが重要です。現時点で質問力の向上はその解決方法の一つとなります。