新トレンドで注目度の高いテーマのコラムを掲載中。
各シリーズ第1回はログイン不要でどなたでもご覧いただけます。
生成AIをざっくりと網羅的に理解しよう
※第2回以降(PDF)の閲覧はログインが必要になります。
昨年末のChatGPTの登場以来、生成AIがブームとなりました。それ以前にも画像生成AIが話題になっていましたが、多くの企業が「乗り遅れてはいけない」とここまで活発に動き始めたのは未曾有のことです。そのため社会現象にもなっています。しかし「生成AIって何?」と聞かれて正確に答えられる人も少ないように見受けられます。生成AIは、従来のAIと何が違うのでしょう。そもそもAIって何なのでしょうか。
AIとは、Artificial Intelligenceの略で、日本語だと「人工知能」と訳されます。ここまではご存知と思いますが、ではあなたはAIを明確に定義できるでしょうか。実を言うと、AIの決まった定義はありません。コンピューター科学者と脳科学者では定義が違うといった意味ではなく、それこそ人によって定義が違うのです。「AIとは、推論・認識・判断など人間と同様の知的な処理能力を持つ機械(システム)」という点で多くの専門家は一致していますが、中には大阪大学の浅田稔特任教授のように「知能の定義が明確でないので、人工知能を明確に定義できない」という方もいます。
一方で、「強いAI」と「弱いAI」という言葉があります。強いAIとは、人間が心を持つのと同じ意味で心を持つAIとされていて、これは人間の心をプログラム化できることを前提としています。一方弱いAIは、人間の心など持たないが有用な道具という位置づけです。汎用人工知能(AGI)という言葉もあり、これは強いAIとほぼ同義です。ChatGPT(GPT-4)がAGIの初期バーションという論文もありますが、これも一貫した意見はありません。私個人としては、ChatGPTは極めて有用ですが、心は持たないと思います。しかしChatGPTと対話をして癒やされることもあったりして、「心」とは何かを改めて問われると「難問ですね」としか言いようがありません。
では「生成AI」とは何でしょうか。わざわざ「生成」とつけるからには、従来のAIとは何か違うはずです。
少しAIの歴史を振り返ってみましょう。AIには、過去3回のブームがありました。第1次は1950年代後半~1960年代で、コンピューターによる推論や探索の研究が進展しました。しかし複雑な現実の問題は解けないことが明らかになり、1970年代には下火になりました。
第2次は、1980年代~1995年ぐらいまでで、コンピューターに知識を教え込むというアプローチが採用され、実際に「エキスパートシステム」と称する一連の製品も登場しました。しかし知識を蓄積・管理する大変さが明らかになるにつれ、これも下火になりました。
第3次は2010年頃から現在まで続く、機械学習およびディープラーニング(深層学習)によるブームです。AIが自ら知識を獲得できるようになり、急速に応用範囲が広がりました。実は、機械学習もディープラーニングのベースとなるニューラルネットワークも、アイデアは第1次ブームの頃からあったのですが、様々な技術的な制約があって実用化できなかったのです。
生成AIが登場するまでのAIは、基本的に認識・識別タスクと呼ばれることをしていました。もっと本質的に言うと「分類」をしていたのです。たとえば猫の画像認識であれば、猫とそれ以外を分類しているわけです。囲碁や将棋であれば、次の一手をクラス分け(分類)して、最善手を選択しているのです。要するに、何かを見分けることはできますが、何かを作ることはしてきませんでした。生成AIの何が画期的かと言えば、その「何かを作る」こと(これを「生成タスク」と呼びます)を実現したことにあります。
もしかしたら生成AIの台頭で第3次AIブームは終わり、AIがあたりまえの時代に入ったのかもしれません。
機械学習とは、ビッグデータと呼ばれる大量のデータをAIに学習させて何らかの結果を導くことです(最近では、ビッグデータというほど大量のデータでなくても精度の高い学習ができる方式が開発されてきました)。
機械学習にはアルゴリズムとモデルがあります。アルゴリズムは、学習と学習後のタスクをどのように行うかを示す手順のことです。一方モデルとは、データとパラメータ(初期値)をアルゴリズムに与えて、出てきた結果(ロジック)のことです。実際に推論や認識、判断などを実行するのがモデルです。
●機械学習アルゴリズムと機械学習モデルの関係
※ データ、パラメータ、アルゴリズムを試行錯誤で調整しながら、目標とする精度を満たすモデルを作成する。
アルゴリズムには大きく、教師あり学習、教師なし学習、半教師あり学習、強化学習があります。教師あり学習の例としては、線形回帰、ロジスティック回帰、ランダムフォレスト(決定木)、SVMなどがあります(説明は割愛します)。
機械学習以前のAIはルールベースと呼ばれるもので、認識や識別の条件を人間がプログラムとして記述していました。先ほどのエキスパートシステムは、巨大な条件分岐のかたまりだったのです。それに対して、機械学習では「特徴量」と呼ばれるものを定義します。分類する上で注目すべきデータをAIに与えるのです。たとえばビールの売り上げをAIに予測させたいとすれば、気温が特徴量の1つになります。なお特徴量は、モデルのパラメータの設定で定義します。
ビールの例はわかりやすいですが、適切な特徴量を見つけだすのが難しいケースがあります。そのため特徴量を自ら抽出する方式が考案されました。それがディープラーニングです。ディープラーニングではニューラルネットワーク(正確には、多層パーセプトロン)というアルゴリズムを用います。ディープ(深層)というのは、ニューラルネットワークの階層が深いということです。
ニューラルネットワークの各層では、複数の処理が並行で進み、その際にその処理を行うために役立つ情報が抽出されます。これが特徴量に相当します。
●ディープラーニング
※ ニューラルネットワークの各層では並行に処理が進む
※ 与えられた問題を解くために必要な処理に役立つ情報が特徴量として抽出される
※ 層が深まるほど特徴量が増えていく(3層以上でディープラーニングというが、実際には数百におよぶものもある)
ただしこの「特徴量抽出」はコンピューターによって自動的に行われるので、人間にはよく理解できません。したがってディープラーニングで得られたモデルは一般的にブラックボックスになり、法的な理由などで動作説明が求められるような処理には現時点ではディープラーニングが使えないことが多くなっています。「現時点」というのは、ディープラーニングの処理を説明可能にするためのソリューションがいくつか考案されてきているからです。
なお一般的には、機械学習とディープラーニングは別物のように扱われることが多いのですが、実際にはディープラーニングはニューラルネットワークというアルゴリズムを採用した機械学習の1種となります。
「従来のAIは、認識・識別タスクをしていたが、生成AIは生成タスクを実現したことが画期的だった」と述べました。生成タスクには大きく2種類あります。
LSTM(Long Short-Term Memory)という時系列データを扱うのに向いたディープラーニングのモデルがあります。これに初期値の文字列を与えると、次にどの文字が来るかを予測し続けることで長い文章を作成できます。これは①の例です。また、かなり自然な音声が合成されることでGoogleアシスタントにも採用されている音声生成モデルWaveNetも①の例です。
②の例は、画像生成の世界に早い段階で画期的な成果をもたらしたVAE(変分オートエンコーダ)とGAN(敵対的生成ネットワーク)の2つのモデルです。
VAEは入力データを平均と分散を表現するように学習します。そこからランダムにサンプリングして、新しいデータを生成するアプローチを採用しています。一方GANはジェネレーターとディスクリミネーターという2種類のニューラルネットワークで構成されます。ジェネレーターはディスクリミネーターが偽物と見抜けないような画像を生成するように学習し、ディスクリミネーターはそれを偽物と見抜くように学習していきます。この2つが戦いながら、最終的にはまったく新しい画像を作るので「敵対的」と呼ばれているのです。
生成モデルに関しては、いずれもディープラーニングが登場する以前からいくつかのモデルが考案されていましたが、ディープラーニングと組み合わせることで大きく発展しました。ディープラーニングを取り入れた生成モデルを深層生成モデルと言いますが、生成モデルのほとんどが深層生成モデルです。
ちょっと横文字が続いて混乱されたかもしれませんが、生成タスクが発展したのはディープラーニングのおかげだと理解していただければ十分です。
著者プロフィール: 森川 ミユキ(もりかわ みゆき) ITに強いビジネスライター。1987年に大手SI企業に入社し、数多くのシステム開発プロジェクトにインフラ技術者兼マネージャーとして参画する。営業企画、コンサル営業を経て、ITコンサルタントとして独立。その傍ら2007年に執筆活動を開始。2014年からライター専業となり、主に経営者やビジネスパーソン向けにAIやDX、デジタルマーケティングをテーマとした執筆を行ってきた。日本ディープラーニング協会G検定合格。
メタバースで今、何が起こっている!?
世界中で巻き起こる変化の嵐について考察する若者から高齢者まで広がる可能性。それぞれの生き方や娯楽・仕事に与える影響とは
※第2回以降(PDF)の閲覧はログインが必要になります。
最近よく聞く「メタバース」。
引き続きトレンドになっており、2022年はメタバース元年とも呼ばれています。そんなメタバースですが、どんなものか理解している人はまだまだ少ないのではないでしょうか。
メタバースとはメタ(meta=超)とユニバース(universe=宇宙)を組み合わせた造語で、いわゆるVR「Virtual Reality」の一種です。
コンピューターネットワーク上に構築された仮想空間なのでもちろん現実ではありませんが、今メタバースは少しずつリアルな世界に近づいてきています。
そんなメタバースの可能性にいち早く注目していたのが、ご存知Meta社(旧Facebook社)です。この社名変更は記憶に新しい人も多いでしょうが、世界的な企業がメタバースにコミットする決意を表明したことには、それなりの意味があるはずです。
そこで本記事を含め、世界的大企業が巨額の投資を行うメタバースとはいったい何なのか、その将来について全6回に分けて深堀りしていきます。
メタバースでは商談をはじめとしたビジネスはもちろん、買い物や恋愛などリアルな世界同様の出来事が起こっています。「人生のパートナーがメタバースでみつかるかも……」そんな時代に生きていることを実感していただけるような記事をお届けしていきます。
その記念すべき第1回目は、メタバースが生み出す雇用についてです。
メタバースがトレンドになるにつれ、注目されているのがメタバース関連の雇用です。
メタバースには、その空間を構成する要素がいくつも存在します。たとえばアバター。アバターとは仮想空間における自分の分身であり、自分好みの外見にすることができます。
アバターを作るにはクリエイターの力が必要なので、そこに雇用が生まれます。
以下は大手転職サイトで、「メタバース」で検索した際の求人数です(2022年9月16日時点)。
また、デザイナーやエンジニアなど専門職の求人以外にもメタバース関連の店舗運営や、営業職での求人もみられました。
さらに某フリーランス求人・案件サイトで「メタバース」と検索してみたところ16件の求人がみつかりました(2022年9月時点)。
主に3Dモデリングの経験や、ゲームエンジン「Unity」や「Unreal Engine」への理解があるエンジニアが求められており、実務レベルで数年の経験があればこの分野で活躍できるようです。制作自体はゲーム開発と大きな違いはないので、関連企業での経験がある人がチャレンジするケースが増えています。
近年はデバイスの進化やネットワークの高速化が進んでおり、大人数で楽しめて、アクティブユーザーが1,000万人を超えるゲームが登場するとも言われています。
海外ではメタバース人材に特化したクラウドソーシングまで登場しました。
高度な専門性を持った人材が求められており、日本のクラウドソーシングとは毛色が少し違います。日本のクラウドソーシングでも開発系の求人は多いですが、メタバース人材専門のクラウドソーシングはまだ存在しません。
ただ、海外で事例があるということは、メタバースの需要が増えるにつれて国内の雇用やサービスも多様化してくるのではないでしょうか。
さて、メタバースの作り手側の需要について触れましたが、そもそもメタバースはユーザーが活動するための空間です。今はアパレルショップなどがメタバース上に店舗を構えており、ショップスタッフの求人もあります。
メタバースで働く人々は「アバターワーカー」と称され、以下のような専門のサイトで求人が募集されています。
すでにメタバースで働いている人がいることを考えると、一般企業でも導入が進む可能性は充分にあるでしょう。
実際にメタバースでセミナーや会議を行う企業も出てきており、メタバースに出社する未来が到来するかもしれません。
そんなメタバース出社の可能性については、ExpressVPNが雇用者1,500人と労働者1,500人に対して行ったメタバースに関するアンケートが参考になります。
調査の結果によると、約63%の労働者がメタバース上で雇用主に行動を監視されることを不安視していました。
一方の雇用主側は73%が実際に「監視している」と回答しており、この不安は的中しています。
現在、筆者も「oVice(オヴィス)」というメタバースへ出社していますが、この不安を感じている人は少なからず存在します。
しかし、メタバースオフィスがあることでテレワークが許可されている側面もあるので、デメリットばかりではありません。「oVice」ではオフィスを自由に改造できたり、プロフィールアイコンを自由に変えられたりで、ゲーム感覚を味わえます。これはメタバースならではの感覚で、筆者にとっては非常に新鮮でした。
作業中は音声や映像をオフにしているので、監視の目もそれほど気になりません。ゴーグルをつけているわけではないので、ストレスもないというのが本音です。休憩中はカフェスペースなどに移動してリラックスできるので、気を張ることもありません。
またメタバースオフィスでは同じスペースに入らなければ会話が聞こえることもないので、一人で作業するときは音声をオフにするか部屋を変えればいいだけです。
ただ、企業によってはメタバースを導入しても従業員の行動を制限する可能性があるので、結局はオペレーションの問題になるでしょう。
今後このギャップを埋められるかが、メタバースが一般企業に浸透するかどうかの分水嶺となりそうです。
メタバース内での会議イメージ(oViceより)
会議室だけではなく、Barやカフェスペースなども用意されているので、コミュニティ運営にも最適。(oViceより)
雇用主と被雇用者の問題もありますが、メタバースでの仕事が一般化されるにはまだまだハードルがあります。
特に多くの人にとって最大のハードルはVRゴーグルでしょう。ディバイスが高額なうえに重量感があるので、装着感が気になるという人もいます。
INSIDERの記事では18人の大学職員を対象にしたメタバースに関する調査について触れています。
対象となった18人に1週間メタバースで仕事をしてもらうという調査でしたが、その内の2人は気分が悪くなり、数時間でリタイア。
1週間ほど仕事をした職員たちのフラストレーションのレベルも総じて上がるという結果になりました。
このことからわかるように、VRゴーグルをつけてメタバースで仕事をするには、健康面の問題もクリアする必要がありそうです。
2022年現在、Web3.0と呼ばれる「次世代の分散型インターネット」の時代が到来すると言われています。
これは大企業への一極集中を脱却し、情報を分散管理しようという考え方で、その一翼を担うのがメタバースです。
そんなメタバースもまだまだ一般化には時間がかかりそうですが、雇用に関してはメタバースのクリエイターや接客をはじめ、職種が多様化してきています。
コロナ禍によりコミュニケーションの仕方が変わったこともありますが、メタバースに関わる人々は、VRやブロックチェーンといった最先端の技術に触れられることに大きなメリットを感じているようです。
エンジニアをはじめとした専門職の人々も、自分がレガシー人材(*1)になってしまうことは本意ではないでしょう。そこで、新しい技術を学ぶうえでもメタバースの存在が気になるのではないでしょうか。
昨今ではブロックチェーン技術(*2)を使った、NFTゲーム(*3)も話題を集めています。
またオンラインゲームや、映画などでもメタバース関連のコンテンツが増えたので、その世界観も徐々に浸透しつつあります。
主にVRゴーグル着用問題や雇用主と雇用される側のメタバースへの認識のギャップなど、超えるべきハードルはまだまだありますが、これらがどのように軽減されていくのでしょうか。
他にもメタバースにはどのような可能性があるのか、全6回でお届けするので乞うご期待ください。
※記載されている会社名、システム名、製品名、サービス名は一般に各社の登録商標または商標です。
*1:古い技術や仕組みで構築されているシステムを扱ってきた人材。もしくはその領域のみに明るい人。
*2:暗号技術によって取引履歴を過去から一本の鎖のようにつなげる技術。
*3:NFT(Non-Fungible Token)「代替不可能なトークン」とブロックチェーン技術を使って開発されたゲーム。ゲーム内で取引されるNFTには所有権があり、デジタルデータとして唯一無二の価値を持つ。
著者プロフィール: 岩本 信彦(いわもと のぶひこ) IT系のメディアを中心にディレクター・ライターとして活動中。日々メタバースオフィスに出社している。