生成AIとは?既存のAIとの違いは?生成AIの応用事例を紹介
2024年06月27日更新
生成AIとは、一言で言うと
新しい文章や画像、動画、音楽などを
生み出すことができる技術
のことです。
この記事では生成AIについて
まるっと全体像をお話していきます。
例えば、
- 生成AIの基礎知識
- 生成AIにできること、苦手なこと
- 代表的な生成AI
- 生成AIの課題やリスク
- 生成AIの利用方法
- AIと人類の未来予測
- AIによる副業革命
等です。
では早速いきまっしょい!
生成AIとは
まず、先ほども書いた通り、
生成AIとは、
新しい文章や画像、動画、音楽などを
生み出すことができる技術
のことです。
従来のAIと生成AIの違い
今までもAIという存在はありましたが、
従来のAIとの差は何でしょうか?
従来のAI | 生成AI |
---|---|
データ解析ができる | データ解析もできる |
予測ができる | 予測もできる |
限られた指示のみ理解 | 自然な言葉で指示OK |
限られたデータ生成 | 表現豊かなデータ生成 |
つまり、
従来のAIができていたことは
生成AIにもほぼ可能
ということ。
生成AIにしかできないことは、
- 自由度の高い会話や指示
- 高品質かつ様々なデータ生成
この2つです。
生成AIにできること
生成AIは様々なデータを生成できます。
- テキスト
- 画像
- 動画
- 音声
それぞれ詳しく見ていきましょう。
テキスト生成
まず、生成AIはテキストが生成できます。
- 詩
- 短編小説
- 長編小説
- ブログ記事
- ニュース記事
- レポート
- エッセイ
- スクリプト(映画、演劇)
- 歌詞
- ダイアログ
- 技術文書
- マニュアル
- レビュー(製品、映画、本)
- レシピ
- ジャーナル記事
- 手紙
- メール
- スピーチ
- プレゼン資料の内容
- ウェブサイトのコンテンツ
- ソーシャルメディア投稿
- 広告コピー
- プレスリリース
- 要約
- 会話ログ
- FAQ
- 教材
- クイズ
- 質問応答
- プログラムコード(HTML、CSS、JavaScript、Pythonなど)
単に文章生成するだけでなく、
特定のスタイルやトーンに合わせた
文章を作成可能です。
ただし、注意点もあります。
- 人の気持ちを動かすような文章は苦手
- 情報が正確じゃない
- まれに著作権的にグレーな生成をする
- 記憶力があまりない
- 大規模なプログラミングはできない
画像生成
さらに、生成AIは画像を生成できます。
- 風景写真
- ポートレート
- キャラクターデザイン
- アニメーションフレーム
- デジタルペイント
- イラスト
- ロゴ
- アイコン
- カートゥーン
- マンガページ
- サイバーパンク風景
- 幻想的な風景
- ファッションデザイン
- プロダクトデザイン
- 建築デザイン
- インテリアデザイン
- ストーリーボード
- ゲームアート
- 科学イラスト
- メディカルイラスト
- 天体写真
- 昆虫のマクロ写真
- 野生動物写真
- 食べ物写真
- 宇宙風景
- 抽象アート
- 水彩画風
- 油絵風
- モダンアート
- レトロポスター
画像生成にも注意点があります。
- 細部が作画崩壊してる
- テキスト入り画像は苦手
- 著作権的にグレー
描かれている人や物をよく見ると
いろいろ不自然な部分があったりします。
また、テキスト入り画像もこんな感じで、
よく見ると存在しない文字が描かれています。
著作権に関しては、Adobe Fireflyのような
著作権問題をクリアした製品もあります。
動画生成
生成AIは映像・動画も作れます。
数年前に比べると高品質になりましたが、
得意な動画と苦手な動画があります。
得意な動画 | 苦手な動画 |
---|---|
顔だけ別人にする | 映画制作 |
ショート動画 | 長編アニメ |
動画素材を作る | 商品紹介動画 |
数秒の動画であればかなりリアルですが、
長編作品を作るにはまだまだ力不足です。
音声生成
生成AIは、声や音楽、効果音も生成できます。
例えばこんな音楽が
ほぼ全自動で作れるんです。
他にも様々な音声を生成できます。
- ナレーション
- オーディオブック
- ポッドキャスト
- 歌唱音声
- インストゥルメンタル音楽
- 効果音
- 自然音(雨音、風音など)
- 動物の鳴き声
- 鳥のさえずり
- 電話の音声メッセージ
- コマーシャル用音声
- 映画のダイアログ
- ラジオ番組
- アニメのキャラクターボイス
- ゲームのキャラクターボイス
- 語学学習用音声
- ガイド音声(観光案内など)
- 鉄道や飛行機のアナウンス
- プレゼンテーション音声
- ウェブサイトの音声案内
- ビデオ会議の音声
- AIアシスタントの音声
- スポーツ実況
- 音楽トラック
- メディテーション用音声
- ドキュメンタリーのナレーション
- 広告のジングル
- アラーム音
- カスタマーサポート音声
- インタビュー音声
近いうちにほとんどの音楽や効果音が
AI生成物に置き換えられると言われています。
声も人間の話し声に近づいてきており、
AIが喋っていると気付けないほどです。
代表的な生成AI
代表的な生成AIの中でも
特に注目されているのが、以下5つです。
- ChatGPT
- Gemini
- Stable Diffusion
- Midjourney
- Suno AI
一つずつご紹介していきましょう。
ChatGPT
まず、ChatGPTは最も利用者が多く
生成AIのパイオニア的存在です。
OpenAIという米国企業が開発しています。
文章生成や画像解析、動画生成など、
非常に多くのタスクをこなせます。
性能も高く、ChatGPTの使いやすさは
他社を頭一つ抜きん出ています。
Gemini
Geminiは、Googleが開発した生成AIです。
機能的にはChatGPTよりも劣るのですが、
性能的に超える点もあり注目を集めています。
特にGoogle Cloudを使う企業にとっては、
非常に簡単に導入できるのがメリットです。
Stable Diffusion
Stable Diffusionは、
画像生成に特化したAIです。
生成画像が高品質で、オープンソース
なので、多くの利用者がいます。
また、カスタマイズの自由度が高く、
ユーザーが様々な拡張機能を公開しています。
Midjourney
Midjourneyも画像生成に特化したAIですが、
他社と違って無料では使えません。
ただ、分野によっては
高いクオリティの画像を生成できたり、
操作が簡単なので、根強い人気があります。
商用利用が可能で、
様々なジャンルの画像を生成できます。
Suno AI
Suno AIは、音楽を生成できるAIです。
入力した歌詞やイメージに基づいて、
架空のアーティストが歌う楽曲を生成したり、
楽器演奏のみの楽曲も生成可能です。
例えばこんな楽曲が作れます。
音楽制作の経験がない人でも
簡単にオリジナル楽曲を作成できます。
ポップ、ロック、ジャズなど
多様なジャンルに対応しています。
生成AIを活用したサービス
生成AIを活用した有名なサービスとして、
以下のようなものがあります。
- Microsoft Copilot
- Gemini for Google Workspace
- Notion AI
- Adobe Firefly
それぞれ概要を以下にまとめました。
Microsoft Copilot
Microsoft Copilotは、
ExcelやWordなどのOffice製品と連携したり、
Windowsと連携することができます。
ドキュメントや表、プレゼン資料等を
生成AIで効率的に作成できるのが魅力です。
Gemini for Google Workspace
一方、Gemini for Google Workspaceは、
Google製品と生成AIを連携できます。
GmailやGoogle Docs、スプレッドシート等、
様々なサービスで生成AIを使えます。
Notion AI
Notion AIは、Notionに搭載されたAIです。
文章を自動生成したり、表に自動入力したり、
タスクの優先順位を自動付与したりできます。
Adobe Firefly
Adobe Fireflyは、
クリエイティブ制作に特化したAIです。
- 写真から物や人を削除
- 写真やイラストを自動生成
- 写真の背景を差し替え
といったことが可能です。
生成AIが苦手なこと
生成AIにも不得意なことはあります。
例えば、
- 最新情報の提供
- 100%正確な情報提供
- 不適切かどうかの判断
- 記憶すること
等です。
それぞれ対策法も合わせて解説します。
最新情報の提供
リアルタイムに変化する情報や
直近数ヶ月以内の新しいニュースに関しては、
生成AIが知らないケースが多々あります。
ただ、最新情報に対応した生成AIも
徐々に増えてきています。
そのため、それぞれの生成AIを使う際に
そのAIが最新情報に対応しているか
事前に確認することをオススメします。
100%正確な情報提供
生成AIは、常に正確な情報を
提供できるわけではありません。
しばしばハルシネーションを起こします。
生成AIは事実と異なる内容や無関係の内容を生成する現象があります。
まるでAIが幻覚(=ハルシネーション)を見ているように感じることから、この現象は「ハルシネーション」と呼ばれてます。
そのため、生成AIの出力内容に対しては
必ず人間による確認をしなければならない
というのがデメリットの一つです。
不適切かどうかの判断
判断力は人間に比べるとまだまだ劣ります。
判断できる | 判断が微妙 |
---|---|
差別用語 | 差別的表現 |
暴言 | いじめ |
性的表現 | 生理的嫌悪 |
明らかな違法性 | あいまいな違法性 |
例えば、「ニガー」や「チョン」といった
差別用語を判別することはAIにもできます。
しかし、画像生成AIに
「白人労働者」と「黒人労働者」で
それぞれ生成を指示すると...
このように、白人はホワイトカラーの仕事、
黒人はブルーカラーの仕事、といったような
差別的表現をしてしまうことがあります。
一時は前述のような生成AIによる差別が問題になりましたが、現在の有名な画像生成AIはどれも差別的表現をしないような仕様に改善されてきているようです。
記憶すること
生成AIは、ユーザーからの指示や会話内容を
ずっと記憶しておくことが苦手です。
「え?それ前にも言ったよね?」
「最初に書いた指示忘れた?」
といったことが往々にして起こります。
対策としては、メモリ機能があります。
AIが重要と判断した物事や、「覚えて」と指示した事柄を記憶しておいてくれる機能のことで、主にChatGPTが搭載しています。
今後は生成AIも更に進化して、
何も言わなくても勝手に全ての会話を
覚えてくれるようになるでしょう。
生成AIの課題やリスク
生成AIには無視できないほど
大きな課題やリスクがあります。
- 著作権的にグレーなものもある
- 情報漏洩やセキュリティリスク
- 犯罪への悪用
- 失業率への影響
等です。
著作権的にグレーなものもある
生成AIが生成するコンテンツは、
著作権的にグレーな部分があります。
下記はChatGPTに
「ピクサー風の王女」と指示して
生成してもらった画像です。
具体的な作品名などを含めた指示をすると
生成を拒否されてしまうことがありますが、
工夫すれば上記のような画像を生成できます。
AIは生成物の独自性を判断するのは難しく、
著作権侵害のリスクをゼロにできない
というのが厄介な部分です。
情報漏洩やセキュリティリスク
生成AIは、入力内容を学習してしまう
という場合があります。
つまり、自社の機密情報や顧客データ等が
AI企業に保持されたり、情報漏洩してしまう
リスクがあるということです。
それぞれのAIの
公式サイトに対策方法が記載されてますので、
必ずチェックしてから使いましょう。
犯罪への悪用
生成AIは、悪用されるリスクもあります。
- フェイクニュースの作成
- 個別最適化された詐欺メールの生成
- 偽レビューの大量生成
AIに対する法整備には時間がかかります。
そのため、各個人がリテラシーを高め、
自分の身は自分で守る
という心構えが必要になってきます。
失業率への影響
生成AIが普及することによって、
雇用に悪影響を与える可能性があります。
AIの得意分野は特に効率化されるでしょう。
- データ入力
- 顧客対応
- スライド制作
- Webサイトデザイン
- イラスト制作
- アニメーション制作
- 動画素材制作
- 写真撮影
これらはAIによって自動化または効率化され、
仕事や雇用が減るリスクがあります。
生成AIの基礎知識
生成AIは複雑な仕組みで構築されていて、
それをすべて理解するのは困難です。
ですので、ここでは細部までは解説せず、
基本的な知識のみお話します。
ChatGPTとGPT-4の違い
まず、ChatGPTは、
OpenAIが開発した生成AIサービスです。
一方で、GPT-3.5やGPT-4というのは
生成AIのモデルのバージョンを指しています。
ChatGPT | GPT-4 |
---|---|
生成AIサービス | 生成AIモデル |
消費者が使う | 開発者が使う |
これらGPT-3.5やGPT-4といったモデルが
ChatGPTの内部で動いています。
そして、
モデルのバージョンが上がるたびに、
生成されるテキストの質や理解力が向上し、
ChatGPTがより使いやすくなっていきます。
モデルのバーションと種類
生成AIには下記のような様々な企業が
リリースしているモデルがあります。
- GPT(OpenAI)
- Gemini(Google)
- Claude(Anthropic)
- Llama(Meta)
それぞれのモデルにはバージョンがあり、
バージョンが1、2、3と上がっていく毎に
基本的には高性能になっていきます。
パラメータ数と性能
高性能とは具体的に
どんな性能が高いのでしょうか。
大きく分けて3つの性能があります。
- 賢さ
- 知識量
- スピード
これらの性能は基本的に
「パラメータ数」と呼ばれる数値が影響し、
パラメータ数が多いほど高性能になります。
- Llama 3 70B → 700億パラメータ
- Llama 3 8B → 80億パラメータ
- Rakuten AI 7B → 70億パラメータ
このパラメータ数が多いモデルのことを
「LLM(大規模言語モデル)」と呼びます。
生成AIの利用方法
生成AIの導入方法は多岐にわたります。
我々エンジニアが生成AIを
プロダクトに導入するための手段を
いくつかご紹介します。
ブラウザやアプリで使う
生成AIは、ブラウザやアプリを通じて
簡単に利用することができます。
プロダクトに導入するというよりは、
開発上の質問や相談をしたり、
コードを生成したりして、
開発に役立てる使い方が適切です。
もしくは、プロンプトエンジニアリング
のために使うという使い道もあります。
プロンプトとは、生成AIへの指示のことです。プロンプトエンジニアリングとは、プロンプトを使って生成AIに的確な指示を出し、最大限の力を発揮させる技術のことを指します。
APIやSDKでも簡単に利用可能
生成AIは、APIやSDKを通じて
自分のアプリケーションに
生成AIの機能を追加できます。
下記のように各社APIを公開しています。
- OpenAI API(GPT等)
- Google Vertex AI API(Gemini等)
- Anthropic API(Claude等)
もちろん、各言語のSDKもあります。
SDKにAPIキーや認証情報を入れて、
コードを数行書くだけで簡単に導入できます。
AWSやGCP上でも使える
生成AIは、AWS、GCP、Azureといった
主要なクラウドサービス上でも利用可能です。
それぞれサービス名は以下の通りです。
- Amazon Bedrock
- Google Vertex AI
- Azure AI
これらを使えばすぐに生成AIを利用できます。
既に上記クラウドを使っているプロダクトなら
シームレスに導入できるのも魅力です。
AIと人類の未来予測
生成AIの進化は、我々の生活や
仕事の方法を大きく変える可能性があります。
- 時代の変化が加速していく
- 企業の統廃合が進む
- 転職やリスキリングが常識になる
- AIスキル次第で収入格差が広がる
以下、詳しく解説します。
時代の変化が加速していく
生成AIの普及により、
時代の変化はますます加速していきます。
なぜなら、生成AIは
様々な発見や発明を助長するからです。
今までも世界は数々の発見や発明によって、
大きく変化してきました。
その変化が数年おき、数ヶ月おきに
起こるとしたら・・・?
ものすごい速さで時代が加速していく
イメージが湧きますよね。
企業の統廃合が進む
このスピード感についてこれない企業は
非常に危険です。
経営者や管理職の判断が遅かったり、
現場の対応が遅かったりすると、
あっという間に置いていかれます。
置いていかれるということは、
客が離れていき、売上を出せなくなる
ということです。
わずか数年間でこの格差は
どんどん開いていきます。
その結果、勝ち組と負け組が分かれ、
企業の統廃合が進むと思われます。
転職やリスキリングが常識になる
では我々個人としては
どう考えるべきでしょうか?
流れの早いカオスな時代を生き残るためには、
どこかの会社にしがみついたり、
今のスキルを過信するのは危険です。
つまり、他社への転職や、
職種自体を変えたりすることが、
当たり前になっていきます。
AIスキル次第で収入格差が広がる
AIは人間の仕事をどんどん奪っていますが、
これはつまり、
AIを使って、1人の人間が
10人分、20人分の人間の仕事を担える
とも解釈できます。
そうなると、その人には
10人分、20人分の人件費、つまり
年収5000万円〜1億円の価値がある
と言っても過言ではありません。
であれば、AIを使いこなしている人と、
全然AIを使おうとしない人の間で
収入に大きな格差が生じるのは必然です。
AIによる副業革命
いま、副業に革命が起きています。
生成AIのおかげで、大きく時短できたり、
自分には不可能だったことが可能になったり。
1個人がより多くの副業に取り組めることで、
成功確率が飛躍的に上がりました。
副業で稼げなかった理由
今までほとんどの人が副業で
稼げなかった大きな理由は3つあります。
- 時間がない
- 途中で挫折する
- スキルがない
今、これらは生成AIが解消してくれます。
生成AIによってあらゆる作業が効率化され、
時短できるようになったおかげで
少ない時間でも副業が可能になった為です。
さらに、少ない時間で早く作業が進められる
ということは、挫折する確率も抑えられます。
スキルがないという問題に関しても、
生成AI自体が様々なスキルを持っているので、
それを活かせるかどうかのほうが
非常に重要になってきています。
副業で稼げる最後のチャンス
つまり、時間もスキルもないというのが
過去の副業の失敗原因でしたが、
それらを全てクリアするのが生成AIなんです。
しかも、無料なので誰でも使えます。
貴族でも富豪でもない一般人にとって、
これほどのチャンスがあったでしょうか?
決して大げさではなく、今は間違いなく
人類史上最大のチャンスが訪れています。
この事実に気づいて行動している人は
まだまだ少ないので、
どんどん行動していきましょう!
まとめ
2023年から一気に広まった生成AIには、
幅広い応用範囲と高い性能があります。
苦手分野やリスクもありますが、
今後時代の変化は急激にスピードを増し、
企業も大きな変化を余儀なくされます。
そして、我々個人としても、
転職が当たり前になるだけでなく、
史上最大の副業チャンスがあります。
このサイトでは、生成AIをもっと知りたい!
という方のために、
生成AIについてたくさんのコンテンツ
を書きました。
是非、他のページも見てみてください!
それではまた!