魔王
AI時代をサバイブするのだ
エンジニア

AI入門

AI技術

未来予測

AI副業

最新AI

AIゲーム

生成AI入門

生成AIとは?既存のAIとの違いは?生成AIの応用事例を紹介

魔王
2024年06月04日公開
2024年06月27日更新

生成AIとは、一言で言うと

新しい文章や画像、動画、音楽などを
生み出すことができる技術

のことです。

この記事では生成AIについて
まるっと全体像をお話していきます。

例えば、

等です。

では早速いきまっしょい!

この記事を書いた魔族
魔王
魔王(の中の人)
エンジニア社長。過去4社を経営。デザイナーや講師を経験し、23歳で起業、多業種のコンサルティングやSEO事業など色々やる。28歳で一度経営を離れ、東証一部上場企業でのエンジニアリーダーや、スタートアップでのCTO等の経験を活かして再度起業。友人と立ち上げた事業を7000万円でM&Aした後、現在はいくつかの事業を経営しながらAI時代を生き抜くための情報を発信中。
自己紹介を見る
興味ないっす

生成AIとは

まず、先ほども書いた通り、
生成AIとは、

新しい文章や画像、動画、音楽などを
生み出すことができる技術

のことです。

従来のAIと生成AIの違い

今までもAIという存在はありましたが、
従来のAIとの差は何でしょうか?

従来のAI 生成AI
データ解析ができる データ解析もできる
予測ができる 予測もできる
限られた指示のみ理解 自然な言葉で指示OK
限られたデータ生成 表現豊かなデータ生成

つまり、

従来のAIができていたことは
生成AIにもほぼ可能

ということ。

生成AIにしかできないことは、

この2つです。

生成AIにできること

生成AIは様々なデータを生成できます。

それぞれ詳しく見ていきましょう。

テキスト生成

まず、生成AIはテキストが生成できます。

生成AIが生成できるテキストの種類
  1. 短編小説
  2. 長編小説
  3. ブログ記事
  4. ニュース記事
  5. レポート
  6. エッセイ
  7. スクリプト(映画、演劇)
  8. 歌詞
  9. ダイアログ
  10. 技術文書
  11. マニュアル
  12. レビュー(製品、映画、本)
  13. レシピ
  14. ジャーナル記事
  15. 手紙
  16. メール
  17. スピーチ
  18. プレゼン資料の内容
  19. ウェブサイトのコンテンツ
  20. ソーシャルメディア投稿
  21. 広告コピー
  22. プレスリリース
  23. 要約
  24. 会話ログ
  25. FAQ
  26. 教材
  27. クイズ
  28. 質問応答
  29. プログラムコード(HTML、CSS、JavaScript、Pythonなど)

単に文章生成するだけでなく、

特定のスタイルやトーンに合わせた
文章を作成可能です。

ただし、注意点もあります。

テキスト生成時の注意点
  • 人の気持ちを動かすような文章は苦手
  • 情報が正確じゃない
  • まれに著作権的にグレーな生成をする
  • 記憶力があまりない
  • 大規模なプログラミングはできない

画像生成

さらに、生成AIは画像を生成できます。

生成AIが生成できる画像の種類
  1. 風景写真
  2. ポートレート
  3. キャラクターデザイン
  4. アニメーションフレーム
  5. デジタルペイント
  6. イラスト
  7. ロゴ
  8. アイコン
  9. カートゥーン
  10. マンガページ
  11. サイバーパンク風景
  12. 幻想的な風景
  13. ファッションデザイン
  14. プロダクトデザイン
  15. 建築デザイン
  16. インテリアデザイン
  17. ストーリーボード
  18. ゲームアート
  19. 科学イラスト
  20. メディカルイラスト
  21. 天体写真
  22. 昆虫のマクロ写真
  23. 野生動物写真
  24. 食べ物写真
  25. 宇宙風景
  26. 抽象アート
  27. 水彩画風
  28. 油絵風
  29. モダンアート
  30. レトロポスター

画像生成にも注意点があります。

画像生成時の注意点
  • 細部が作画崩壊してる
  • テキスト入り画像は苦手
  • 著作権的にグレー

描かれている人や物をよく見ると
いろいろ不自然な部分があったりします。

また、テキスト入り画像もこんな感じで、
よく見ると存在しない文字が描かれています。

著作権に関しては、Adobe Fireflyのような
著作権問題をクリアした製品もあります。

動画生成

生成AIは映像・動画も作れます。

数年前に比べると高品質になりましたが、
得意な動画苦手な動画があります。

得意な動画 苦手な動画
顔だけ別人にする 映画制作
ショート動画 長編アニメ
動画素材を作る 商品紹介動画

数秒の動画であればかなりリアルですが、
長編作品を作るにはまだまだ力不足です。

音声生成

生成AIは、音楽効果音も生成できます。

例えばこんな音楽が
ほぼ全自動で作れるんです。

他にも様々な音声を生成できます。

生成AIが生成できる音声の種類
  1. ナレーション
  2. オーディオブック
  3. ポッドキャスト
  4. 歌唱音声
  5. インストゥルメンタル音楽
  6. 効果音
  7. 自然音(雨音、風音など)
  8. 動物の鳴き声
  9. 鳥のさえずり
  10. 電話の音声メッセージ
  11. コマーシャル用音声
  12. 映画のダイアログ
  13. ラジオ番組
  14. アニメのキャラクターボイス
  15. ゲームのキャラクターボイス
  16. 語学学習用音声
  17. ガイド音声(観光案内など)
  18. 鉄道や飛行機のアナウンス
  19. プレゼンテーション音声
  20. ウェブサイトの音声案内
  21. ビデオ会議の音声
  22. AIアシスタントの音声
  23. スポーツ実況
  24. 音楽トラック
  25. メディテーション用音声
  26. ドキュメンタリーのナレーション
  27. 広告のジングル
  28. アラーム音
  29. カスタマーサポート音声
  30. インタビュー音声

近いうちにほとんどの音楽や効果音が
AI生成物に置き換えられると言われています。

声も人間の話し声に近づいてきており、
AIが喋っていると気付けないほどです。

代表的な生成AI

代表的な生成AIの中でも
特に注目されているのが、以下5つです。

一つずつご紹介していきましょう。

ChatGPT

まず、ChatGPT最も利用者が多く
生成AIのパイオニア的存在です。

OpenAIという米国企業が開発しています。

文章生成画像解析動画生成など、
非常に多くのタスクをこなせます。

性能も高く、ChatGPTの使いやすさ
他社を頭一つ抜きん出ています

Gemini

Geminiは、Googleが開発した生成AIです。

機能的にはChatGPTよりも劣るのですが、
性能的に超える点もあり注目を集めています。

特にGoogle Cloudを使う企業にとっては、
非常に簡単に導入できるのがメリットです。

Stable Diffusion

Stable Diffusionは、
画像生成に特化したAIです。

生成画像が高品質で、オープンソース
なので、多くの利用者がいます。

また、カスタマイズの自由度が高く、
ユーザーが様々な拡張機能を公開しています。

Midjourney

Midjourneyも画像生成に特化したAIですが、
他社と違って無料では使えません

ただ、分野によっては
高いクオリティの画像を生成できたり、
操作が簡単なので、根強い人気があります。

商用利用が可能で、
様々なジャンルの画像を生成できます。

Suno AI

Suno AIは、音楽を生成できるAIです。

入力した歌詞やイメージに基づいて、
架空のアーティストが歌う楽曲を生成したり、
楽器演奏のみの楽曲も生成可能です。

例えばこんな楽曲が作れます。

音楽制作の経験がない人でも
簡単にオリジナル楽曲を作成できます。

ポップ、ロック、ジャズなど
多様なジャンルに対応しています。

生成AIを活用したサービス

生成AIを活用した有名なサービスとして、
以下のようなものがあります。

それぞれ概要を以下にまとめました。

Microsoft Copilot

Microsoft Copilotは、
ExcelWordなどのOffice製品と連携したり、
Windowsと連携することができます。

ドキュメントプレゼン資料等を
生成AIで効率的に作成できるのが魅力です。

Gemini for Google Workspace

一方、Gemini for Google Workspaceは、
Google製品と生成AIを連携できます。

GmailGoogle Docsスプレッドシート等、
様々なサービスで生成AIを使えます。

Notion AI

Notion AIは、Notionに搭載されたAIです。

文章を自動生成したり、表に自動入力したり、
タスクの優先順位を自動付与したりできます。

Adobe Firefly

Adobe Fireflyは、
クリエイティブ制作に特化したAIです。

といったことが可能です。

生成AIが苦手なこと

生成AIにも不得意なことはあります。

例えば、

生成AIが不得意なこと
  • 最新情報の提供
  • 100%正確な情報提供
  • 不適切かどうかの判断
  • 記憶すること

等です。

それぞれ対策法も合わせて解説します。

最新情報の提供

リアルタイムに変化する情報や
直近数ヶ月以内の新しいニュースに関しては、
生成AIが知らないケースが多々あります。

ただ、最新情報に対応した生成AI
徐々に増えてきています。

そのため、それぞれの生成AIを使う際に
そのAIが最新情報に対応しているか
事前に確認することをオススメします。

100%正確な情報提供

生成AIは、常に正確な情報
提供できるわけではありません。

しばしばハルシネーションを起こします。

ハルシネーションとは?

生成AIは事実と異なる内容無関係の内容を生成する現象があります。
まるでAIが幻覚=ハルシネーション)を見ているように感じることから、この現象は「ハルシネーション」と呼ばれてます。

そのため、生成AIの出力内容に対しては
必ず人間による確認をしなければならない
というのがデメリットの一つです。

不適切かどうかの判断

判断力は人間に比べるとまだまだ劣ります。

判断できる 判断が微妙
差別用語 差別的表現
暴言 いじめ
性的表現 生理的嫌悪
明らかな違法性 あいまいな違法性

例えば、「ニガー」や「チョン」といった
差別用語を判別することはAIにもできます。

しかし、画像生成AIに
白人労働者」と「黒人労働者」で
それぞれ生成を指示すると...

このように、白人はホワイトカラーの仕事
黒人はブルーカラーの仕事、といったような
差別的表現をしてしまうことがあります。

差別的表現の改善

一時は前述のような生成AIによる差別が問題になりましたが、現在の有名な画像生成AIはどれも差別的表現をしないような仕様に改善されてきているようです。

記憶すること

生成AIは、ユーザーからの指示会話内容
ずっと記憶しておくことが苦手です。

「え?それ前にも言ったよね?」
「最初に書いた指示忘れた?」

といったことが往々にして起こります。

対策としては、メモリ機能があります。

メモリ機能

AIが重要と判断した物事や、「覚えて」と指示した事柄を記憶しておいてくれる機能のことで、主にChatGPTが搭載しています。

今後は生成AIも更に進化して、
何も言わなくても勝手に全ての会話
覚えてくれるようになるでしょう。

生成AIの課題やリスク

生成AIには無視できないほど
大きな課題リスクがあります。

等です。

著作権的にグレーなものもある

生成AIが生成するコンテンツは、
著作権的にグレーな部分があります。

下記はChatGPT
ピクサー風の王女」と指示して
生成してもらった画像です。

具体的な作品名などを含めた指示をすると
生成を拒否されてしまうことがありますが、
工夫すれば上記のような画像を生成できます。

AIは生成物の独自性を判断するのは難しく、
著作権侵害のリスクをゼロにできない
というのが厄介な部分です。

情報漏洩やセキュリティリスク

生成AIは、入力内容を学習してしまう
という場合があります。

つまり、自社の機密情報顧客データ等が
AI企業に保持されたり、情報漏洩してしまう
リスクがあるということです。

それぞれのAIの
公式サイトに対策方法が記載されてますので、
必ずチェックしてから使いましょう。

犯罪への悪用

生成AIは、悪用されるリスクもあります。

生成AIの悪用例
  • フェイクニュースの作成
  • 個別最適化された詐欺メールの生成
  • 偽レビューの大量生成

AIに対する法整備には時間がかかります。

そのため、各個人がリテラシーを高め、
自分の身は自分で守る
という心構えが必要になってきます。

失業率への影響

生成AIが普及することによって、
雇用に悪影響を与える可能性があります。

AIの得意分野は特に効率化されるでしょう。

雇用が減る可能性が高い仕事
  • データ入力
  • 顧客対応
  • スライド制作
  • Webサイトデザイン
  • イラスト制作
  • アニメーション制作
  • 動画素材制作
  • 写真撮影

これらはAIによって自動化または効率化され、
仕事や雇用が減るリスクがあります。

生成AIの基礎知識

生成AIは複雑な仕組みで構築されていて、
それをすべて理解するのは困難です。

ですので、ここでは細部までは解説せず、
基本的な知識のみお話します。

ChatGPTとGPT-4の違い

まず、ChatGPTは、
OpenAIが開発した生成AIサービスです。

一方で、GPT-3.5GPT-4というのは
生成AIのモデルのバージョンを指しています。

ChatGPT GPT-4
生成AIサービス 生成AIモデル
消費者が使う 開発者が使う

これらGPT-3.5GPT-4といったモデルが
ChatGPTの内部で動いています。

そして、

モデルのバージョンが上がるたびに、
生成されるテキストの質理解力が向上し、
ChatGPTがより使いやすくなっていきます。

モデルのバーションと種類

生成AIには下記のような様々な企業
リリースしているモデルがあります。

代表的な生成AI企業とモデル
  • GPT(OpenAI)
  • Gemini(Google)
  • Claude(Anthropic)
  • Llama(Meta)

それぞれのモデルにはバージョンがあり、
バージョンが1、2、3と上がっていく毎に
基本的には高性能になっていきます。

パラメータ数と性能

高性能とは具体的に
どんな性能が高いのでしょうか。

大きく分けて3つの性能があります。

生成AIの3つの性能
  • 賢さ
  • 知識量
  • スピード

これらの性能は基本的に
パラメータ数」と呼ばれる数値が影響し、
パラメータ数が多いほど高性能になります。

各モデルのパラメータ数の例
  • Llama 3 70B → 700億パラメータ
  • Llama 3 8B → 80億パラメータ
  • Rakuten AI 7B → 70億パラメータ

このパラメータ数が多いモデルのことを
LLM(大規模言語モデル)」と呼びます。

生成AIの利用方法

生成AIの導入方法は多岐にわたります。

我々エンジニアが生成AIを
プロダクトに導入するための手段
いくつかご紹介します。

ブラウザやアプリで使う

生成AIは、ブラウザアプリを通じて
簡単に利用することができます。

プロダクトに導入するというよりは、
開発上の質問相談をしたり、
コードを生成したりして、
開発に役立てる使い方が適切です。

もしくは、プロンプトエンジニアリング
のために使うという使い道もあります。

プロンプトエンジニアリングとは?

プロンプトとは、生成AIへの指示のことです。プロンプトエンジニアリングとは、プロンプトを使って生成AIに的確な指示を出し、最大限の力を発揮させる技術のことを指します。

APIやSDKでも簡単に利用可能

生成AIは、APISDKを通じて
自分のアプリケーション
生成AIの機能を追加できます。

下記のように各社APIを公開しています。

生成AIを使うためのAPI
  • OpenAI API(GPT等)
  • Google Vertex AI API(Gemini等)
  • Anthropic API(Claude等)

もちろん、各言語のSDKもあります。

SDKにAPIキー認証情報を入れて、
コードを数行書くだけで簡単に導入できます。

AWSやGCP上でも使える

生成AIは、AWSGCPAzureといった
主要なクラウドサービス上でも利用可能です。

それぞれサービス名は以下の通りです。

各クラウドの生成AIサービス
  • Amazon Bedrock
  • Google Vertex AI
  • Azure AI

これらを使えばすぐに生成AIを利用できます。

既に上記クラウドを使っているプロダクトなら
シームレスに導入できるのも魅力です。

AIと人類の未来予測

生成AIの進化は、我々の生活や
仕事の方法を大きく変える可能性があります。

生成AIが変える未来
  • 時代の変化が加速していく
  • 企業の統廃合が進む
  • 転職やリスキリングが常識になる
  • AIスキル次第で収入格差が広がる

以下、詳しく解説します。

時代の変化が加速していく

生成AIの普及により、
時代の変化はますます加速していきます。

なぜなら、生成AIは
様々な発見や発明を助長するからです。

今までも世界は数々の発見や発明によって、
大きく変化してきました。

その変化が数年おき数ヶ月おき
起こるとしたら・・・?

ものすごい速さで時代が加速していく
イメージが湧きますよね。

企業の統廃合が進む

このスピード感についてこれない企業は
非常に危険です。

経営者管理職の判断が遅かったり、
現場の対応が遅かったりすると、
あっという間に置いていかれます。

置いていかれるということは、
客が離れていき、売上を出せなくなる
ということです。

わずか数年間でこの格差
どんどん開いていきます。

その結果、勝ち組負け組が分かれ、
企業の統廃合が進むと思われます。

転職やリスキリングが常識になる

では我々個人としては
どう考えるべきでしょうか?

流れの早いカオスな時代を生き残るためには、
どこかの会社にしがみついたり
今のスキルを過信するのは危険です。

つまり、他社への転職や、
職種自体を変えたりすることが、
当たり前になっていきます。

AIスキル次第で収入格差が広がる

AIは人間の仕事をどんどん奪っていますが、
これはつまり、

AIを使って、1人の人間が
10人分、20人分の人間の仕事を担える

とも解釈できます。

そうなると、その人には
10人分、20人分の人件費、つまり

年収5000万円〜1億円の価値がある

と言っても過言ではありません。

であれば、AIを使いこなしている人と、
全然AIを使おうとしない人の間で
収入に大きな格差が生じるのは必然です。

AIによる副業革命

いま、副業に革命が起きています。

生成AIのおかげで、大きく時短できたり、
自分には不可能だったことが可能になったり。

1個人がより多くの副業に取り組めることで、
成功確率が飛躍的に上がりました。

副業で稼げなかった理由

今までほとんどの人が副業で
稼げなかった大きな理由は3つあります。

副業で失敗する原因TOP3
  1. 時間がない
  2. 途中で挫折する
  3. スキルがない

今、これらは生成AIが解消してくれます。

生成AIによってあらゆる作業が効率化され、
時短できるようになったおかげで
少ない時間でも副業が可能になった為です。

さらに、少ない時間で早く作業が進められる
ということは、挫折する確率も抑えられます。

スキルがないという問題に関しても、
生成AI自体が様々なスキルを持っているので、
それを活かせるかどうかのほうが
非常に重要になってきています。

副業で稼げる最後のチャンス

つまり、時間もスキルもないというのが
過去の副業の失敗原因でしたが、
それらを全てクリアするのが生成AIなんです。

しかも、無料なので誰でも使えます。

貴族でも富豪でもない一般人にとって、
これほどのチャンスがあったでしょうか?

決して大げさではなく、今は間違いなく
人類史上最大のチャンスが訪れています。

この事実に気づいて行動している人
まだまだ少ないので、
どんどん行動していきましょう!

まとめ

2023年から一気に広まった生成AIには、
幅広い応用範囲高い性能があります。

苦手分野リスクもありますが、
今後時代の変化は急激にスピードを増し
企業も大きな変化を余儀なくされます。

そして、我々個人としても、
転職が当たり前になるだけでなく、
史上最大の副業チャンスがあります。

このサイトでは、生成AIをもっと知りたい!
という方のために、
生成AIについてたくさんのコンテンツ
を書きました。

是非、他のページも見てみてください!

それではまた!