こんにちは、かったんです。
今回は、ブログで公開した 第1回「生成AIの全体像を俯瞰する地図」 を、
もう少し深掘りしてお届けします。
📌 そもそも、なぜ「全体像」を先に知るのが大事なのか?
生成AIはテキスト、画像、音声、動画、検索など、いろいろなジャンルに分かれています。
ショートプログラム
たとえば、
ChatGPT や Gemini のような 文章系AI
Midjourney のような 画像生成AI
Whisper のような 音声認識・議事録AI
Sora や Runway のような 動画生成AI
など、一見バラバラに見えるけれど…
「最初に全体をざっくりつかむことで、あとで効率的に進められる」
というメリットがあります。
もし全体像が分からないままだと、
何を使えばいいかわからない
どこから始めればいいかわからない
どのAIが何に強いかわからない
といった状況で立ち止まってしまいがちなんです。
実際、生成AIの世界には強みや役割の違いがあります。
🧭 4つの代表的なAIを分けて考えると理解が早い
先日のブログで紹介したように、代表的な生成AIをいくつかの種類に分けると、以下のように整理できます:
ショートプログラム
✔ テキスト生成AI
(例:ChatGPT・Gemini・Claude・DeepSeek)
→ 文章作成、要約、質問応答などで使うAI。
AIメモ|時代に翻弄されないAI活用と考え方の教科書
✔ 画像生成AI
(例:Midjourney・Stable Diffusion・DALL·E)
→ イラスト・デザイン・広告用画像の生成。
AIメモ|時代に翻弄されないAI活用と考え方の教科書
✔ 音声・文字起こしAI
(例:Whisper・Notta・ElevenLabs)
→ 会議の文字起こし、ナレーションなど。
ショートプログラム
✔ 動画生成AI
(例:Sora・Runway・Pika Labs)
→ 動画編集やテキストから映像生成。
ショートプログラム
このように全体を俯瞰しておくと、
「どの場面で」「どのAIを使えばいいか」
が感覚的にわかってきます。
💡 初心者が最初にやるべきこと
私もそうでしたが、生成AIは まず使うところから始めることが一番大事です。
比較したり迷ったりする時間が長くなるほど、結局何も触れないままになるので、注意してください。
たとえば、
まずは ChatGPT で文章を作ってみる
Gemini で調べものをしてみる
DeepSeek を軽く触ってみる
というように、1つを“触る”ことで理解が深まるようになっています。
人によっては
「Gemini の会話感が好き」
という声もありますし、ChatGPT を中心に使っている人もいます。
🎯 まとめ:全体像を押さえたうえで、まず自分の1つを使ってみる
生成AIは多岐に分かれている
全体を先に知ることで、迷いが減る
でも最も大事なのは“まず触る”こと
というのが今の私の考えです。
生成AIについてこれから一緒に学んだり、触れたりしていきましょう。
第二回のブログでは、
テキストの生成AIについて解説していきます。
楽しみにしていてくださいね!


コメントを残す