মেশিন লার্নিং

শূন্য থেকে এআই ইঞ্জিনিয়ার

শেখা শুরু করুন →

📚 সমস্ত অধ্যায় দেখুন

অধ্যায়/ফেজ 5 · Phase 5 · Specialized AI

5.5⏱ ২৫ মিনিট পড়া36 / 68

Generative AI — সৃষ্টিশীল model

Generative AI

GAN থেকে Diffusion পর্যন্ত পরিচিতি।

Hook — সৃষ্টি করতে পারা AI

ChatGPT লেখে, Midjourney আঁকে, Suno গান বানায়, Sora video তৈরি করে। Discriminative AI বলে ‘এটা কী?’, Generative AI বলে ‘নতুন কিছু বানাই’।

Discriminative vs Generative

Discriminative — P(y|x) — classification, regression।
Generative — P(x) বা P(x,y) — নতুন sample তৈরি।

Generative Model Families

Autoregressive — GPT, PixelCNN — token by token।
VAE — latent space encode/decode।
GAN — Generator vs Discriminator লড়াই।
Diffusion — noise থেকে denoise (Stable Diffusion, DALL·E 3)।
Flow-based — invertible transformation।

Modalities

Text — GPT-4, Claude, LLaMA, Gemini।
Image — Stable Diffusion, Midjourney, FLUX।
Audio — Suno, ElevenLabs, MusicGen।
Video — Sora, Runway, Veo।
3D — DreamFusion, GaussianSplatting।
Code — Codex, Claude Code, Cursor।
Multimodal — GPT-4o, Gemini।

Code — Diffusers দিয়ে Image Generation

sd_demo.py

from diffusers import StableDiffusionPipeline
import torch

pipe = StableDiffusionPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5",
    torch_dtype=torch.float16,
).to("cuda")

img = pipe("a cute baby koala drinking coffee, studio lighting",
           num_inference_steps=30, guidance_scale=7.5).images[0]
img.save("koala.png")

LLM দিয়ে Text Generation

llm_gen.py

from transformers import pipeline
gen = pipeline("text-generation", model="meta-llama/Llama-3.2-1B")
out = gen("Machine learning এর ভবিষ্যৎ", max_new_tokens=80)
print(out[0]["generated_text"])

Applications

Content creation — blog, ad, design।
Code generation, debugging।
Synthetic data generation।
Drug discovery, protein design (AlphaFold)।
Personalized learning, tutoring।

Ethics & Challenges

দায়িত্ব

Deepfake, misinformation, copyright, bias, hallucination — Generative AI এর shadow side। Responsible use জরুরি।

Phase 6 তে কী আসছে?

GAN ও Diffusion এর গভীরে।
LLM fundamentals ও fine-tuning।
Prompt Engineering।
RAG System।

Summary

এক নজরে

Generative AI = নতুন কিছু সৃষ্টি। GAN, VAE, Diffusion, Autoregressive — প্রতিটি family এর নিজস্ব শক্তি। আজকের AI বিপ্লবের কেন্দ্র।

← আগের অধ্যায়

5.4Reinforcement Learning

পরের অধ্যায় →

6.1GAN — দুই network এর লড়াই