🔧Архитектура Stable Diffusion

Latent Diffusion (Rombach 2022). VAE encoder: 512×512 → 64×64 latent (8x сжатие). U-Net denoiser в latent space. CLIP text encoder для условия. Classifier-free guidance: усиление влияния промпта. Open source, локальный запуск. Fine-tuning: LoRA, DreamBooth.

📖6 мин чтения📊Уровень 7📅19 февраля 2026 г.

🗺️ Mind Map

Загрузка карты...

Часто задаваемые вопросы

Архитектура Stable Diffusion — это тема о правилах, механизмах и практиках в своей области. Она помогает понять, как принимаются решения и к каким последствиям они приводят.