🔧Архитектура Stable Diffusion
Latent Diffusion (Rombach 2022). VAE encoder: 512×512 → 64×64 latent (8x сжатие). U-Net denoiser в latent space. CLIP text encoder для условия. Classifier-free guidance: усиление влияния промпта. Open source, локальный запуск. Fine-tuning: LoRA, DreamBooth.
📖6 мин чтения📊Уровень 7📅19 февраля 2026 г.
🗺️ Mind Map
Загрузка карты...
❓Часто задаваемые вопросы
Архитектура Stable Diffusion — это тема о правилах, механизмах и практиках в своей области. Она помогает понять, как принимаются решения и к каким последствиям они приводят.