📜Constitutional AI

Anthropic (2022). Принципы (конституция) направляют модель. RLAIF: RL from AI Feedback вместо человеческого. Модель критикует и исправляет свои ответы по принципам. Меньше human labeling, масштабируется. Принципы: безопасность, честность, helpfulness.

📖6 мин чтения📊Уровень 8🗺️2 подтем📅19 февраля 2026 г.

🗺️ Mind Map

Загрузка карты...

Часто задаваемые вопросы

Constitutional AI — это тема о правилах, механизмах и практиках в своей области. Она помогает понять, как принимаются решения и к каким последствиям они приводят.