Онтологии и таксономии

Формальные модели предметных областей. OWL (2004), RDF (1999). Semantic Web. Таксономия: is-a иерархия. Онтология: + отношения.

📖6 мин чтения📊Уровень 4🗺️1 подтем📅19 февраля 2026 г.

🗺️ Mind Map

Загрузка карты...
Онтология — формальное описание понятий и отношений между ними в определённой области. Таксономия — иерархическая классификация (дерево «общее → частное»). Онтология сложнее: помимо иерархии, описывает связи («вызывает», «состоит из», «применяется в»).

От Аристотеля до Google Knowledge Graph

Аристотель (384–322 до н.э.) первым систематизировал знания: разделил живое на роды и виды, создал категории бытия (субстанция, количество, качество, отношение). Его «Категории» — первая известная онтология.

Карл Линней (1735, «Systema Naturae») создал биологическую таксономию, которая используется до сих пор: Царство → Тип → Класс → Отряд → Семейство → Род → Вид. Homo sapiens = Животные → Хордовые → Млекопитающие → Приматы → Гоминиды → Homo → sapiens.

В XX веке онтологии перешли из философии в информатику. Том Грубер (1993) дал компьютерное определение: «Онтология — формальная спецификация концептуализации». Проще: машиночитаемое описание понятий и их связей.

Тим Бернерс-Ли (2001) предложил Semantic Web — расширение интернета, где данные понятны не только людям, но и машинам. Вместо «страница содержит слово Эйнштейн» → «Альберт Эйнштейн родился в 1879, является физиком, получил Нобелевскую премию 1921». Google Knowledge Graph (2012) реализовал эту идею: панель знаний справа от результатов поиска — это ответ из онтологии, не из текста.

Таксономия: деревья классификации

Таксономия — простейшая структура: каждый элемент имеет одного родителя и ноль или более потомков (дерево). Примеры повсюду.

Десятичная классификация Дьюи (DDC, 1876). Мелвил Дьюи разделил всё знание на 10 классов: 000 — Информатика, 100 — Философия, 200 — Религия... 900 — История. Каждый класс — на 10 подклассов. Используется в 200 000+ библиотеках мира.

Таксономия Блума (1956). Бенджамин Блум классифицировал уровни мышления: Запоминание → Понимание → Применение → Анализ → Оценка → Создание. Используется для проектирования учебных программ: цели урока должны покрывать все уровни.

Фасетная классификация. Шиали Ранганатан (1933, Colon Classification) предложил альтернативу: вместо одного дерева — несколько измерений (фасетов). Книга классифицируется одновременно по теме, форме, месту, времени, языку. Современные интернет-магазины используют фасетную фильтрацию: товар имеет цвет И размер И бренд.

Онтология: сети знаний

Онтология расширяет таксономию: помимо иерархии «общее-частное» (is-a), добавляет произвольные связи.

Типы связей. is-a (тип): «Собака is-a Млекопитающее». part-of (часть): «Двигатель part-of Автомобиль». causes (причина): «Вирус causes Болезнь». used-for (применение): «Микроскоп used-for Исследование». Онтология описывает не только «что есть что», но и «как вещи связаны».

Языки описания. RDF (Resource Description Framework) — базовый формат: тройки «субъект → предикат → объект» («Эйнштейн → родился → Ульм»). OWL (Web Ontology Language) — язык для сложных онтологий с логическими правилами и выводами. SPARQL — язык запросов к RDF-данным (аналог SQL для графов знаний).

Wikidata — крупнейшая открытая онтология: 100 млн+ объектов с 1,5 млрд+ утверждений. Любой может редактировать. Используется Siri, Google, Wikipedia. Пример запроса SPARQL: «Все нобелевские лауреаты, родившиеся в Германии, старше 80 лет на момент получения премии».

Практические применения

Schema.org — онтология для веб-страниц, созданная Google, Microsoft, Yahoo и Yandex (2011). Добавляя разметку Schema.org в HTML, вебмастер помогает поисковику понять содержание: рецепт, товар, событие, персона. Результат: расширенные сниппеты в поиске (рейтинг, цена, время готовки).

Медицинские онтологии. SNOMED CT — 350 000+ медицинских понятий с 1 млн+ связей. Используется в электронных медкартах. Gene Ontology (GO) — стандарт описания функций генов. Без них биоинформатика невозможна.

Корпоративные Knowledge Graphs. Google (2012), Amazon, LinkedIn используют графы знаний для рекомендаций, поиска и ответов на вопросы. «Кто жена президента Франции?» — ответ приходит из графа знаний, не из текста.

Часто задаваемые вопросы

Таксономия — простое дерево (родитель-потомок, связь is-a). Онтология — сеть с произвольными связями (causes, part-of, used-for). Таксономия отвечает «что есть что», онтология — ещё и «как вещи связаны между собой».