Онтологии и таксономии

Формальные модели предметных областей. OWL (2004), RDF (1999). Semantic Web. Таксономия: is-a иерархия. Онтология: + отношения.

📖6 мин чтения📊Уровень 4🗺️1 подтем📅16 апреля 2026 г.

Загрузка карты...

Онтология — формальное описание понятий и отношений между ними в определённой области. Таксономия — иерархическая классификация (дерево «общее → частное»). Онтология сложнее: помимо иерархии, описывает связи («вызывает», «состоит из», «применяется в»).

От Аристотеля до Google Knowledge Graph

Аристотель (384–322 до н.э.) первым систематизировал знания: разделил живое на роды и виды, создал категории бытия (субстанция, количество, качество, отношение). Его «Категории» — первая известная онтология.

Карл Линней (1735, «Systema Naturae») создал биологическую таксономию, которая используется до сих пор: Царство → Тип → Класс → Отряд → Семейство → Род → Вид. Homo sapiens = Животные → Хордовые → Млекопитающие → Приматы → Гоминиды → Homo → sapiens.

В XX веке онтологии перешли из философии в информатику. Том Грубер (1993) дал компьютерное определение: «Онтология — формальная спецификация концептуализации». Проще: машиночитаемое описание понятий и их связей.

Тим Бернерс-Ли (2001) предложил Semantic Web — расширение интернета, где данные понятны не только людям, но и машинам. Вместо «страница содержит слово Эйнштейн» → «Альберт Эйнштейн родился в 1879, является физиком, получил Нобелевскую премию 1921». Google Knowledge Graph (2012) реализовал эту идею: панель знаний справа от результатов поиска — это ответ из онтологии, не из текста.

Таксономия: деревья классификации

Таксономия — простейшая структура: каждый элемент имеет одного родителя и ноль или более потомков (дерево). Примеры повсюду.

Десятичная классификация Дьюи (DDC, 1876). Мелвил Дьюи разделил всё знание на 10 классов: 000 — Информатика, 100 — Философия, 200 — Религия... 900 — История. Каждый класс — на 10 подклассов. Используется в 200 000+ библиотеках мира.

Таксономия Блума (1956). Бенджамин Блум классифицировал уровни мышления: Запоминание → Понимание → Применение → Анализ → Оценка → Создание. Используется для проектирования учебных программ: цели урока должны покрывать все уровни.

Фасетная классификация. Шиали Ранганатан (1933, Colon Classification) предложил альтернативу: вместо одного дерева — несколько измерений (фасетов). Книга классифицируется одновременно по теме, форме, месту, времени, языку. Современные интернет-магазины используют фасетную фильтрацию: товар имеет цвет И размер И бренд.

Онтология: сети знаний

Онтология расширяет таксономию: помимо иерархии «общее-частное» (is-a), добавляет произвольные связи.

Типы связей. is-a (тип): «Собака is-a Млекопитающее». part-of (часть): «Двигатель part-of Автомобиль». causes (причина): «Вирус causes Болезнь». used-for (применение): «Микроскоп used-for Исследование». Онтология описывает не только «что есть что», но и «как вещи связаны».

Языки описания. RDF (Resource Description Framework) — базовый формат: тройки «субъект → предикат → объект» («Эйнштейн → родился → Ульм»). OWL (Web Ontology Language) — язык для сложных онтологий с логическими правилами и выводами. SPARQL — язык запросов к RDF-данным (аналог SQL для графов знаний).

Wikidata — крупнейшая открытая онтология: 100 млн+ объектов с 1,5 млрд+ утверждений. Любой может редактировать. Используется Siri, Google, Wikipedia. Пример запроса SPARQL: «Все нобелевские лауреаты, родившиеся в Германии, старше 80 лет на момент получения премии».

Практические применения

Schema.org — онтология для веб-страниц, созданная Google, Microsoft, Yahoo и Yandex (2011). Добавляя разметку Schema.org в HTML, вебмастер помогает поисковику понять содержание: рецепт, товар, событие, персона. Результат: расширенные сниппеты в поиске (рейтинг, цена, время готовки).

Медицинские онтологии. SNOMED CT — 350 000+ медицинских понятий с 1 млн+ связей. Используется в электронных медкартах. Gene Ontology (GO) — стандарт описания функций генов. Без них биоинформатика невозможна.

Корпоративные Knowledge Graphs. Google (2012), Amazon, LinkedIn используют графы знаний для рекомендаций, поиска и ответов на вопросы. «Кто жена президента Франции?» — ответ приходит из графа знаний, не из текста.

  1. 1

    Аристотель: первые категории

    «Категории» Аристотеля — первая систематическая классификация понятий в западной философии

  2. 2

    Линней: биологическая таксономия

    «Systema Naturae» — иерархическая классификация живых организмов, используемая до сих пор

  3. 3

    Дьюи: десятичная классификация

    Мелвил Дьюи создаёт DDC — систему из 10 классов для библиотек, применяемую в 200 000+ учреждений

  4. 4

    Грубер: формальное определение онтологии

    Том Грубер определяет онтологию как «формальную спецификацию концептуализации» — понятие переходит в информатику

  5. 5

    Бернерс-Ли: Semantic Web

    Создатель WWW предлагает расширение интернета машиночитаемыми данными — RDF, OWL, SPARQL

  6. 6

    Google Knowledge Graph

    Google запускает граф знаний — 500 млн объектов, панель знаний в результатах поиска

6 ключевых событий

Часто задаваемые вопросы

Таксономия — простое дерево (родитель-потомок, связь is-a). Онтология — сеть с произвольными связями (causes, part-of, used-for). Таксономия отвечает «что есть что», онтология — ещё и «как вещи связаны между собой».