Реляционная алгебраРеляционная алгебра — замкнутая система операций над отношениями в реляционной модели данных. Операции реляционной алгебры также называют реляционными операциями. Первоначальный набор из 8 операций был предложен Э. Коддом в 1970-е годы и включал как операции, которые до сих пор используются (проекция, соединение и т. д.), так и операции, которые не вошли в употребление (например, деление отношений). В процессе развития реляционной теории и практики было предложено несколько новых реляционных операций, например полусоединение (SEMI-JOIN) и полуразность, или анти-полусоединение (ANTI-SEMI-JOIN)[1][2], CROSS APPLY и OUTER APPLY, транзитивное замыкание (TCLOSE) и др. Поскольку многие операции выразимы друг через друга, в составе реляционной алгебры можно выделить несколько вариантов базиса (набора операций, через который выразимы все остальные). Наиболее известный и строго определённый базис (алгебра А) предложен Кристофером Дейтом и Хью Дарвеном[3]. Реляционная алгебра и реляционное исчисление эквивалентны по своей выразительной силе[4]. Существуют правила преобразования запросов между ними. Основное применение реляционной алгебры — предоставить теоретическую основу для реляционных баз данных, особенно языков запросов для таких баз данных, главным из которых является SQL. Замкнутость реляционной алгебрыРеляционная алгебра представляет собой набор таких операций над отношениями, что результат каждой из операций также является отношением. Это свойство алгебры называется замкнутостью. Операции над одним отношением называются унарными, над двумя отношениями — бинарными, над тремя — тернарными (таковые практически неизвестны). Пример унарной операции — проекция, пример бинарной операции — объединение. N-арную реляционную операцию f можно представить функцией, возвращающей отношение и имеющей n отношений в качестве аргументов: Поскольку реляционная алгебра является замкнутой, в качестве операндов в реляционные операции можно подставлять другие выражения реляционной алгебры (подходящие по типу): В реляционных выражениях можно использовать вложенные выражения сколь угодно сложной структуры. Ограничения на операцииНекоторые реляционные операции, в частности, операции объединения, пересечения и вычитания, требуют, чтобы отношения имели совпадающие (одинаковые) заголовки (схемы). Это означает, что совпадают количество атрибутов, названия атрибутов и тип (домен) одноимённых атрибутов. Некоторые отношения формально не являются совместимыми из-за различия в названиях атрибутов, но становятся таковыми после применения операции переименования атрибутов. Операция декартова произведения требует, чтобы отношения-операнды не обладали одноимёнными атрибутами. Отношения называются совместимыми по взятию расширенного декартова произведения, если пересечение множеств имён атрибутов, взятых из их схем отношений, пусто. Операции реляционной алгебрыДалее перечислены некоторые операции реляционной алгебры, которые представляют либо исторический, либо практический интерес. Все операции перечислить невозможно, поскольку любая операция, удовлетворяющая определению реляционной, является частью реляционной алгебры. ПереименованиеРезультатом применения операции переименования атрибутов является отношение с изменёнными именами атрибутов.
где
Объединение![]() Отношение с тем же заголовком, что и у совместимых по типу отношений A и B, и телом, состоящим из кортежей, принадлежащих или A, или B, или обоим отношениям.
Пересечение![]() Отношение с тем же заголовком, что и у отношений A и B, и телом, состоящим из кортежей, принадлежащих одновременно обоим отношениям A и B.
Вычитание![]() Отношение с тем же заголовком, что и у совместимых по типу отношений A и B, и телом, состоящим из кортежей, принадлежащих отношению A и не принадлежащих отношению B.
Операция присваиванияОперация присваивания (:=) позволяет сохранить результат вычисления реляционного выражения в существующем отношении. Отношение, заголовок (A1, A2, …, An, B1, B2, …, Bm) которого является сцеплением заголовков отношений A(A1, A2, …, An) и B(B1, B2, …, Bm), а тело состоит из кортежей, являющихся всеми вариантами сцеплений кортежей отношений A и B: (a1, a2, …, an, b1, b2, …,bm), таких, что
Синтаксис:
Выборка (ограничение)Отношение с тем же заголовком, что и у отношения A, и телом, состоящим из кортежей, значения атрибутов которых при подстановке в условие c дают значение ИСТИНА. c представляет собой логическое выражение, в которое могут входить атрибуты отношения A и/или скалярные выражения.
Выборка записывается как или где:
ПроекцияПроекция — унарная операция, которая позволяет получить «вертикальное» подмножество данного отношения, или таблицы, то есть такое подмножество, которое получается выбором специфицированных атрибутов с последующим исключением, если это необходимо, избыточных дубликатов кортежей. Пусть дана таблица с именами атрибутов , то есть и некоторое подмножество множества имён атрибутов . Результатом проекции таблицы по выбранным именам атрибутов называется новая таблица , полученная из исходной таблицы вычёркиванием атрибутов, не входящих в выбранное множество, с последующим возможным удалением избыточных дубликатов кортежей. При осуществлении проекции необходимо задать проецируемое отношение и некий набор его атрибутов, который станет заголовком результирующего. При выполнении проекции выделяется «вертикальная» вырезка отношения-операнда с естественным уничтожением потенциально возникающих кортежей-дубликатов. Синтаксис:
или
СоединениеОперация соединения отношений A и B по предикату P логически эквивалентна последовательному применению операций декартова произведения A и B и выборки по предикату P. Если в отношениях имеются атрибуты с одинаковыми наименованиями, то перед выполнением соединения такие атрибуты необходимо переименовать. Синтаксис:
ДелениеОтношение с заголовком (X1, X2, …, Xn) и телом, содержащим множество кортежей (x1, x2, …, xn), таких, что для всех кортежей (y1, y2, …, ym) ∈ B в отношении A(X1, X2, …, Xn, Y1, Y2, …, Ym) найдётся кортеж (x1, x2, …, xn, y1, y2, …, ym). Синтаксис:
Выразимость одних операций через другиеНекоторые из реляционных операций могут быть выражены через другие реляционные операторы.
Оператор соединения определяется через операторы декартова произведения и выборки следующим образом:
Оператор пересечения выражается через вычитание следующим образом:
Оператор деления выражается через операторы вычитания, декартова произведения и проекции следующим образом:
РеализацииПервым языком запросов, основанным на алгебре Кодда, был Alpha, разработанный самим Коддом. Впоследствии был создан ISBL, и эта новаторская работа была оценена многими авторитетными специалистами[5] как показывающая способ превратить идею Кодда в полезный язык. Business System 12 была недолговечной реляционной СУБД, которая последовала примеру ISBL. В 1998 году Кристофер Дэйт и Хью Дарвен предложили язык под названием Tutorial D, предназначенный для использования в преподавании теории реляционных баз данных, этот язык запросов также был основан на идеях ISBL. Rel — это реализация Tutorial D. Даже язык запросов SQL слабо основан на реляционной алгебре, хотя операнды в SQL (таблицы) это не совсем отношения, и несколько полезных теорем реляционной алгебры не выполняются в SQL (возможно, в ущерб оптимизаторам и/или пользователям). Модель таблицы SQL — это мультимножество, а не множество. Например, выражение — это теорема реляционной алгебры на множествах, но не реляционной алгебры на мультимножествах; для изучения реляционной алгебры на мультимножествах см. главу 5 «Полного» учебника Гарсиа-Молины, Ульмана и Видома[6]. Примечания
Литература
Ссылки |
Portal di Ensiklopedia Dunia