Материалы, подготовленные в результате оказания услуги, помогают разобраться в теме и собрать нужную информацию, но не заменяют готовое решение.

Принципы и задачи реляционных систем управления базами данных

Статью подготовили специалисты образовательного сервиса Zaochnik.

Содержание:

Реляционная система управления базами данных (РСУБД) представляет собой систему, которая управляет реляционными базами данных.

Термин "реляционный" (от англ. relation — отношение) был введен известным английским экспертом Эдгаром Коддом (Edgar Codd) в области баз данных.

Данные модели выделяются простотой структуры, удобным табличным представлением для пользователей и возможностью применения формальных методов алгебры отношений и реляционного исчисления для работы с данными.

Ключевые понятия, цели и задачи РСУБД

Реляционная модель нацелена на организацию информации в виде двумерных таблиц. Каждая реляционная таблица может рассматриваться как двумерный массив и имеет следующие характеристики:

  • Каждый элемент таблицы — отдельный элемент данных.
  • Все ячейки в столбце имеют одинаковый тип данных (числовой, символьный и т.д.).
  • Каждому столбцу присвоено уникальное имя.
  • В таблице отсутствуют дублирующие строки.
  • Порядок строк и столбцов не имеет значения и может варьироваться.

Основными понятиями РСУБД являются:

  • Атрибут
  • Отношение
  • Кортеж

Отношение является ключевым понятием реляционной модели данных, отсюда и название "реляционная" (от англ. relation — отношение).

Визуально отношение может быть изображено в виде таблицы, где столбцы (поля, атрибуты) соответствуют доменам в отношении, а строки (записи) представляют собой наборы значений, взятых из этих доменов. Количество строк (кортежей) n называется кардинальным числом отношения (кардинальностью) или мощностью отношения.

Такая таблица обладает следующими свойствами:

  • В ней нет двух одинаковых строк.
  • Столбцы связаны с атрибутами отношения.
  • Каждый атрибут имеет уникальное имя.
  • Порядок строк является произвольным.

Атрибутом в рассматриваемом контексте считается вхождение домена в отношение. Строки отношения обозначаются как кортежи.

Следующим шагом является формализация введенных понятий.

  • Заголовок Hr (или схема) отношения r — это конечное множество упорядоченных пар вида <A, T>, где A — это имя атрибута, а T указывает на название определенного базового типа данных или ранее заданного домена, то есть множества допустимых значений. Все имена атрибутов в заголовке должны быть уникальны.
  • Кортеж tr, соответствующий заголовку Hr, представляет собой множество упорядоченных триплетов вида <A, T, v>, по одному для каждого атрибута в Hr. Третий элемент – v – триплета <A, T, v> должен быть допустимым значением для типа данных или домена T. Обратите внимание, что поскольку имена атрибутов уникальны, указание домена в кортеже не обязательно.
  • Тело Br отношения состоит из неупорядоченного множества различных кортежей tr.
  • Значение Vr отношения r представляет собой пару множеств Hr и Br.

Также важно понимать первичный ключ — это совокупность атрибутов, которая однозначно идентифицирует кортеж и является минимальной среди всех своих подмножеств (то есть невозможно исключить ни один из атрибутов). При добавлении новых записей первичный ключ должен оставаться неизменным (например, было бы неправильно использовать комбинацию Имя + Отчество + Фамилия как первичный ключ, даже если на момент создания таблицы не было полных тёзок).

Нормализация реляционной базы данных

Нормальная форма представляет собой характеристику отношения в реляционной модели данных, которая определяет его с точки зрения избыточности. Это избыточность может привести к логическим ошибкам при выборке или изменении данных.

Примечание 1

Нормальная форма обусловлена набором требований, которым должно соответствовать отношение. Алгоритм трансформации отношений базы данных в нормальные формы определяет название нормализации.

Основная цель нормализации заключается в оптимизации структуры базы данных так, чтобы минимизировать логическую избыточность. При этом нормализация не направлена на увеличение или уменьшение производительности работы или физического объема базы данных.

Главная задача нормализации — это снижение вероятности противоречий в информации, хранимой в базе данных. К основным целям процесса нормализации относятся:

  • Исключение отдельных видов избыточности.
  • Ликвидация некоторых аномалий при обновлении данных.
  • Создание базы данных, которая является качественным и интуитивно понятным представлением реального мира и может служить основой для дальнейшего расширения.
  • Упрощение применения требуемых ограничений целостности.

Устранение избыточности обычно осуществляется через декомпозицию отношений, таким образом, чтобы каждое отношение хранило только первичные факты, то есть факты, которые не могут быть логически выведены из других хранений.

Хотя концепции нормализации вполне носят благой характер для проектирования баз данных, они не являются универсальным решением для повышения их качества. Это связано с тем, что существует множество всевозможных ошибок и недочетов в структуре базы данных, которые не удается устранить с помощью нормализации.

Тем не менее, теория нормализации представляет собой серьезное достижение в области реляционных баз данных, так как предлагает научно подтвержденные критерии качества проекта базы данных и формальные методы для его совершенствования. Это выделяет теорию нормализации на фоне эмпирических подходов к проектированию, существующих в иных моделях данных.

Пожалуй, будет верным утверждение, что в области информационных технологий присутствует незначительное количество методов оценки и улучшения проектных решений, которые могли бы сравниться с теорией нормализации реляционных баз данных по уровню формальной строгости.

Первая нормальная форма (1NF)

Отношение находится в первой нормальной форме строгости (1NF) в том случае, если в каждом допустимом значении отношения каждый кортеж включает в себя только одно значение для каждого из атрибутов.

Примечание 2

В реляционной модели отношение по умолчанию всегда находится в 1NF. Однако различные таблицы могут не быть корректными представлениями отношений и, следовательно, не соответствовать 1NF.

Вторая нормальная форма (2NF)

Отношение находится во второй нормальной форме строгости, в том случае, когда оно уже в первой нормальной форме и при этом каждый атрибут, не входящий в состав потенциального ключа, функционально зависит от всех потенциальных ключей.

  1. Функциональная зависимость здесь означает, что атрибут зависит от всего составного потенциального ключа, при этом не подчиняется любому из его составных частей. Другими словами, во 2NF не допускается присутствия неключевых атрибутов, зависимых от части составного ключа.
  2. Второе важное содержание второй нормальной формы заключается в том, что она запрещает существование неключевых атрибутов, которые в принципе не является зависимым от потенциального ключа. На основании чего, 2NF предотвращает создание отношений, представляющих собой несвязанные или хаотичные наборы атрибутов.

Третья нормальная форма (3NF)

Отношение находится в третьей нормальной форме строгости, если выполняются два условия:

  1. Оно соответствует второй нормальной форме;
  2. Каждый неключевой атрибут отношения имеет прямую (нетранзитивную) зависимость от потенциального ключа.

Следовательно, отношение соответствует 3NF, если оно уже в 2NF и отсутствуют транзитивные зависимости неключевых атрибутов от ключевых. Транзитивная зависимость подразумевает наличие зависимостей, например: {A} → {B} и {B} → {C}, где {A} — это потенциальный ключ, а {B} и {C} — различные множества неключевых атрибутов.

Навигация по статьям

Выполненные работы по программированию

  • Программирование

    НИР на тему Автоматизированое рабочее места специалиста по социальной работе

    • Вид работы:

      Отчёт по практике

    • Выполнена:

      25 февраля 2020

    • Стоимость:

      1 900 руб.

    Заказать такую же работу
  • Программирование

    Обеспечение защиты информации при использовании системы электронного документооборота

    • Вид работы:

      Реферат

    • Выполнена:

      29 декабря 2019

    • Стоимость:

      500 руб.

    Заказать такую же работу
  • Программирование

    Искусственный интеллект. Достижения и перспективы развития.

    • Вид работы:

      Эссе

    • Выполнена:

      11 декабря 2019

    • Стоимость:

      800 руб.

    Заказать такую же работу
  • Программирование

    Айти. Заполнить дневник практики.

    • Вид работы:

      Отчёт по практике

    • Выполнена:

      9 декабря 2019

    • Стоимость:

      1 800 руб.

    Заказать такую же работу
  • Программирование

    Если свободное общество не сможет помочь многим бедным, оно не сможет защитить немногих богатых

    • Вид работы:

      Эссе

    • Выполнена:

      8 декабря 2019

    • Стоимость:

      1 000 руб.

    Заказать такую же работу
  • Программирование

    Двоичные деревья поиска, Организация поиска в массиве данных при помощи специальных методов поиска, Сортировка

    • Вид работы:

      Отчёт по практике

    • Выполнена:

      28 октября 2019

    • Стоимость:

      1 700 руб.

    Заказать такую же работу