OFF: Вопрос про кластеризацию

Kovalenko Dmitry Tue, 31 Jul 2007 02:32:23 -0700

Привет всем.

Вопрос из категории "для расширения кругозора"

Люди, объясните, пожалуйста, концепцию кластерного построения
_огромной_ базы данных.

Перебрав несколько вариантов, я склонился к тому что база данных
представляет собой множество файлов, разнесены по разным машинам. И
есть справочник физического размещения диапазонов страниц. Можно
помудрить с группировкой данных (например, таблиц, индексов) на одном
узле. Однако для этого как минимум надо резервировать место (или узел
целиком) под конкретную конструкцию.

Есть центральная машина с менеджером блокировок страниц, транзакций,
"картой размещения базы данных", кэшем метаданных. Часть этих
служебных данных можно без проблем реплицировать по узлам, выполняющим
фактическое управление базой данных.

Для того чтобы не гонять огромные объемы данных по сети (ну хотя бы
снизить нагрузку) надо реализовать возможность запрашивать не
страницы, а данные. Вообщем, узлы с файлами базы данных должны быть
как можно более интеллектуальные... и (возможно) уметь
взаимодействовать с другими узлами.

Конечно остается много вопросов.

Я пытался курить кластеризацию на "логическом" уровне, но она так или
иначе упирается в "физику" - поэтому стало понятно, что сначала нужно
разобраться именно с "физикой".

Вообщем с чего начинается кластер?

Делать копии базы данных и организовывать перекрестную репликацию -
это не интересно. Поэтому это обсуждать не очень хочется.

Коваленко Дмитрий.

OFF: Вопрос про кластеризацию

Ответить