УДК 004.657
Анализ времени выполнения запроса в параллельном
колоночном хранилище данных
© Ю.А. Григорьев, Е.Ю. Ермаков
МГТУ им. <...> Н.Э. Баумана, Москва, 105005, Россия
Проанализирован специфичный для параллельных колоночных хранилищ данных
план запроса со скрытым соединением. <...> Приведено преобразование Лапласа —
Стилтьеса времени обработки запроса с подобным планом в параллельном колоночном хранилище данных. <...> Выполнено сравнение среднего времени выполнения запроса со скрытым соединением и пересечением NLJ. <...> Ключевые слова: колоночное хранилище данных, колоночные базы данных, параллельные базы данных, преобразование Лапласа — Стилтьеса, скрытое соединение. <...> Время обработки этих
запросов достаточно велико, его доля в общем времени выполнения
прикладных программ превышает 90 %. <...> Методы анализа временны´х характеристик для параллельных строчных БД (Oracle, MS SQL Server и т. д.), учитывающих специфику запросов к базе данных, уже разработаны и представлены в работах [2–
6]. <...> Но в настоящее время внедряются новые системы управления БД
с иной организацией хранения данных, получившие название параллельных колоночных БД (ПКБД) [7–9]. <...> Они впервые были внедрены
при разработке больших БД, используемых при поддержке принятия
решения, в частности, в аналитических расчетах, и сразу же дали хорошие результаты: почти 200-кратное сокращение объема вводавывода по сравнению с аналогичными строчными БД и значительное
уменьшение времени выполнения запросов [8]. <...> Ю.А. Григорьев, Е.Ю. Ермаков
Однако проектирование систем на основе колоночных систем
управления БД ведется на интуитивном уровне, а кроме того, не существует математических методов, позволяющих учитывать специфику сложных запросов к хранилищу данных, которые используются
в процессе принятия решений. <...> Поэтому разработка теоретических
методов, дающих возможность на этапе проектирования прогнозировать время работы параллельного колоночного хранилища данных
(ПКХД) с учетом <...>