Научный журнал

ISSN 1814-2400

ИНФОРМАТИКА И СИСТЕМЫ УПРАВЛЕНИЯ

Григорьев Ю. А., Плутенко А. Д.

ОЦЕНКА ВРЕМЕНИ СОЕДИНЕНИЯ ТАБЛИЦ В БАЗЕ ДАННЫХ NOSQL ПО ТЕХНОЛОГИИ MAPREDUCE

Получены выражения времени выполнения запроса на соединение таблиц по технологии MapReduce (MR). Выбор задачи соединения был связан с тем, что в рамках этого одного запроса можно реализовать все основные операции поиска данных: селекцию, соединение, агрегацию, проекцию, группирование и сортировку. Для оценки процессорной составляющей в модель введен параметр времени выполнения короткой логической операции алгоритма (КЛОА), позволяющий выполнять калибровку модели по результатам натурных экспериментов. Модель учитывает большое число параметров, влияющих на время выполнения запроса, в частности число узлов в кластере, объем базы данных в узле, селективность атрибута в условии поиска, число сортируемых записей, мощность атрибута группирования и др.

Ключевые слова: база данных NoSQL, технология MapReduce, запрос на соединение таблиц, оценка времени выполнения запроса