Сравнение подходов к крупномасштабному анализу данных

       

Сравнение подходов к крупномасштабному анализу данных

Сравнение подходов к крупномасштабному анализу данных
Предисловие переводчика
Аннотация
Введение

Два подхода к крупномасштабному анализу данных
Разделы
MapReduce
Reduce
Параллельные СУБД
Архитектурные элементы


Поддержка схемы

Индексация
Модель программирования
Распределение данных
Стратегия выполнения
Гибкость
Отказоустойчивость
Тесты для оценки производительности
Тестовая среда

Hadoop
СУБД-X
Vertica
Конфигурация узлов
Выполнение тестов
Исходная MR-задача
Загрузка данных

Результаты и обсуждение
Команды SQL
Программа MapReduce
Аналитические задачи

Задача Selection
Задача Aggregation
Задача Join

Функция Map
Функция Reduce
Задача UDF Aggregation

Обсуждение
Аспекты системного уровня
Инсталляция, конфигурирование и настройка систем
Запуск задач
Сжатие
Загрузка и размещение данных
Стратегии исполнения

Модель отказов
Аспекты пользовательского уровня
Простота использования
Дополнительные инструментальные средства
Заключение
Благодарности

Литература
Содержание раздела