Сравнение подходов к крупномасштабному анализу данных
Сравнение подходов к крупномасштабному анализу данныхПредисловие переводчика
Аннотация
Введение
Два подхода к крупномасштабному анализу данных
Разделы
MapReduce
Reduce
Параллельные СУБД
Архитектурные элементы
Поддержка схемы
Индексация
Модель программирования
Распределение данных
Стратегия выполнения
Гибкость
Отказоустойчивость
Тесты для оценки производительности
Тестовая среда
Hadoop
СУБД-X
Vertica
Конфигурация узлов
Выполнение тестов
Исходная MR-задача
Загрузка данных
Результаты и обсуждение
Команды SQL
Программа MapReduce
Аналитические задачи
Задача Selection
Задача Aggregation
Задача Join
Функция Map
Функция Reduce
Задача UDF Aggregation
Обсуждение
Аспекты системного уровня
Инсталляция, конфигурирование и настройка систем
Запуск задач
Сжатие
Загрузка и размещение данных
Стратегии исполнения
Модель отказов
Аспекты пользовательского уровня
Простота использования
Дополнительные инструментальные средства
Заключение
Благодарности
Литература
Содержание раздела