
Специалисты, которые хотят освоить новую мощную СУБД для построения масштабируемых хранилищ данных и пайплайнов, чтобы работать с объёмами в сотни терабайт и более.
Для тех, кому не хватает скорости и мощности текущих инструментов. Навыки работы с Greenplum позволят самостоятельно готовить данные для сложных отчетов и быстро выполнять глубокую аналитику.
Профессионалы, которые стремятся расширить экспертизу в области распределенных систем, изучить архитектуру MPP и научиться проектировать высоконагруженные аналитические базы данных.
Команда Rebrain изучает, какие из компетенций требуются на разных уровнях профессий.
Разверните кластер Greenplum в сервисе Yandex MPP Analytics for PostgreSQL.
Изучите архитектуру Greenplum Master Segment — распределение данных.
Проверьте корректность создания кластера и доступность компонентов.
Подготовьте краткое описание архитектуры развёрнутого решения и сценариев отказоустойчивости.
Спроектируйте таблицу для аналитического сценария с учётом типа таблицы схемы дистрибуции партицирования.
Создайте таблицу с использованием DDL.
Настройте индексы и ограничения целостности.
Проверьте влияние выбранной дистрибуции на выполнение запросов.
Подготовьте внешний источник данных для загрузки.
Используйте встроенные инструменты Greenplum для загрузки данных.
Выполните выгрузку данных из Greenplum во внешний источник.
Проанализируйте скорость и корректность загрузки и выгрузки.
Выполните аналитический SQL-запрос к подготовленным данным.
Проанализируйте план выполнения запроса.
Определите узкие места операторы спилл файлы.
Оптимизируйте запрос и сравните показатели производительности до и после.
При использовании данного сайта, вы подтверждаете свое согласие на использование файлов cookie и других похожих технологий в соответствии с настоящим Уведомлением.