5 главных плюсов облачного развертывания VMware Tanzu Greenplum

Автор Категория ,
5 главных плюсов облачного развертывания VMware Tanzu Greenplum

Продвигая наши курсы по Greenplum и Arenadata DB, сегодня рассмотрим, что представляет собой облачная платформа VMware Tanzu Greenplum, где ее можно развернуть и каковы преимущества cloud-решения по сравнению с локальной версией этой MPP-СУБД.

Что такое VMware Tanzu Greenplum и чем это отличается от open-source версии

Напомним, в 2020 году корпорация VMware приобрела компанию Pivotal, которая была вендором массивно-параллельной реляционной СУБД Greenplum (GP) с 2012 года. Теперь GP коммерциализируется под торговой маркой VMware Tanzu Greenplum, обеспечивая мощную и быструю и аналитику больших данных петабайтных объемов. Благодаря наличию GPORCA, продвинутого оптимизатора на основе затрат, VMware Tanzu Greenplum обеспечивает очень высокую производительность аналитических SQL-запросов для больших объемов данных.

При том, что Greenplum представляет собой несколько взаимосвязанных экземпляров объектно-реляционной СУБД PostgreSQL, объединенных в кластер по принципу без разделения ресурсов (Shared Nothing), она существенно отличается от Postgres архитектурными особенностями и сценариями использования. PostgreSQL отлично подходит для не слишком нагруженных OLTP-систем и небольших аналитических кейсов, Greenplum специально оптимизирована для аналитики больших данных. А в OLTP-сценариях, требующих практически мгновенного отклика, внутренние коммуникации между мастером и сегментами кластера Greenplum становятся источником дополнительных накладных расходов, увеличивая время выполнения SQL-запроса. Подробнее об этом мы писали в отдельной статье.

Адаптировав код open-source проекта Greenplum к корпоративным потребностям, компания VMware продолжает развивать это решение с учетом современных тенденций рынка Big Data. В частности, тренд на перевод локальной ИТ-инфраструктуры в облака. Именно для этого в августе 2021 году вышла облачная версия платформы VMware Tanzu Greenplum, которую можно развернуть на любой из основных площадок популярных Cloud-провайдеров: Amazon Web Services, Google Cloud Platform и Microsoft Azure.

Пользователи Greenplum для развертывания этой платформы в облачном сервисе теперь могут выбирать наиболее удобный для себя вариант в зависимости от остальных компонентов своей ИТ-инфраструктуры и стоимости. По сравнению с локальной версией Greenplum, такое облачное развертывание дает целый ряд преимуществ, которые мы рассмотрим далее.

Greenplum для инженеров данных

Код курса
GPDE
Ближайшая дата курса
2 марта, 2022
Длительность обучения
24 ак.часов
Стоимость обучения
54 000 руб.

5 преимуществ облачного развертывания GP

С точки зрения бизнеса любое ИТ-решение должно не только корректно решать задачи, реализуя функциональные требования, но и быть экономически эффективным. Главной метрикой этого является совокупная стоимость владения (TCO, Total Cost Ownership). В случае облачного развертывания Greenplum это достигается благодаря следующим аспектам:

  • отсутствие затрат на локальную инфраструктуру и собственный дата-центр – инфраструктура полностью находится в области ответственности облачного провайдера. Клиент не тратит деньги и время на покупку оборудования и ПО, а также управление ими. Типовые процедуры и инструменты автоматизированного развертывания обеспечивают быстрый и безопасный запуск независимо от времени, места и размера системы.
  • Оптимизация производительности – облачная платформа предварительно настроена для наилучшей производительности по каждой площадке самых популярных Cloud-провайдеров (Amazon Web Services, Microsoft Azure и Google Cloud Platform), с учетом типовых конфигураций ОС, памяти, диска и сети. Шаблоны и образы вычислительных узлов проверяются каждым провайдером облачных услуг, а данные при хранении шифруются.
  • 2 варианта оплаты за реальное потребление. Возможно использование существующих лицензий VMware Tanzu Greenplum (BYOL, Bring Your Own License), когда облачная платформа принимает для развертывания существующую локальную лицензию Greenplum на основе ядра, а клиенты получают такую ​​же поддержку, как и при локальном развертывании. Также есть вариант почасовой оплаты (Hourly), когда VMware Tanzu Greenplum Cloud предоставляет лицензию по запросу для клиентов, которые хотят развернуть систему в общедоступной облачной среде без наличия действующей лицензии.
  • Гибкое масштабирование – облачная инфраструктура позволяет легко увеличивать или уменьшать масштаб вычислений и хранилища пользовательского экземпляра в любое время независимо друг от друга, сохраняя устойчивость к сбоям оборудования, резервному копированию моментальных снимков и восстановлению.

Как показал экспресс-анализ клиентских отзывов на сайтах облачных провайдеров, многие компании из разных секторов экономики (телекоммуникации, ритейл, ИТ) уже по достоинству оценили облачную платформу VMware Tanzu Greenplum. Однако, администраторы и дата-инженеры отмечают некоторые сложности в ежедневной работе с этой MPP-СУБД, такие как:

  • поддержка больших таблиц, к которым одновременно обращается множество пользователей;
  • отдельные проблемы после обновления;
  • отсутствие встроенных функций обслуживания типа автоматической очистки (vacuum);
  • сложность настройки производительности;
  • неожиданное поведение оптимизатора в некоторых кейсах;
  • отсутствие колоночного режима для запросов;
  • отсутствие встроенного агента метаданных таблиц в памяти о сегментах, которые будут использоваться для выполнения запроса.

Освойте на практике, как избежать этих недостатков или смягчить их последствия с помощью специальных приемов администрирования и эксплуатации Greenplum с Arenadata DB для эффективного хранения и аналитики больших данных на специализированных курсах в нашем лицензированном учебном центре обучения и повышения квалификации для разработчиков, менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data в Москве:

Источники

  1. https://awide.io/is-greenplum-database-just-a-big-sharded-postgresql/
  2. https://greenplum.org/vmware-tanzu-greenplum-on-public-cloud/
  3. https://aws.amazon.com/marketplace/reviews/reviews-list/B06XKQ8Z3H