Vertica — высокопроизводительная
платформа для анализа больших данных
в реальном времени
Позволяет принимать своевременные
решения на основе данных, а также
превращать Big Data в актив организации,
напрямую влияющий на ее прибыль
Специально для аналитики
Разработана с учетом требований для аналитических систем
Машинное обучение «из коробки»
Единое хранилище и единая платформа для всего цикла машинного обучения
Обладает инструментарием для построения и обучения моделей ML «из коробки»
Отказоустойчивость = защита данных
Все вычислительные узлы в кластере распределяют между собой нагрузку
Преимущества: дополнительная скорость вычислений
Параллельные вычисления = скорость
Реплики данных в заданном количестве копий хранятся на каждом из узлов
Преимущества: даже если несколько узлов будут недоступны, данные будут доступны пользователю
Масштабируемость = возможность развития системы
Кластер линейно масштабируется. Преимущества: увеличение объема для новых данных для аналитики, максимальной рабочей нагрузки, повышение отказоустойчивости
Компрессия данных = экономия на оборудовании
Компрессия – данные, поступающие в Vertica, специальным образом обрабатываются и сжимаются, что экономит потребность в дисковом пространстве
Различные варианты развертывания = гибкость
Схемы: onprem, private & public cloud, multi-cloud, hybrid, on Hadoop Среды: физическая, виртуальная, контейнеры Kubernetes
ANSI SQL-интерфейс = совместимость с окружением
SQL-интерфейс, совместимый со всеми аналитическими приложениями
Стандартные интеграции = легкость обмена данными
Импорт: Kafka, Apache Spark, Hadoop, Parquet, OLTP, датчики IoT и др.
Экспорт: Вышестоящие системы, BI
Технические особенности и принцип работы платформы
Vertica – представляет собой колоночную аналитическую СУБД, позволяющую работать со структурированными, полу-структурированными и комплексными типами данных. Кроме функционала хранения данных и аналитики, платформа предоставляет возможности для построения и обучения моделей ML на базе самого хранилища.

Vertica хранит данные в формате столбцов. По сравнению со строчной БД, колоночное хранилище позволяет считывать данные только из тех столбцов, которые необходимы, не читая строку полностью. Это уменьшает количество операций ввода-вывода, что дает высокую производительность для задач, связанных с интенсивным чтением.

Хранение данных в Vertica

Vertica хранит информацию в виде основных таблиц и проекций. Проекция является выборкой столбцов из основной таблицы. Данные в проекциях хранятся в отсортированном и сжатом виде, оптимизированном для выполнения запросов на чтение. Данные в проекциях автоматически обновляются, как только происходит обновление данных в основной таблице. Когда пользователь выполняет запрос в терминах исходной таблицы, платформа использует проекции основной таблицы для быстрого поиска. При данной технологии нет необходимости использовать индексы — поиск данных ведется по колонкам проекции, где колонка сама выполняет роль индекса.

Сжатие и кодирование данных

Vertica хранит данные с высокой степенью сжатия и соответственно, высокой скоростью выполнения запросов. Информация, которая в классической строчной СУБД занимает около 1 ТБ дискового пространства, на Vertica займет порядка 200-300 Гб. В Vertica доступны порядка 15 алгоритмов сжатия и система автоматически выбирает лучший для сжимаемых данных.

Платформа использует различные алгоритмы кодирования в зависимости от типа данных, количества элементов таблицы и порядка сортировки. В свою очередь кодирование увеличивает производительность, поскольку во время выполнения запроса сокращается количество операций ввода-вывода.

Кластеризация

Кластеризация поддерживает масштабирование и резервирование узлов. Общий пул данных дробится на части и распределяется между узлами в кластере в количестве n-копий. Благодаря этому в случае недоступности конкретного узла, данные будут доступны на другом узле, и система продолжит работать. После восстановления узел автоматически опрашивает другие узлы кластера для обновления своих локальных данных.

Масштабирование кластера реализуется линейно, путем добавления дополнительных узлов, с помощью чего можно повысить надежность, распределяя и реплицируя данные между узлами в кластере.

Непрерывность работы

Система не требует технологических окон для осуществления следующих работ:
• Параллельная загрузка данных и обработки запросов позволяют работать с информацией в режиме реального времени
• Изменение и добавление новых столбцов в таблицы и проекции «на лету», без блокировки базы данных
• Ре-балансировка кластера осуществляется без остановки системы

Настройка и администрирование

Конструктор баз данных и инструменты администрирования позволяют настраивать и управлять Vertica с минимальным привлечением специалистов. Vertica Database Designer использует встроенные алгоритмы проектирования таблиц и запросов. В процессе проектирования конструктор анализирует логические схемы, примеры данных и запросов, а также создает физические схемы (проекции) в форме SQL-скриптов, которые запускаются системой автоматически, или пользователем вручную. Данный механизм обеспечивает наилучшую производительность для выполнения запросов к базе данных, включая ad-hoc, при эффективном использовании дискового пространства.

Инструменты администрирования Vertica позволяют легко выполнять большинство задач администрирования СУБД.

РИТЭЙЛ

• Аналитика поведения клиентов, прогнозирование оттока
• Аналитика эффективности взаимодействия с клиентов по всем каналам связи
• Прогнозирование спроса и определение оптимального ассортимента
• Планирование поставок, складская аналитика
• Аналитика по продажам, расчет комиссии менеджерам по продажам

Банки

• Аналитика финансовых продуктов
• Аналитика рисков кредитного портфеля
• Профилирование клиентской базы
• Противодействие отмыванию денег
• Предоставление регуляторной отчетности

Цифровые компании

• Противодействие мошенничеству
• Анализ эффективности маркетинговых активностей
• Поведенческий анализ клиентов
• Поиск возможностей и инструментов для повторных продажи и кросс-продаж
• Обогащение данных

Производство

• Прогнозирование спроса и объема выпускаемой продукции
• Аналитика качества продукции
• Предиктивное техническое обслуживание и ремонт

Телекоммуникация

• Аналитика сети
• Аналитика продаж
• Профилирование клиентов для B2B и B2C сервисов
• Формирование персональных предложений и тарифов
• Подготовка данных для СОРМ
• Противодействие мошенничеству
• Сервисы на основе геолокации

Медицина

• Цифровые электронные карты
• Постановка диагнозов с помощью носимых устройств
• Телемедицина
• Исследования и разработки
• Предиктивное обслуживание медицинского оборудования
• Массовый скрининг, предупреждение и выявление эпидемий
• Операционная деятельность медицинских учреждений

Транспорт

• Единое расписание движения транспортных средств и информационное пространство
• Навигация на вокзалах
• Отслеживание грузов, вагонов, багажа в пути следования
• Контроль параметров транспортных средств и их состояния
• Дистанционный контроль состояния объектов инфраструктуры
• Обработка данных от датчиков встроенных систем диагностики инфраструктуры (рельсовой дефектоскопии, контактной сети и т.д.)

ЭНЕРГЕТИКА

• Прогнозирование потребления ресурсов
• Определение оптимальных режимов потребления
• Анализ и прогнозирование стоимости на энергоносители в реальном времени
• Расчет оптимальных тарифов
• Диагностирование объектов инфраструктуры

Yota
IVI

ASdf один из первых и крупнейший виртуальный оператор связи.

Используемые системы:
· Источники данных: CRM, GIS, Billing, детализация услуг абонента
· Системы аналитики: Tableau, SAP BO, Анти-фрод, модели ML
· Обработка и хранение: Hadoop, Oracle

Задачи:
· Сегментация потребителей
· Выявление зон роста продаж и формирование персональных предложений
· Обнаружение мошеннических действий пользователей

Решение:
Vertica Analytics Platform
Результат:

· Vertica стала централизованным хранилищем постоянной аналитики
· Поведенческий анализ и анализ гео-данных пользователей позволил выявлять мошеннические действия
· Всесторонняя аналитика данных о потребностях,
интересах и клиентском опыте абонентов позволила выделять потребительские сегменты формировать персональные тарифы и пакеты услуг
· Успешная работа с более чем 1 ПБ данных
· Запросы ускорились от часов
до минут. После перехода на Vertica сложные аналитические запросы стали выполняться в течение нескольких минут
· Потребность в поддержке: 1 администратор БД на поддержку 420 ТВ

Yota
IVI

LAMODA входит в Global Fashion Group

Интернет-магазин насчитывает 3 млн товаров и 1500 брендов. Тысячи покупателей из России и СНГ, более 1 500 000 посетителей в день.

Интернет-магазин – это лишь часть бизнеса Lamoda. Кроме него непрерывно работают и развиваются службы омниканального маркетинга и логистики, что включает три колл-центра, крупный распределительный центр в Подмосковье и службу доставки на 600+ городов. Помимо них — фотостудия, дизайнерское бюро в Лондоне, центр разработки ПО в Вильнюсе и другие подразделения.

Используемые системы:
· Источники данных: CRM, GIS, Billing, детализация услуг абонента
· Системы аналитики: Tableau, SAP BO, Анти-фрод, модели ML
· Обработка и хранение: Hadoop, Oracle

Задачи:
· Сегментация потребителей
· Выявление зон роста продаж и формирование персональных предложений
· Обнаружение мошеннических действий пользователей

Решение:
Vertica Analytics Platform

Результат:
· Максимально оперативное принятие решений на основе аналитических отчетов
· Ограниченный (не более чем линейный) рост затрат при масштабировании хранилища данных
· Эффективное управление данными улучшает масштабируемость и оптимизирует затраты на хранение
· Система не требует выделенного администратора, и более того, не требуются обращения в техническую поддержку

Планы по развитию:
· Реализация аналитики складских и логистических операций – в ближайшем времени. Для Lamoda чрезвычайно важно следить за скоростью и качеством комплектации и упаковки заказов, а также за работой службы доставки
· Создание витрин данных для отдела маркетинга и других команд
· Реализация предиктивной аналитики с помощью встроенных инструментов машинного обучения, включая интеграционные возможности для работы с Hadoop

Yota
IVI

Yota один из первых и крупнейший виртуальный оператор связи.

Решение:
Vertica Analytics Platform
ЭКОНОМИЧЕСКИ ЭФФЕКТИВНАЯ
Согласно данным официального отчета Forrester, Vertica обеспечивает быструю окупаемость инвестиций — 385% при среднем времени возврата 6 месяцев
БЫСТРАЯ
Колоночная архитектура хранилища позволяет обрабатывать большие данные в режиме близком к реальному времени
МАСШТАБИРУЕМАЯ
Массово-параллельная архитектура с масштабированием до десятков Петабайт с поддержкой K-Safety
СТАНДАРТНАЯ
Стандартный SQL-интерфейс, совместимый со всеми аналитическими приложениями и поддержкой ODBC, JDBC, ADO.NET коннекторов
ДОСТУПНАЯ
Стоимость не зависит от вычислительных мощностей и позволяет динамически добавлять узлы в кластер без дополнительных лицензионных отчислений
Услуги и Сервис
ВЕНДОР

• Обучение:
— Бесплатное обучение и сертификация сотрудников
— Предоставление документации и дополнительных материалов

• Помощь во внедрении

— Обследование и разработка архитектуры
— Сайзинг ресурсов
— Инсталляция и настройка платформы
— Поддержка импорта/экспорта данных
— Поддержка в построении корректных запросов к системам

• Рекомендации и лучшие практики:

— Анализ производительности и эффективности работы отдельных модулей или всей платформы
— Поиск ошибок и аудит
— Помощь в организации сбора информации
— Разработка рекомендаций по настройке

Дистрибьютор

• Проведение тренингов для менеджеров по продажам и пресейл-менеджеров партнера

• Предоставление документации и дополнительных материалов

• Поддержка на этапе технического пресейла, в т.ч. проведении пилотных
проектов, демонстраций системы

С чего начать?
Оцените возможности платформы
Vertica на собственной инфраструктуре,
развернув пробную версию Community
Edition

Пробная версия содержит весь
функционал, позволяет развернуть
систему на инфраструктуре до 3х
серверов и обрабатывать до 1Тб данных

Для перевода пробной версии в
коммерческую - переустановка,
перенастройка или остановка уже
действующей системы не требуется

    Оставьте заявку



    Вы уже прошли
    регистрацию
    и
    теперь можете
    скачать этот файл
    TEI Vertica 2021-05-06 - final Vertica Infographic - Forrester TEI Report
    ЛИЦЕНЗИРОВАНИЕ
    Enterprise Edition
    Perpetual
    Enterprise Edition
    Subscription
    Community Edition
    Параметры расчета стоимости лицензий
    Объем данных $ / TB $ / TB 1 TB
    Узлы (серверы) 3
    Пользователи, ядра
    Пользователи, ядра Бессрочно Кратно 1 месяцу
    Поддержка и обновления от вендора Докупаются отдельно* Включено
    Понижающие коэффициенты стоимости лицензий
    Подключение таблиц Hadoop в форматах ORC, Parquet
    Использование FlexTables для работы с полуструктурированными данными
    Бесплатно
    Развертывание платформы в непродуктивных (тестовых) средах
    Развертывание платформы на резервной площадке
    Использование внешних таблиц, основанных на текстовых файлах
    *При первичном приобретении бессрочных лицензий обязательна докупка поддержки и обновлений от вендора минимум на 12 месяцев
    Больше информации о Vertica