Выбор СХД для решений бизнес-аналитики

28 мая 2009 16:00

Статья Дмитрия Литвинова, менеджера по продажам систем хранения данных НР Россия, — о важности выбора аппаратной платформы для решений бизнес-аналитики. 

Под общим названием «бизнес-аналитика» (Business Intelligence, BI) скрывается большой объем разнообразных задач, объединенных общим подходом. Согласно обобщенному определению, данному аналитической компанией IDC, бизнес-аналитика — это инструменты и приложения для поиска, анализа, моделирования и доставки информации, необходимой для принятия решений. Ее логическая структура состоит из трех основных частей: база данных, логика трансформации данных в полезную информацию и конечные приложения, использующие полученную информацию: управленческая отчетность, банковская отчетность, финансовая аналитика, CRM, и т. п.

Внедрение BI-решений именно в финансовой отрасли сейчас идет достаточно активно, внедрение или расширение BI решений — наиболее популярное направление на рынке, и это несмотря на влияние кризиса. Идет активный рост объема данных, загружаемых в системы, увеличивается как число прикладных систем, так и число пользователей, работающих с системами. Все это приводит к росту требований к СХД и по объему, и по производительности, причем требования к производительности обычно растут в несколько раз быстрее, чем требования по объему. В большинстве случаев даже разработчики систем затрудняются четко сформулировать требования к оборудованию или дать прогноз по росту объемов и нагрузки.

Все эти факторы делают серьезной проблемой выбор или обновление аппаратной платформы для BI-решений, а СХД — это ключевой компонент платформы.

Позиция HP

Компания HP занимает уникальные позиции на этом рынке, являясь в качестве производителя оборудования глобальным партнером всех ключевых игроков (Oracle, SAP, Microsoft) на этом рынке и одновременно — производителем ПО (HP NeoView) для BI-решений.

Подход в HP к каждому заказчику индивидуален, для каждой конкретной задачи подбирается решение, удовлетворяющее клиента по требованиям к стоимости, производительности, предоставляемому пространству, функционалу и планируемому росту. В команде HP имеются специальные подразделения из специалистов по ключевым приложениям с богатой экспертизой, которые проводят базовые тесты, подтверждающие способность совместной работы ПО и оборудования с учетом всех последних обновлений; организуют детальные обследования, позволяющие оценить производительность оборудования при работе с данными приложениями и дать рекомендации по настройке; разрабатывают рекомендуемые конфигурации.

Особенности BI-решений с точки зрения систем хранения данных

Для BI-решений можно выделить основные требования к аппаратной платформе, постоянные практически для всех случаев:

 

 

  • большой объем дискового пространства, измеряемый в единицах или десятках терабайт;
  • возможность расширения в несколько раз по числу дисков;
  • высокая производительность для последовательных и произвольных операций по чтению данных большими блоками (такая нагрузка характерна для задачи создания отчетов).

    Поскольку в этих системах преобладают операции чтения и важен процент эффективного использования пространства, для защиты данных в основном применяют схему RAID 5, минимизирующую потерю пространства по сравнению с RAID 1.

    В зависимости от размеров решения и требований заказчика используются все способы подключения: подключение СХД напрямую к серверам (DAS), доступ через локальную сеть по протоколу NFS (NAS) и доступ через специализированную сеть хранения данных (SAN).

      Востребована возможность организации локальных копий данных, позволяющая «на лету» создавать копии данных (Business Copy). Возможность создания мгновенных копий (Clone) и снимков (Snapshot) данных средствами самого дискового массива позволяет решить целый ряд задач, стоящих перед современными IT-службами:
  • резервное копирование без необходимости выделения специального окна;
  • выполнение резервного копирования чаще, чем раз в сутки;
  • быстрое восстановление работы приложения в случае сбоя и разрушения данных;
  • перенос данных от одного приложения к другому;
  • возможность отладки новой версии приложения на актуальных данных и т. п.

    Не менее важна и организация репликации данных на удаленную систему для защиты от сбоев (Continuous Access), которая позволяет построить катастрофоустойчивые решения для всего комплекса используемых систем.

    Дисковый массив HP StorageWorks EVA

    Дисковые массивы HP StorageWorks Enterprise Virtual Array (EVA), обладающие высокой надежностью уровня 99,999%, пользуются наибольшей популярностью у заказчиков. Это системы без единой точки отказа, характеризующиеся высокой производительностью, богатым функционалом и доступной стоимостью. Массивы EVA на текущий момент являются самими гибкими в плане стартовой стоимости, ТСО и масштабируемости.

    С выходом обновленной линейки HP EVA 4400/6400/8400 наращивание мощностей системы стало еще проще, достаточно поменять контроллерную пару, чтобы система заработала в новой конфигурации — дисковые полки во всей линейке унифицированы, хранимые данные переносить на новые носители не нужно. Простое добавление полок с дисками даст увеличение дискового пространства от 96 Тб для HP EVA 4400 до 324 Тб для HP EVA 8400.

    В этой системе применена технология виртуализации, позволяющая повысить производительность, увеличить процент использования дискового пространства, уменьшить потерянную емкость и существенно облегчить управление ресурсами системы, такими, например, как настройка и развертывание системы, конфигурирование, перераспределение или реорганизация дискового пространства.

    Дисковый массив HP StorageWorks XP Disk Array

    Для задач, где требуется 100%-ная доступность данных в режиме 24х7х365, заказчики выбирают дисковые массивы HP StorageWorks XP Disk Array, обладающие уникальной архитектурой, позволяющей пережить множественные сбои отдельных компонентов без потери работоспособности и с минимальной потерей производительности. Все компоненты продублированы, обеспечены два независимых ввода питания, обслуживающие разные половины шкафов.

    Использование дисковых массивов ХР снижает риск простоя, предоставляя надежную платформу с полным аппаратным резервированием, возможностью горячей замены и обновления в режиме реального времени без приостановки рабочей деятельности. Благодаря репликации данных, тесно интегрированной с кластерными решениями, а также возможности восстановления системы в случае аварии, отказоустойчивая распределенная система гарантирует абсолютную непрерывность рабочего процесса.

    Богатый набор предлагаемого ПО позволяет реализовать широкий спектр возможностей. Технология выделения ресурсов по запросу (Thin Provisioning) дает возможность снижать расходы на хранение, задействуя необходимое пространство из единого пула системы хранения по мере его реального заполнения данными, а не просто выделения объема с двойным запасом, и приобретать дополнительные диски только при реальной необходимости. В качестве платформы виртуализации массивы ХР предоставляют такие возможности, как гетерогенная миграция данных между массивами и создание многоуровневой системы хранения данных. Технология создания логических разделов повышает эффективность консолидации систем хранения благодаря выделению ресурсов массива конкретным приложениям, серверам и администраторам. Каждый раздел управляется отдельно и в случае необходимости может быть динамически изменен без остановки работы приложений.

    Решение HP Scalable NAS

    В последнее время на мировом рынке систем хранения для баз данных активную роль начинают играть NAS-решения. Хотя стоимость этих решений обычно ниже по сравнению с SAN-решениями, но они имеют и значительно меньшую производительность для задач размещения баз данных. Однако благодаря политике компании Oracle, активно развивающей концепцию Grid и поддержку NAS-решений в рамках этой концепции (так, в Oracle 11g включен собственный DirectNFS-клиент), и развитию технологических возможностей, таких предложений становится больше.

    Компания HP предлагает уникальное решение HP Scalable NAS for Oracle. Это высокопроизводительный симметричный кластер с кластерной файловой системой, который позволяет линейно масштабировать производительность просто путем добавления узлов (до 16 в текущей версии). Преимущества данного решения — это снижение расходов на подключение по сравнению с SAN-подключением, виртуализация доступа к дисковым массивам, более простое управление, прогнозируемое увеличение производительности при расширении системы. Все это позволяет размещать на NAS крупные базы данных и обслуживать большое число серверов баз данных, обеспечивая при этом более низкую стоимость владения при производительности уровня SAN.

    Система хранения HP StorageWorks 600 Modular Disk System

    Бизнес-аналитика актуальна и для некрупных заказчиков, которым важны в первую очередь цена решений и объем размещаемой информации. Для таких заказчиков идеально подойдет HP StorageWorks MDS600 — новое DAS-решение от HP, подключаемое по протоколу SАS. Это инновационное решение со сверхвысокой плотностью размещения данных: до 70 дисков 3,5’’ SАS или SATA можно разместить всего в 5U стоечного пространства. К одному шасси BladeSystem можно подключить до шести таких полок, что в сумме дает до 420 Тб предоставляемого пространства в одном шкафу 42U.

    Жесткие диски, размещенные в MDS600, назначаются отдельным блейд-серверам с помощью управляющего программного обеспечения коммутатора HP StorageWorks 3Gb SАS BL Switch и «видятся» операционной системой сервера как внутренние.

    Заключение

    Решения по бизнес-аналитике сейчас одни из наиболее востребованных, поскольку правильное их внедрение позволяет получить множество преимуществ: большая видимость и прозрачность ситуации для управленцев компании, автоматизация формирования требуемой отчетности для регулирующих органов, повышение качества работы с клиентами и т. п. С ростом важности данного решения и объемов информации требования повышаются, переходя из разряда «еще одно приложение» в разряд «критично для работы бизнеса». Именно поэтому так важно для BI-решений предварительное проектирование. Не заложив нужный уровень роста в требованиях к аппаратной платформе, можно очень быстро исчерпать ее ресурсы, и именно СХД на текущий момент является наиболее критичной частью данного комплекса.

     

     

    Внедрение бизнес-аналитики в Альфа-Банке на платформе HP

    %images[2]%

    О внедрении системы бизнес-аналитики в Альфа-Банке рассказывает Олег Потапов, начальник Управления вычислительных комплексов Альфа-Банка.

    «Банковские технологии»: Скажите, как родилась эта система, почему было принято решение внедрять бизнес-аналитику?

    Олег Потапов: Основным заказчиком внедрения данного решения выступил финансовый блок, которому требовались широкие возможности финансового анализа. Ранее данная система использовалось только для решения задач бухгалтерии по формированию отчетности и минимальных финансовых отчетов. Дальнейшее расширение было невозможно в связи с существенными ограничениями системы, работавшей тогда на IBM AS/400 и DB2 — низкая производительность, и непреодолимые ограничения в функционале (например, число записей было ограничено 4 млрд, что не позволяло загрузить в единый отчет даже годовой объем).

    «Б. Т.»: На какой программной и аппаратной платформе система построена?

    О. П.: Чтобы обеспечить необходимую функциональность, была произведена миграция системы на платформу HP Integrity SuperDome c HP-UX 11i v3 и Oracle 10g, в качестве СХД была выбрана платформа HP StorageWorks XP24000. Это позволило увеличить производительность системы и предоставить возможность дальнейшего роста.

    «Б. Т.»: Какие функции возложены на систему бизнес-аналитики сейчас и каковы дальнейшие планы по ее развитию?

    О. П.: На текущий момент система способна генерировать более 200 отчетов: это и бухгалтерская отчетность, и детальная финансовая аналитика, и управленческая отчетность. Сейчас с системой работают более 1000 пользователей. Информация собирается более чем с 20 систем, работающих на различных платформах (от Access и Lotus Notes до MS SQL, Oracle и Informix), и консолидируется в единое промежуточное хранилище. Далее отдельная система производит проверку качества поступивших данных и переработку данных в формат для загрузки в систему аналитики.

    Уже сейчас эта инициатива поддержана другими бизнес-подразделениями банка, и идет планирование следующей фазы расширения системы бизнес-аналитики до полного объема отчетности по физическим лицам (retail banking). К концу 2010 г. запланирован рост общего объема информации в хранилище до 50 Тб.

     

     

     

     

     

     



© 2020 БАНКОВСКИЕ ТЕХНОЛОГИИ
Первое издание на российском рынке, посвященное информационным технологиям для банков.
Москва, Проспект Мира, д.3, корп. 1
+7 (495) 120-81-42
info@int-bank.ru

Свидетельство СМИ ФС77-39103 от 11 марта 2010 года.
По вопросам сайта просим обращаться к администрации сайта: info@int-bank.ru.
При использовании материалов необходимо давать ссылку на www.banktech.ru.