Системы хранения данных: игра в классы
Заказчики стремятся выбрать систему хранения данных того или иного класса, отвечающую предъявляемым корпоративными приложениями требованиям к производительности, емкости и функциональным характеристикам системы при минимальной стоимости решения. Что же может сегодня предложить им рынок?
По оценкам аналитиков, на системы хранения данных сегодня приходится 3-5% в ИТ-бюджетах российских компаний на ИТ-оборудование, и, как ожидается, эта доля в ближайшие несколько лет увеличится, что обусловлено, прежде всего, наращиванием объемов хранимых данных. По прогнозам, рынок СХД в России, вероятно, будет расти двузначными темпами, даже с учетом того, что стоимость хранения единицы данных будет ежегодно снижаться на 7-8%, и все популярнее в корпоративном сегменте становится оборудование средней ценовой категории.
Однако есть и факторы, препятствующие росту спроса на новые СХД, – виртуализация дисковых хранилищ и системы с поддержкой алгоритмов дедупликации и сжатия «на лету», которые позволяют повысить эффективность использования уже развернутой инфраструктуры, считают в IDC. Тем не менее, в емкостном выражении рынок внешних СХД будет однозначно увеличиваться.
Согласно IDC, в первом квартале 2016 года объем российского рынка внешних СХД составил чуть более 90 млн. долларов, что на 7,1% больше, чем за тот же период 2015 года. Суммарная емкость поставленных накопителей за это время увеличилась на 89,6% - до 141,2 Пбайт. На рынок продолжают действовать факторы увеличения количества накопленных данных, снижения стоимости флэш-массивов и гибридных систем
Ключевые игроки мирового рынка СХД: изменение доли рынка к 2017 году по прогнозу 451 Research.
Усиливается и конкуренция в данном сегменте. Заказчики стремятся выбрать решение того или иного класса, отвечающее предъявляемым корпоративными приложениями требованиям к производительности, пропускной способности, величине задержки, емкости и функциональным характеристикам системы при минимальной стоимости (далеко не всегда обращая внимание на ТСО).
Vendor | 1Q16 Revenue |
1Q16 Market SHare |
1Q15 Revenue |
1Q15 Market Share |
1Q16/1Q15 Revenue Growth |
T1. HPE | $1 420,30 | 17,30% | $1 279,50 | 14,50% | 11,00% |
T1. EMC | $1 349,40 | 16,40% | $1 530,40 | 17,30% | -11,80% |
3. Dell | $845,50 | 10,30% | $897,70 | 10,20% | -5,80% |
4. NetApp | $645,50 | 7,90% | $764,90 | 8,70% | -15,60% |
T5. Hitachi | $513,90 | 6,30% | $522,10 | 5,90% | -1,60% |
T5. IBM | $475,70 | 5,80% | $536,80 | 6,10% | -11,40% |
ODM Direct | $680,50 | 8,30% | $1 131,50 | 12,80% | -39,90% |
Other | $2 280,40 | 27,70% | $2 164,90 | 24,50% | 5,30% |
All Vendors | $8 211,20 | 100,00% | $8 827,80 | 100,00% | -69,80% |
Source: IDC Worldwide Quarterly Enterprise Storage System Tracker, June 3, 2016 |
Крупнейшим мировым поставщиком систем хранения данных корпоративного класса в первом квартале 2016 года стала HPE, доля которой (в деньгах) поднялась до 17,3% с 14,5% годом ранее. У прошлогоднего лидера EMC этот показатель сократился с 17,3% до 16,4%. В тройку лидеров входит Dell (10,3%).
Классы СХД: все относительно
Что же такое системы хранения старшего (High End), корпоративного (Entreprise), среднего (Midrange) и младшего (Entry Level) класса? Можно ли дать точные определения? Этот вопрос особенно актуален, поскольку функции, традиционно предлагаемые в системах старшего класса, все чаще встречаются в продуктах среднего и даже начального уровня. Если когда-то между системами хранения этих классов существовали глубокие функциональные отличия, то сегодня это уже не так. Да и программное обеспечение в СХД разного класса у некоторых вендоров подчас одинаковое.
К тому же в отрасли нет общепринятых, стандартных определений классов СХД, отсутствуют критерии для однозначного отнесения системы к тому или иному классу. Ни производительность, ни емкость, ни доступность, ни функциональность определяющими параметрами не являются. Тем не менее, начнем с так называемого младшего класса. Традиционными заказчиками таких систем считается малый и средний бизнес (SMB).
Младший класс: доступность и многообразие
Высокопроизводительные системы хранения, оснащенные такими функциями, как кэширование данных на SSD, синхронная репликация и другие средства «корпоративного класса», теперь по карману многим организациям. В то же время в сложных экономических условиях предприятия среднего бизнеса отдают предпочтение устройствам без излишней функциональности, но с высоким уровнем надежности и производительности. Все чаще они обращают свое внимание на системы хранения данных, предназначенные для SMB.
На российском рынке хорошо известны такие поставщики сетевых систем хранения (NAS) для SMB, как Buffalo, D-Link, LenovoEMC, Netgear, Synology, Thecus, QNAP и др. Они регулярно обновляют свои линейки продуктов, расширяют их как «вверх», выпуская более мощные и емкие многодисковые системы для крупных компаний, так и «вниз», дополняя спектр предложений решениями для дома и малого офиса (SOHO), а также для различных специализированных задач, таких как резервное копирование, сервер печати, файловый сервер, веб-сервер или сервер системы видеонаблюдения (NVR).
Низкая стоимость и простота использования - основные требования к системам такого класса. Следующими по важности являются стоимость обслуживания и сроки поставки. Малым компаниям нужны небольшие системы, обеспечивающие простую защиту данных от сбоев дисков. Но функциональные требования к СХД растут вместе с бизнесом. Со временем появляются потребности в разграничении доступа к данным, в ролевом администрировании, квотировании предоставляемой пользователям емкости хранения, интеграции с системами резервного копирования, поддержки совместной работы.
Многие современные NAS для SMB поддерживают достаточно развитые функции, среди которых - гибкое распределение ресурсов (Thin Provisioning), дедупликация данных по различным алгоритмам, iSCSI, моментальные снимки, динамическое масштабирование JBOD и RAID, репликация и зеркалирование томов.
Граница между сетевыми системами хранения корпоративного класса и NAS для SMB постепенно стирается. Это касается и надежности NAS, и их производительности, и функциональности и масштабируемости. Многие СХД для SMB имеют средства защиты данных и управления ими, сопоставимые с системами более высокого уровня, а некоторые NAS интегрируются с облачными сервисами. Весьма востребована и поддержка виртуализации серверов (VMware- и Hyper-V-ready).
Основные различия между системами хранения разного класса состоят в производительности, поддержке тех или иных расширенных функций системы и средств безопасности, iSCSI и типов RAID, ограничениях по числу HDD и применимости системы в доменной структуре. Однако четко разделить разные классы СХД становится все сложнее. Исключение составляют разве что «старшеклассники» с их уникальными особенностями и стоимостью эксклюзивного решения.
Старший класс: традиции и надежность
Обычно системы хранения старшего класса характеризуются высоким уровнем доступности («пять девяток» в конфигурации с соответствующими серверами), высокой производительностью в IOPS и малой задержкой, могут обслуживаться без прерывания работы и предлагаю продвинутые функции, например, удаленного мониторинга и репликации между площадками с возможностью аварийного восстановления.
В первом квартале 2016 года Hitachi Data Systems стала крупнейшим в России поставщиком систем хранения данных по общей емкости проданных систем. Об этом свидетельствуют данные отчета IDC.
К оценкам систем корпоративного (старшего) класса аналитики Gartner подходят, исходя из таких критериев: надежность, масштабируемость, удобство обслуживания, снимки данных, репликация, многоарендность, безопасность, эффективность, репутация вендора. Продукты в этом классе делятся на кластерные, горизонтально-масштабируемые и вертикально-масштабируемые системы, системы с монолитной и федеративной архитектурой.
У систем старшего класса, обладающих специфическими характеристиками и востребованных в основном крупными компаниями-заказчиками, такими как финансовые организации, есть несколько ключевых отличий. Во-первых, это солидная история развития архитектур, микрокода и технологий данных решений, во-вторых, связанная с этим очень высокая надежность.
Надежность СХД старшего класса обусловлена не только отказоустойчивостью самого решения, архитектурой с резервированием контроллеров, блоков питания и других компонентов, но и развитой поддержкой и экосистемой. Наконец, старший класс – это сложившиеся традиции разработки и использования решений. Такие системы можно сравнить с мейнфреймами в мире серверов.
Еще одна особенность: старший класс консервативен. Инновации внедряются в подобных системах позднее, чем в других решениях хранения. Они должны быть хорошо «обкатаны» на реальных приложениях и не приносить никаких сюрпризов.
Доли мирового рынка вендоров внешних систем хранения данных корпоративного класса в первом квартале 2016 г. в денежном выражении (по данным IDC). Совокупная доля Dell-EMC в результате слияния превышает 25%.
Так меняется с годами, согласно отчетам IDC, расстановка сил на рынке внешних СХД в регионе EMEA.
В настоящее время многие функции и характеристики систем разных классов перекрываются, и то, что относится сегодня к старшему классу, завтра окажется в среднем, а системы среднего класса будут аналогичны будущим массивам начального уровня. По спектру функций системы старшего и среднего класса в настоящее время практически эквивалентны. Настройка параметров качества обслуживания (QoS), снимки данных, сжатие и дедупликация, удаленная репликация – все эти возможности сегодня предлагает средний класс. А же виртуализация СХД и флэш-память меняют принятые в архитектуре систем хранения подходы.
СХД среднего класса уже стали настолько емкими и производительными, что ресурсов такой системы достаточно для 99% задач, исключая, разве что, крупные СУБД. В целом тенденция такова, что все меньше остается ситуаций, когда по соображениям надежности или по иным причинам выгоднее использовать мощную СХД старшего класса. И это один из факторов продолжающегося сужения рынка «старшеклассников».
Конечно, старший класс будет развиваться, технологии продолжают совершенствоваться. Консолидированная архитектура удобна. Это многоконтроллерные системы с распределенной архитектурой, и есть заказчики, приложения, которым такая консолидированная система действительно необходима. Однако их относительно немного, да и вендоров СХД старшего класса, если исключить OEM-решения, на рынке единицы.
Какой должна быть СХД?
При выборе СХД сегодня стоит руководствоваться функциональностью, производительностью, ценой и другими характеристиками, но не классами.
В числе «обязательных» требований, предъявляемых к современным системам хранения - малое окно резервного копирования, возможность репликации данных между площадками для аварийного восстановления (Disaster Recovery, DR), поддержка «снимков данных» (snapshot), причем не только для создания полных резервных копий, но и для инкрементного резервного копирования с сохранением изменений, а также простой интерфейс управления с возможностью генерации отчетов и выявления тенденций, анализа использования ресурсов, в том числе в виртуальной среде. Более развитые функции:
- Унифицированный файловый и блочный доступ: возможность поддержки файлового и блочного хранения с единым интерфейсом администрирования (unified storage).
- Кэширование на SSD: флэш-память используется для кэширования данных массива.
- Тиринг: многоуровневое хранение с автоматической миграцией данных между уровнями. В качестве одного из уровней хранения обычно выступают твердотельные накопители (SSD).
- Поддержка программных интерфейсов VMware и других гипервизоров: упрощает интеграцию массива со средой виртуализации.
- Блочная дедупликация: устраняет избыточные блоки данных и позволяет значительно сократить потребности в емкости хранения.
- Сжатие данных: данные кодируются таким образом, чтобы занимать меньшую емкость. Иногда данные сжимаются «на лету», перед сохранением на диск.
Последние две функции могут способствовать существенному сокращению затрат. По этим параметрам в отчетах Gartner при различных сценариях использования лидируют известные вендоры, однако ежегодно результаты меняются.
Составленный аналитиками Gartner рейтинг СХД среднего класса по результатам их применения в различных сценариях.
В интернете можно также найти различные рейтинги СХД, но следует обратить внимание на методику оценки и спонсора исследования. Подчас результаты выглядят странными.
Один из рейтингов NAS среднего класса.
Средний класс: что и как выбрать?
Системы среднего класса уже давно доминируют на рынке дисковых массивов. По данным аналитиков, на СХД среднего класса приходится около половины продаж систем хранения в мире. Это высококонкурентный сегмент, у заказчиков широкий выбор, и важно найти такое решение, которое по своим возможностям будет максимально соответствовать решаемым задачам.
Что же представляет собой сегодня популярная категория СХД среднего класса, в чем отличие этих решений от систем старшего класса и друг от друга? Например, аналитики Gartner сравнивают СХД среднего класса по следующим критериям: управляемость, надежность, доступность, производительность, снимки данных, репликация, масштабируемость, безопасность, эффективность и экосистема вендора.
Эти системы, с одной стороны, конкурируют с многочисленными массивами младшего класса, с другой – с системами корпоративного уровня. По типу подключения это могут быть массивы iSCSI, Fibre Channel (FC) и сетевые хранилища (network-attached storage, NAS) емкостью до сотен терабайт. Диапазон цен – примерно от 20 тыс. до нескольких сотен тысяч долларов.
С увеличением вычислительной мощности процессоров и появлением флэш-памяти средний класс сначала стал конкурировать со старшими СХД по производительности. Этому способствовала и более простая двухконтроллерная архитектура, отсутствие распределенной кэш-памяти, более простой и быстрый код по сравнению с продуктами старшего класса.
По функциональности данные системы также соперничают со старшими собратьями. Например, давно не редкость – поддержка репликации и снимков данных, ранее свойственная старшеклассникам. В результате средний класс расширяет свой рынок - как в сторону младших, так и в сторону старших систем.
Системы среднего класса существенно различаются по своей архитектуре, масштабируемости, расширяемости и функциональности.
Магический квадрант Gartner по вендорам дисковых массивов среднего класса.
Традиционно это двухконтроллерные системы, причем контроллеры работают в режиме «active-active», обеспечивая высокую доступность системы. Как правило, заменой контроллеров на более новые можно повысить производительность дискового массива, причем у ряда СХД такой апгрейд даже не требует остановки системы. Впрочем, у некоторых массивов поднять производительность можно и без замены контроллеров – добавив кэш-память.
Двухконтроллерные массивы значительно отличаются по возможностям наращивания производительности в IOPS, пропускной способности и емкости, и это важно учитывать, чтобы в будущем избежать сюрпризов.
Полезно также узнать о будущих планах вендора, как скоро он собирается обновить поколение своих продуктов, на развитии каких технологий фокусирует внимание, и не идут ли эти планы вразрез с вашими целями.
Масштабируемость системы
В том, что касается масштабирования массива, нужно принимать во внимание следующее:
- Какие еще компоненты, кроме контроллеров, потребуют замены, и во сколько это обойдется.
- Что представляют собой конфигурации с разными контроллерами.
- Какая емкость кэш-памяти в разных конфигурациях, каково число процессоров, число и типы портов.
Все это характеризует масштабируемость СХД. А масштабируемостью двухконтроллерные системы, как правило, не блещут. По этой причине в отрасли наблюдается тенденция перехода от вертикально масштабируемых (scale-up)p двухконтроллерных решений к многоузловым горизонтально масштабируемым (scale-out) архитектурам, которые можно наращивать простым добавлением узлов. Причем в сегменте сетевых хранилищ (NAS) наблюдается еще более быстрый переход на горизонтально масштабируемые архитектуры, чем в сегменте систем с блочным доступом (SAN).
В отличие от вертикально масштабируемых систем системы с горизонтальным масштабированием позволяют избежать замены оборудования и наращивать емкость хранения как пул виртуализированных ресурсов, сохраняя инвестиции.
Ведущие продукты NAS уже представляют собой не двухконтроллерные системы, а многоузловые конфигурации (multinode). Это дает возможность создавать более экономичные инфраструктуры хранения данных, легко адаптируемые к новым требованиям по производительности.
Многоузловые NAS дают возможность легко наращивать емкость и производительность добавлением узлов.
То же самое, хотя и более медленными темпами, происходит в сегменте дисковых массивов среднего класса с блочным доступом. Крупные вендоры сейчас предлагают как двухконтроллерные, так и горизонтально масштабируемые конфигурации.
Поддержка протоколов
Нужно понять, должен ли новый дисковый массив поддерживать блочный доступ, или предпочтительнее работа с файлами – доминирующим типом контента на современных предприятиях. Если требуется поддержка баз данных и систем обработки транзакций (OLTP), то предпочтительнее блочный доступ. Он необходим также, если нужно выделять ресурсы хранения данных серверам.
Перед блочными системами хранения иногда устанавливают шлюз NAS с поддержкой файловых протоколов CIFS и NFS, но такая конфигурация не только потребует покупки и обслуживания дополнительной системы, но и может привести к появлению узких мест, поскольку для доступа к файлам на основной системе потребуется пропускать через шлюз весь трафик CIFS и NFS.
Альтернатива – выбор так называемой унифицированной СХД, поддерживающей как файловый, так и блочный доступ (протоколы FC и iSCSI). Подобный подход вендоры практикуют уже не один год, и он набирает популярность. Это отражает тенденцию поддержки в системах среднего класса большего количества протоколов.
Архитектура унифицированных систем хранения данных поддерживает протоколы файлового и блочного доступа.
Например, можно начать с iSCSI, а позднее перейти на Fibre Channel, Fibre Channel over Ethernet (FCoE), пока что мало популярный у отечественных заказчиков, или протоколы работы с файлами. Однако нужно иметь в виду, что по поддержке протоколов современные массивы существенно различаются.
Системы среднего класса должны поддерживать как высокопроизводительные диски SAS, так и более медленные, но емкие накопители SATA или NearLine SAS в одном шасси или полке. Причем HDD, равно как вентиляторы и блоки питания, должны предусматривать горячую замену.
Высокая доступность и надежность системы
И снова о надежности. Емкость массивов среднего класса масштабируется до сотен терабайт, и большое значение приобретает бесперебойность работы таких систем. СХД не должна иметь единой точки отказа, а все критичные компоненты должны быть заменяемы в горячем режиме. На уровень доступности систем влияют также возможность обновления прошивки без ее останова, возможность «отката» при выявлении проблем в обновленном ПО. Конечно, важны функции самодиагностики – массив должен уметь выявлять возникающие проблемы и корректировать те, которые поддаются устранению (self-healing).
Отказы дисковых накопителей – наиболее частое явление, поэтому важна поддержка RAID. В дата-центрах часто используется RAID 5. Это требует только одного дополнительного диска, но е защищает от отказа HDD в процессе перестроения RAID. Такую защиту обеспечивает RAID 6 – система выдержит отказ двух накопителей. Производительность RAID 6 сильно зависит от реализации – программной, микропрограммной или с использованием специализированных микросхем (ASIC).
Техническая поддержка и гарантия не менее важны, чем сам продукт, ведь СХД хранит терабайты корпоративных данных. При проактивной поддержке массив автоматически сообщает вендору о потенциальной проблеме. Но лучше всего, если надежность заложена в саму архитектуру. На этом стоит остановиться подробнее.
Федерация СХД
Несмотря на высокую надежность СХД старшего класса, по этому показателю с ними может вполне поспорить федерация массивов среднего класса. Федерация – это группа СХД. Она позволяет консолидировать инфраструктуру хранения так, чтобы та функционировала как единое целое. Хотя каждая отдельная система среднего класса (как правило, двухконтроллерная) уступает старшей СХД по надежности, федерация систем хранения с возможностью переноса рабочей нагрузки между системами в виртуализированных и облачных вычислительных средах без прерывания работы приложений сопоставима с ней по данному показателю.
Более того, федерация СХД среднего класса надежнее и в общем случае дешевле монолитной системы хранения старшего класса. Еще одна особенность – меньший риск обновления прошивки в федерации массивов. Ее можно опробовать на одном узле, не ставя под угрозу всю инфраструктуру хранения данных. Значительно снижается вероятность простоя из-за ошибок администрирования.
Учитывая высокую стоимость СХД старшего класса, федерация массивов может потягаться со старшим собратом и по этому параметру. ТСО у фермы систем среднего класса обычно ниже, чем у старшей СХД. Те заказчики, для кого важен фактор стоимости, обращают внимание на «облако» из массивов среднего класса. Не случайно старшие СХД – редкое явление в ЦОД провайдеров, которым нужно минимизировать стоимость сервисов.
Технологии для экономии
Все больше дисковых массивов поддерживает динамическое выделение емкости (Thin Provisioning) в том или ином исполнении. Это позволяет выделять пользователям или приложениям большие виртуальные тома, а затем по мере надобности отводить под них физические ресурсы, тем самым избегая необходимости сразу закупать большую емкость.
Сейчас в младшие модели СХД переносятся автоматические классификация и перемещение данных между разными типами дисков (tiering). Эта технология позволяет заметно сэкономить на стоимости емкости хранения и увеличить производительность системы. Еще одна важная функция - снимки данных. Ввиду ограниченных бюджетов на резервное копирование технология мгновенных снимков часто применяется как замена резервному копированию. Благодаря этому пользователи могут быстро восстанавливать утраченные или удаленные файлы.
При создании «тонких клонов» данных (Thin Clones) физическая емкость нужна только для записи измененных данных. Это часто используется при создании клонов виртуальных машин. Такие технологии могут дать значительную экономию.
Сжатие данных и дедупликация данных также помогут получить максимальную отдачу от инвестиций в СХД, особенно при хранении образов виртуальных машин.
На затраты влияют также простота управления/администрирования СХД, удобство ее обслуживания. Это сводит к минимуму потребность в обучении специалистов или найме администраторов с соответствующей квалификацией.
При выборе дискового массива нужно учитывать не только текущие, но и будущие и скрытые расходы. Часто, например, сжатие или дедупликация – платные опции, лицензируемые по устройствам или по емкости. Не помешает и четкое понимание стоимости поддержки на протяжении жизненного цикла решения. У некоторых вендоров она со временем увеличивается.
Флэш-массивы: революция SSD
Данные – основа успешной конкуренции. Способность ускорить механизмы хранения данных, их анализа и защиты может дать реальные преимущества. Вот почему заказчики ускоренными темпами переходят на флэш-системы.
Обязательным требованием становится поддержка в СХД среднего класса флэш-накопителей SSD. Хотя такие накопители уже стали мейнстримом, не стоит забывать, что в разных продуктах их поддержка реализована по-разному. Чаще всего SSD – это отдельный том, который служит для хранения активных (часто используемых) данных. В тиринге эти тома представляют уровень с самым производительным носителем. Однако это не очень эффективный способ использования дорогостоящей флэш-памяти, и SSD в такой конфигурации может не справиться с интенсивным вводом-выводом.
Если SSD применяется в сочетании с автоматизированным тирингом, это снижает требования к емкости флэш-накопителя. В некоторых массивах с HDD на SSD автоматически перемещаются активные данные, в других SSD используется как кэш-память. Независимо от подхода, ключевое средство автоматизированного тиринга – перемещение данных на более гранулярном уровне, чем том (sub-LUN). От степени этой гранулярности непосредственно зависит эффективность тиринга.
Флэш-массивы класса AFA (all-flash array), целиком построенные на флэш-памяти, способствуют трансформации бизнеса заказчиков, и результатом внимания вендоров к реализации приемлемых по цене сервисов данных корпоративного класса стало быстрое развитие ими собственных семейств флэш-массивов. Заказчики могут выбирать разные типы и емкости накопителей SSD, чтобы повысить гибкость конфигурации и оптимизировать развертывание систем хранения. Аналитики Gartner относят к лидерам в сегменте SSD-массивов компании EMC, Pure Storage, IBM и HPE.
HPE объявила недавно о поддержке во всем семействе систем хранения 3PAR StoreServ новых твердотельных накопителей NAND емкостью 7,68 и 15,36 Тбайт. C этими накопителями система HPE 3PAR StoreServ стала самым высокоплотным и масштабируемым массивом AFA в отрасли – теперь она поддерживает до 24 петабайт полезной емкости SSD в одной системе.
Например, за последние 24 месяца плотность хранения данных у флэш-массивов HPE 3PAR выросла в 16 раз, а стоимость хранения гигабайта данных снизилась на 40%. Поддержка новых накопителей SSD стала возможной благодаря двум ключевым технологиям: 3PAR Adaptive Sparing, патентованной технологии 3PAR, обеспечивающей использование SSD любой емкости и, как заявляют в HPE, пятикратное увеличение срока службы носителей, и 3PAR Express Layout для параллельного доступа контроллеров 3PAR к SSD и увеличения пропускной способности.
ПО HPE Recovery Manager Central (RMC) перемещает снимки приложений непосредственно с флэш-памяти 3PAR на вторичное хранилище для резераирования. 3PAR, одна из наиболее известных в отрасли флэш-платформ, поддерживает унифицированный файловый и блочный доступ, а также объектный доступ.
Storage Array Type | 1Q15 | 1Q15 Market SHare |
1Q16 | 1Q16 Market Share |
1Q16 YoY Growth |
All-flash Array (AFA) | $109,90 | 6% | $215,80 | 13% | 96% |
All hard disk drive (HDD) | $928,60 | 54% | $710,80 | 43% | -23% |
Hybrid flash array (HFA) | $685,70 | 40% | $713,20 | 43% | 4% |
Grand total | $1 724,20 | 100% | $1 639,81 | 100% | -5% |
По данным IDC, внешние флэш-массивы AFA – сама быстрорастущая категория массивов. В первом квартале продажи таких систем на рынке EMEA выросли на 96% год к году.
Стандартизация и SDS
При разработке дисковых массивов сегодня большинство вендоров ориентируются на применение компонентов, выпускаемых для серверов стандартной архитектуры. Эта стандартизация позволяет избавиться от больших затрат, связанных с разработкой и производством специализированных микросхем (ASIC) и сосредоточиться на программно-реализуемых функциях, которые можно будет перенести на процессоры Intel следующего поколения.
Задавать пути дальнейшего развития систем хранения данных будет программное обеспечение. В настоящее время многие исследуют возможности программно-конфигурируемых систем хранения (software-defined storage, SDS). Рост вычислительной мощности серверов x86 и перенос ключевых функций на уровень ПО стали основой для развития SDS. За функции хранения и управления данными в этих решениях отвечает программное обеспечения, функционирующее на базе стандартных компонентов вычислительных сред (серверов, дисковых полок расширения, коммутаторов, контроллеров и т.д.).
Главная их особенность – отсутствие специализированных аппаратных средств, обеспечивающих реализацию отдельных функций. На сегодня можно выделить несколько классов программно-ориентированных СХД: программно-аппаратные решения, повторяющие архитектуру классических массивов; независимое ПО для построения решений на базе серверов x86; объектные хранилища данных; Hadoop-совместимые хранилища; системы виртуализации ресурсов хранения данных.
Программно-конфигурируемые (или программно-определяемые) СХД обладают более низкой производительностью по сравнению со специальными архитектурами и значительной задержкой при передаче данных, однако их можно оптимизировать под конкретную нагрузку. Внедрение флэш-памяти, в свою очередь, заставляет пересматривать архитектуру СХД и менять подходы к защите данных.
Виртуализация
Возможности современных СХД позволяют использовать их как основу для построения виртуальных сред. Кроме того, в настоящее время принципы серверной виртуализации находят применение на уровне хранения данных. Это принцип равноправия узлов (нет «виртуализатора» хранения с присущими ему ограничениями, определяющего предельные показатели производительности и надежности), высокая горизонтальная масштабируемость (до петабайт данных и миллионов IOPS). Настоящая виртуализация без посредника (контроллера виртуализации) – это единое эластичное облако с онлайновой миграцией нагрузки, совокупность механизмов общения равноправных узлов с единым централизованным управлением.
СХД Dell XC с ПО Nutanix - решение многоуровневого хранения для виртуальных машин (ВМ). Каждый узел в кластере XC содержит управляющую ВМ (Controller VM, CVM) с программным обеспечением Nutanix. Этот контроллер обслуживает все операции ввода-вывода для гипервизора хоста и всех находящихся на этом хосте ВМ.
Такие решения только начинают появляться. По сути – это та же технология федеративного хранения, где отсутствует виртуализатор для объединения сторонней емкости. Она напоминает облако систем х86 и тысяч ВМ.
Интеграция, конвергенция, гиперконвергенция
С ростом процессорной мощности, широким использованием флэш-памяти, перемещением контроллера «на кристалл» меняется архитектура хранения. СХД превращается в систему х86 с гипервизором, стирается грань между серверами и системами хранения данных. Одни и те же процессоры служат для поддержки функциональности СХД и выполнения бизнес-приложений, а конкретные функции систем хранения реализуются на уровне виртуальных машин.
В качестве решения проблемы упрощения развертывания ИТ-инфраструктуры, сокращения издержек на ее обслуживание и ускорения внедрения приложений давно рассматривают интегрированные системы. Что же отличает их от набора оборудования, даже поддерживаемого одним вендором? Прежде всего, простота запуска в работу, оптимизация на аппаратном и программном уровне, единая система управления и мониторинга, эффективная техническая поддержка. Как следствие – высокая производительность и надежность.
Перспективы роста рынка «дискретных» и интегрированных систем по оценке IDC.
Появление таких систем – это переход от создания решения к его покупке. Они не требуют продолжительной разработки программно-аппаратного комплекса, предоставляют заказчику одну «точку входа» для технической поддержки и обслуживания.
Следующим шагом в эволюции ИТ стала конвергентная инфраструктура. Она также позволяет получить интегрированную, оптимизированную для рабочих нагрузок систему, протестированную в заводских условиях, однако конвергентные решения возникают на стыке технологий. Это не просто модель продаж, а сплав технологий, что помогает добиться от ИТ-инфраструктуры максимальной отдачи.
Аналитики IDC прогнозируют 65% среднегодовой рост рынка гиперконвергентных систем (HCI) и 5,4% рост сегмента интегрированных решений.
Гиперконвергентные системы переводят концепцию конвергенции на следующий уровень. Как правило, это изначально спроектированные как интегрированные системы модульные решения, легко масштабируемые путем добавления модулей. Чем больше узлов добавляется, тем выше производительность вычислений и больше емкость хранения данных. Упрощается не только архитектура, но и администрирование.
Очень важная роль отводится программному обеспечению. Единый интерфейс и высокая степень виртуализации помогают снизить затраты на управление ИТ-средой и стоимость вычислений в целом. ПО отвечает также за широкий спектр функций.
В целом идея создания таких систем состоит в том, чтобы упростить работу ИТ-подразделений, ускорить процессы предоставления ИТ-ресурсов для бизнеса, снизить вероятность ошибок и стоимость владения инфраструктурой за счет максимальной автоматизации и самообслуживания.
Таким образом, гиперконвергентные инфраструктурные решения отличают простота архитектуры, глубина интеграции и наличие единого ПО управления интегрированным стеком, сокращение непроизводительных издержек и упрощенное взаимодействием с вендорами. В мире 79% ИТ-организаций планируют в 2016 году увеличить расходы на конвергентную инфраструктуру, отмечают аналитики 451 Research. По прогнозам экспертов, уже в этом году доля конвергентных систем хранения на рынке СХД достигнет 20%.
Считается, что именно рост спроса на гиперконвергентные системы для дата-центров – одна из главных причин, побудивших компанию Dell к приобретению корпорации EMC. Есть все основания полагать, что такие системы позволят упростить проектирование и развертывание частных облаков, а также управление ими.
Продуктом гиперконвергенции в отрасли систем хранения данных стала, например, интегрированная, сконфигурированная и протестированная система VxRail, созданная VMware и ЕМС на базе vSphere и программно-определяемого хранилища данных Virtual SAN, – конкурент решений Simplivity OmniCube и Nutanix.
VxRail – компактное шасси 2U, включающее четыре сервера и 24 накопителя HDD или SSD, то есть четыре узла. Каждый сервер имеет сдвоенный 10-гигабитный порт для подключения к стоечному коммутатору (ToR), который в комплектацию не входит.
Представленная в феврале 2016 года система объединяет средства виртуализации, вычислительных ресурсов, хранилищ, систему защиты данных. Задача – упростить процессы и снизить риски при реализации проектов виртуализации ресурсов, внедрить на уровне подразделения стандарты работы, характерные для ЦОД.
Масштабировать систему можно от 3 до 64 узлов, причем характеристики будут почти расти линейно. 64 узла в 16 блоках способны поддерживать порядка 3200 виртуальных машин. Никаких внешних массивов и сетей хранения не требуется. Создание внутри такого кластера отказоустойчивых доменов позволит предотвратить потери данных или остановку сервисов.
Конвергентные платформы могут оказаться привлекательным решением для предприятий розничной торговли, банковского сектора и ряда других организаций разного профиля деятельности, компаний с территориально-распределенной структурой. Сохраняя инвестиции в существующую среду VMware, они могут добиться уменьшения сложности и сокращения затрат.
Рост требований к производительности СХД (в IOPS, мегабайтах в секунду, значениях задержки) заставляет вендоров искать новые подходы к созданию оптимальной архитектуры систем хранения данных и наряду с традиционными дисками использовать флэш-память и модули NVDIMM.
Системы хранения будут развиваться как количественно (увеличение емкости дисков, большее число дисков, наращивание кэш-памяти и портов ввода-вывода), так и качественно (функции, характерные для корпоративных систем). Следует также ожидать развития интеграции СХД с облачными сервисами и системами виртуализации. Однако в сложных экономических условиях заказчики самого разного профиля делают свой выбор, исходя их оптимального соотношения цены и функциональных характеристик решений.