Некоторые поставщики заявляют, что масштабируемые системы предназначены для тех, кто думает быстро. Я не согласен.
При выборе общей системы хранения обычно у вас есть два варианта: масштабируемая или горизонтально масштабируемая система. Поставщики, особенно те, у которых есть только горизонтально масштабируемые решения, сразу же заявляют, что все продукты для хранения данных должны быть масштабируемыми, а системы масштабирования предназначены для тех, кто думает на краткосрочной основе. Я не согласен. Масштабируемое хранилище имеет свои преимущества; давайте исследуем некоторые из них.
Классическая проблема увеличения масштаба
Классическая проблема масштабируемого хранилища и проблема, которую, как утверждают, решает масштабируемое хранилище, заключается в том, что в какой-то момент вы столкнетесь с «стеной» с помощью масштабируемого хранилища. Эта стена может заключаться в том, что система не может больше хранить данные из-за нехватки емкости, или может быть, что она не может удовлетворить требования к производительности среды. Как правило, это приводит к покупке дополнительных систем хранения с возможностью масштабирования, что увеличивает затраты на приобретение и управление хранением с каждым разрозненным хранилищем.
Эта стена обычно поражается задолго до того, как у вас заканчиваются физические слоты для жестких дисков. Стена может проявляться, например, когда у системы недостаточно сетевых подключений для обработки входящих запросов к хранилищу, но в большинстве случаев у системы просто не хватает ресурсов ЦП. Ресурсы ЦП потребляются контроллерами хранилища, управляющими чтением, записью и защитой данных, а также типичными службами данных, такими как тонкое выделение ресурсов и моментальные снимки. Преимущество горизонтального масштабирования заключается в том, что по мере увеличения емкости сеть и ЦП добавляются синхронно, сохраняя при этом единую точку управления.
Масштабируемая реальность
В современную эпоху с оптоволоконным каналом 8-16 Гбит / с или подключениями 10-GbE и гибридными или полностью флэш-массивами скорость ввода-вывода должна быть менее важной проблемой, а потребление ЦП должно решаться за счет невысокой стоимости вычислений. власть. Масштабируемая система с соответствующими сетевыми подключениями и вычислительной мощностью должна обеспечивать высокую производительность и емкость.
Решения по масштабированию будут утверждать, что это часть проблемы масштабирования; вы должны покупать все эти лошадиные силы заранее. ЦП относительно дешевы, но ввод-вывод хранилища может быть дорогим. Но после того, как вы сделали эти вложения, масштабирование обычно становится более эффективным вариантом. Корпуса для дисков - это все, что нужно с этого момента. Один мощный ЦП со временем становится дешевле, чем десятки более дешевых ЦП в узлах хранения.
Преимущество масштабируемого хранилища становится недостатком, поскольку отдельные компоненты - сеть, ЦП, диски - становятся быстрее. Это связано с тем, что, поскольку вы, вероятно, увеличиваете емкость, прежде чем сможете полностью использовать другие ресурсы, в конечном итоге вы получите большой кластер узлов хранения, в котором ресурсы ЦП и сети используются в значительной степени недостаточно.
Ответ "Правильный масштаб"
Масштабируемость системы хранения всегда вызывает беспокойство, но вы также не хотите получить систему хранения с 114 узлами из-за потребности в емкости, когда процессоры и сетевой ввод-вывод простаивают. Ответ для обоих лагерей состоит в том, чтобы предложить более «правильный масштаб» подход.
Для поставщиков масштабируемых данных это означает предоставление более простых средств для добавления дополнительной вычислительной мощности и пропускной способности сети к их системам хранения данных, чтобы их не нужно было покупать заранее. Это должно устранить большую часть проблемы разрастания системы хранения, от которой страдают многие центры обработки данных.
Для горизонтально масштабируемых поставщиков это означает предоставление более плотных узлов хранения с большей емкостью, сетевым вводом-выводом и вычислительной мощностью ЦП на каждую коробку. Это приведет к уменьшению количества узлов и их использованию лучше, что должно значительно снизить долгосрочные затраты.