Не жертвуйте высокой доступностью за производительность флэш-памяти

Не жертвуйте высокой доступностью за производительность флэш-памяти
Не жертвуйте высокой доступностью за производительность флэш-памяти

Распространение твердотельных накопителей также привело к возрождению архитектуры с одним контроллером - наряду с ее единой точкой отказа. ИТ-специалистам не следует делать ставку на высокую доступность только ради увеличения производительности флэш-памяти.

Поскольку твердотельные накопители на основе флеш-памяти революционизируют отрасль хранения данных, я подумал, что, возможно, стоит взглянуть на сравнение некоторых базовых архитектур систем хранения при смене носителя с вращающихся дисков на твердотельные.

Самая простая архитектура хранения - это, по сути, RAID-контроллер с целью SAN или NAS. Контроллер, будь то специализированное оборудование или стандартный сервер, является единственной точкой отказа. В результате системы с одноконтроллерами были отнесены к очень низкому сегменту рынка дисковых массивов, где они используются малыми и средними предприятиями или для хранения дополнительных копий данных. На обширном рынке СХД доминируют двухконтроллерные модульные массивы, которые автоматически отключаются при отказе одного из контроллеров.

Как ни удивительно, переход на SSD возродил дизайн единоконтроллера в виде монтируемых в стойку твердотельных накопителей, таких как IBM Texas Memory Systems и Astute Networks VISX, а также более многофункциональных систем, таких как S-Class от Nimbus Data. Риск потери данных, присущий дизайну единоконтроллера, может быть допустимым для некоторых приложений, таких как аналитика или VDI с непостоянными рабочими столами, но в подавляющем большинстве случаев мне было бы трудно заплатить 50 000 долларов или более за продукт. это не обеспечивает высокую доступность.

На вопрос о высокой доступности сторонники одноконтроллерных систем обычно рекомендуют пару устройств с синхронной репликацией. Если производитель выполнил свою домашнюю работу и написал механизм аварийного переключения в свои массивы, кластера юниконтроллеров будет достаточно для большинства приложений.

По сути, типичная двухконтроллерная, активная / пассивная модульная система хранения - это то, что специалисты по системам назвали бы кластером общих дисков, во многом похожим на типичный кластер Windows Server. Пара одноконтроллерных систем, реплицирующих данные, представляет собой кластер без общего доступа.

В эпоху дисков юниконтроллеры строились на стандартных серверах, что компенсировало дополнительную стоимость второго набора дисков. Это означало, что конструкции одноконтроллеров, некоторые из которых также обеспечивали некоторую степень горизонтального масштабирования, например массив iSCSI Lefthand и NexentaStor, были проданы тысячами единиц.

Проблема с системами с одноконтроллером в эпоху SSD заключается в том, что флэш-память составляет гораздо более высокую долю стоимости системы хранения, чем дисковые накопители. Фактически, некоторые моноконтроллеры all-flash стоят столько же, сколько конкурирующие системы, которые включают HA.

Я даже слышал, как поставщики предлагают клиентам купить одно флеш-устройство и управлять высокой доступностью с помощью диспетчеров томов хоста или устройств виртуализации хранилища.

Но если вы зеркалируете в диспетчере томов вашего хост-компьютера или синхронно реплицируете с массива, полностью состоящего из SSD, в систему на основе диска, чтобы избежать затрат на две системы, полностью состоящие из SSD, вы отказываетесь от преимущества в производительности, которое дает система all-flash при записи.. Это потому, что запись будет подтверждена вашим приложениям только после того, как они будут записаны как во флеш-память, так и на дисковые системы. Это ограничивает производительность приложения скоростью записи более медленной дисковой системы.

Если вместо этого вы асинхронно реплицируете данные в смешанных системах хранения с помощью программного обеспечения на уровне хоста или приложения, вы превратите простой сбой устройства в полномасштабную катастрофу с соответствующими RPO и RTO. Напротив, отказ устройства в системе с истинной высокой доступностью не приведет к потере данных и, в худшем случае, к задержке переключения при отказе в несколько секунд.

Пользователи и высшее руководство могут смириться с простоями и даже с некоторой потерей производительности перед лицом катастрофы, вызванной внешним событием, таким как торнадо или ураган. Они гораздо меньше понимают, когда их доставляет неудобство из-за проблемы в ИТ-отделе, даже если это была неисправность ключевого оборудования.

Единственное место, где я могу придумать, где реплицирующаяся пара систем с одним контроллером могла бы стать преимуществом, - это кампус колледжа. В колледже, где я работал, у нас было два центра обработки данных на противоположных концах кампуса, соединенных петлей из 128 нитей одномодового волокна. В такой среде пользователь мог разместить по одной системе в каждом центре обработки данных и получить как высокую доступность, так и аварийное восстановление с помощью одной пары реплицирующих массивов, используя преимущества более низкой стоимости систем с одноконтроллером.

Год или два назад скорость была единственным фактором производительности, который волновал людей с системами all-flash; мы были так довольны производительностью, что не заботились о других функциях. Но по мере развития рынка all-flash я все меньше хочу жертвовать такими вещами, как высокая доступность, ради скорости.