Дедупликация при архивировании может принести большую пользу, но она не должна быть основным определяющим фактором при выборе системы.
10:15 утра - Дедупликация данных сделала свое первое реальное проникновение на рынок в качестве резервной цели. Он предоставил альтернативу стандартному резервному копированию с диска на диск, что позволило хранить данные в течение более длительного периода времени. Резервное копирование специально предназначено для исключения дублирования из-за большого количества сходных данных в заданиях полного резервного копирования. Но имеет ли смысл дедупликация в архивировании?
Как всегда бывает, то, чем вы закончите это обсуждение, зависит от того, как вы определяете архивирование, как долго вам нужно хранить данные и какова ваша мотивация хранить эти данные.
Устройства с дедупликацией на рынке резервного копирования будут требовать 20-кратного или более эффективного хранения, но большинство лидеров на этом рынке учитывают определенную частоту выполнения полных резервных копий. Как правило, вы можете достичь эффективности только в 4-6 раз между ежедневными дополнительными заданиями. В среднем мы, как правило, наблюдаем эффективность хранения в 12-16 раз при использовании системы дедупликации данных резервного копирования. (В одной из следующих статей мы подробно расскажем о показателях дедупликации резервных копий.)
Сегодня архивация имеет множество вариантов использования, но двумя наиболее распространенными мотивами являются удаление старых данных из основного хранилища для снижения затрат или хранение данных для выполнения требований законодательства или корпоративного управления. В обоих случаях данные специально помещаются на устройство с определенной целью. В обоих случаях это часто уникальные файлы, и, как следствие, количество общности между файлами ограничено - обычно средняя эффективность хранения составляет от 2X до 4X.
Есть исключения, когда эффективность дедупликации может быть довольно высокой в архивном хранилище. Я знаю несколько организаций, которые каждую ночь создают архив своих производственных баз данных, чтобы они могли просматривать эти данные в любой момент времени. Например, для отслеживания торговой активности используется база данных. Им нужна возможность отследить любые несоответствия в торговле или злонамеренные действия в базе данных. Хотя эта база данных получает тысячи обновлений в день, в процентном отношении она не сильно меняется изо дня в день. Используемая ими архивная система может выполнять дедупликацию данных на уровне субфайлов, и, как следствие, эффективность дедупликации в этой системе намного превышает 30X.