Oleksandr Gavenko -> [email protected] @ Thu, 24 Mar 2016 17:52:45 +0200:
>> Но общий принцип прост: чексумма должна храниться, и должна быть такой, >> чтобы при повреждении данных их можно было восстановить. По >> документации, этим свойством обладает, например, RAID-Z у zfs. Он не >> только вылет диска переживает, но и битый бит может восстановить. zfs >> сама по себе проверяет чексуммы (и при чтении тоже), но понятно, что >> узнать "данные побились" и восстановить данные - не одно и то же. >> >> В качестве более простого и надежного решения - база md5sum (если речь >> не идет о намеренном вторжении, то md5 достаточно), и более одной копии >> архива (тут уже речь идет скорее об архиве, а не о бэкапе). Каковые >> копии никогда не втыкаются в один комп (что подразумевает физически >> разные носители). >> >> И, соответственно, если регулярная проверка одной копии показала >> несовпадение md5, эти данные восстанавливаются из другой копии. OG> Не сильно улавливаю разницу между бекапом и архивом. Речь о домашних медийных OG> данных, нужно обеспечить их сохранность пока я жив. OG> Непрерывность доступа не нужна. Раз в пол года втыкаю внешний накопитель. Т.е. OG> даже демон не нужен. Это скорее архив, если ты их не пересматриваешь регулярно. Бэкап - это резервирование актуального состояния, с недолгой историей изменений. Защита от сбоя носителя, атаки и т.п. Подразумевает необходимость быстрого восстановления всего целиком. Плюс защита от случайного удаления в форме восстановления одного файла, если несвоевременность удаления своевременно обнаружена :) Важное условие постановки задачи - потеря небольшого куска работы, чтобы то, что не попало в бэкап, восстанавливать недолго. Поэтому характерное время между бэкапами - ну, неделя максимум, если больше, то это не система резервного копирования, а раздолбайство. Архив - это длительное хранение, где основная задача - получить доступ к единичному объекту данных, созданному, вообще говоря, давно. В норме задача архивирования ставится так, что рабочие материалы туда не попадают, только завершенная работа, и потому архив создается/пополняется не по времени, а по событию. Зато хранится чем дольше, тем лучше. В типичном случае из архива ничего не удаляется, и данные, попавшие в архив, не меняются. Другой график, другое обслуживание носителей. Да и сами носители порой другие, даже в домашних условиях - если носителем бэкапов будет скорее бэкап-сервер, то носителем архива - внешний винт.

