On Wed, Apr 06, 2011 at 08:56:39AM +0300, [email protected] wrote:
> Спасибо Александр и Станислав.
> Мне в голову пришла такая идея: подсчёт md5

Тут могут вылезти некоторые проблемы:
1) подсчет хеша - ресурсоемкая по CPU операция.
2) md5-коллизии (сугубо теоретическая проблема, но тем не менее).
3) могут быть файлы с одинаковым содержимым, но разными именами, они
попадут в одну папку (решается хешированием по содержимому _и_ имени
файла вместе).

Я бы генерировал имена папок в виде UUID-ов и не парился с хешами.

С другой стороны, при использовании хешей можно избавиться от
хранения дибликатов.

-- 
Stanislav


-- 
To UNSUBSCRIBE, email to [email protected]
with a subject of "unsubscribe". Trouble? Contact [email protected]
Archive: http://lists.debian.org/[email protected]

Ответить