On Wed, Apr 06, 2011 at 08:56:39AM +0300, [email protected] wrote: > Спасибо Александр и Станислав. > Мне в голову пришла такая идея: подсчёт md5
Тут могут вылезти некоторые проблемы: 1) подсчет хеша - ресурсоемкая по CPU операция. 2) md5-коллизии (сугубо теоретическая проблема, но тем не менее). 3) могут быть файлы с одинаковым содержимым, но разными именами, они попадут в одну папку (решается хешированием по содержимому _и_ имени файла вместе). Я бы генерировал имена папок в виде UUID-ов и не парился с хешами. С другой стороны, при использовании хешей можно избавиться от хранения дибликатов. -- Stanislav -- To UNSUBSCRIBE, email to [email protected] with a subject of "unsubscribe". Trouble? Contact [email protected] Archive: http://lists.debian.org/[email protected]

