16.02.12 12:39, Alexander Galanin написав(ла):
Грязная работа по разбору уже сделана авторами libzip, а индекс в памяти —
лично мной в fuse-zip. Осталось только смонтировать архив.
Тогда да, распаковка очень проста (если не нужно реверсить строки пока
ещё идёт добавление). Упаковка сложнее.
13.02.12 21:34, Alexey Pechnikov написав(ла):
Кажется, стоит дополнить - разумеется, сжимаются строки ненулевой
длины, но достаточно малые для того, чтобы имело смысл применить
построчное сжатие; скажем, длина строк от 100 до 1000 байт.
Подойдет и вариант поблочного сжатия (например, блоками по
13.02.12 23:01, Alexey Pechnikov написав(ла):
14 февраля 2012 г. 0:01 пользователь Alexander Galanin
a...@galanin.nnov.ru написал:
Раз уж допустимо менять формат входных данных, то почему бы не хранить
информацию в виде россыпи из гзипнутых файлов по N строк?
Чтобы за просто так порвать диск?
15.02.12 21:32, Alexander Galanin написав(ла):
Это смотря как распаковывать. Если распаковщик будет читать Central
Directory, то там в худшем случае надо пробегаться по списку всех
файлов, размер которого линейно зависит от N (по условию). Однако если
считать CentralDir и положить хотя бы в map
10.12.11 20:35, Alex Kicelew написав(ла):
Опаньки. Спасибо, не вник сразу. Не имел раньше дел с питонами.
Зачем вам тогда mocker?
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive:
19.11.11 15:07, Michael Shigorin написав(ла):
On Sun, Nov 06, 2011 at 08:31:09PM +0600, Andrey Rahmatullin wrote:
Какие программы есть на эту тему? Желательно, чтоб можно
было посмотреть список файлов-дубляжей и выборочно удалить
любой из них.
Несколько не в тему. Вместо удаления повторов, я
11.10.11 01:29, Oleksandr Gavenko написав(ла):
Действительно, почему не Mercurial (в качестве файлового хранилища)?
А разве можно в Mercurial (или другой DVCS) вытащить или положить один
файл, без того, чтобы клонировать всё хранилище, со всеми версиями всех
файлов?
В Subversion же можно и
Иван Лох wrote:
On Sat, Apr 02, 2011 at 02:04:59AM +0400, sergio wrote:
А чем плохо плюсование?
У Коперника не было бы шансов. Истина это результат дискуссии, а не
голосования. Зачем нужны аргументы, если можно тупо жать кнопку?
Аргументированно можно возразить. А если ты полностью согласен с
Smagin Vladimir wrote:
gmail не причем. рассылка настроена криво. но посетители утверждают
обратное, мол это почтовики кривые. и еще обсирают с ног до головы при
этом.
Припозднилась весна в этом году.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of
Paul Carroty wrote:
ЧЯДНТ?
Открываете новую тему, отвечая на сообщение в другой ветке.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive:
Иван Лох wrote:
Много советских фильмов где, вообще, не понятно
кому они принадлежат.
Эти непонятно кто и будут рвать больше всех.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive:
Alexander Shulgin wrote:
2011/2/24 Andrey Rahmatullin w...@wrar.name:
Где это вообще используется?
Очень помогает решать лингвистические вопросы типа пузо, железо
(слова, оканчивающиеся на -зо). С помощью grep-а, естественно.
Я что совсем один такой? :)
Нет. Использовал для нахождения
Alexander Krasnitskiy wrote:
Кто что посоветует из детских игрушек? На возраст от 3-х лет. gcompris
стоит, что то из него нравится, до чего то еще не доросли. ktuberling
(Potato Guy) и gamine тоже стоят и используются, но особого восторга не
вызывают. Что еще есть? Обязательное требование -
Aleksey Cheusov wrote:
Задача. В зависимости от некоторых условий необходимо вызвать команду с
дополнительными аргументами или без них. Например:
В самых сложных и запутанных случаях помогает shquote, который ниже
и eval. Решение -- самое общее и переносимое на любой POSIX и даже
недо-POSIX
Oleksandr Gavenko wrote:
Cygwin портит аргументы после вызова программ зависимых от cygwin1.dll
(поведение зависит от значения перем. огруж. CYGWIN), вроде как до main.
Это вынужденные костыли, не нужно винить Cygwin за его помощь убогим. Любая
программа под WinDos вынуждена сама портить свои
Здравствуйте.
Прошу прощения за такой элементарный и не совсем тематический вопрос, но это
наиболее компетентная группа, которую я сейчас читаю.
Задача. В зависимости от некоторых условий необходимо вызвать команду с
дополнительными аргументами или без них. Например:
if somecheck
then
Victor Wagner wrote:
Ну во-первых, можно подумать о подстановках вида ${FOO:+--foo ${FOO}}
Это на тот случай если задача ставится так Если перемная FOO не пуста,
подставляем ключик --foo $FOO, иначе не делаем ничего.
Спасибо, вот это -- пойдёт. Только проверка не на FOO, а на вспомогательную
Oleksandr Gavenko wrote:
$ var=--opt arg 'arg-part1 arg2-part2'
$ printarg $var
А printarg -- это откуда?
Еще ограничение POSIX shell:
bash# foo=bar
bash# bar=xxx
bash# echo ${${foo}}
bash: ${${foo}}: bad substitution
или
bash# foo1=xxx
bash# foo2=yyy
bash# var=1
bash#
Peter Pentchev wrote:
On Thu, Oct 28, 2010 at 05:44:31PM +0300, Serhiy Storchaka wrote:
А printarg -- это откуда?
Если не ошибаюсь, Олександр имеет ввиду чего-то вроде:
#!/bin/sh
#
# This trivial utility is hereby placed into the public domain.
while [ $# -gt 0 ]; do
printf '%s\n' $1
Валентин Лоскутов wrote:
Немного не в тему. А почему у меня так не получается?
$ echo $0
/bin/bash
$ echo echo aaa\necho bbb | bash -c 'date ; source /dev/stdin'
Пнд Окт 18 16:44:06 MSD 2010
aaanecho bbb
Мучился не так давно с этим \n, но так и не победил.
$ echo aaa\nbbb
aaa\nbbb
Źmicier wrote:
Подскажите, пожалуйста, как можно заставить bash считать первую
команду из параметров ключа запуска -c а последующие из stdin? Иначе:
как заставить bash -с [command] не завершаться после выполнения, а
ждать ввода?
Для sh - /bin/dash это достигается комбинированием ключей -c и
Artem Chuprina wrote:
Есть у меня некоторая задача, над которой я работаю некоторое время.
Под эту задачу мне надо поставить несколько пакетов. Часть из этих
пакетов нужны только под эту задачу, и по завершении работ их надо
снести. Часть нужны под несколько задач, и их надо снести, когда
Dmitry E. Oboukhov wrote:
s При копировании адреса из айсвисла любым известным мне
s спобосом он попадает в буфер закодированным c URL encoding.
s Неужели это парит только меня, и можно ли это как-нибудь отключить?
я еще помню то время когда было наборот вот это было отвратительно:
Victor Wagner wrote:
Господа, а кто-нибудь в курсе, есть ли сейчас в дистрибутиве вьюер,
способный эффективно работать с большими растровыми картинками?
eog обещают.
Description: Eye of GNOME graphics viewer program
eog or the Eye of GNOME is a simple graphics viewer for the GNOME
desktop
Dmitry Nezhevenko wrote:
Плюс внешний вид Qt/GTK IMHO заметно
приятнее чем тот же Motif или Tk.
Ну сейчас начнётся.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive:
Игорь Чумак wrote:
Taylor конечно авторитет в программировании, раз сколько языков знает ;)
(правда, меня смущает постулат Never invoke 'tr' when 'cat' is
sufficient. Не могу придумать разумный пример). )
Думаю, он имел в виду -vET или -s. Тут я с ним не могу согласиться.
--
To
Dmitry Fedorov wrote:
3 июля 2010 г. 1:52 пользователь yuri.nefedov написал:
On Fri, 2 Jul 2010, Jurij Iljuschko wrote:
cat file.list |
Плохому молодёжь учите.
В скрипте, конечно, котов лучше не дудеть, а вот в однострочнике мне так
удобнее. Просто в процессе отладки после cat может ещё
Denis Feklushkin wrote:
xargs --replace cp template {} file.list
Изменим ТЗ. Пробелы в списке файлов заменить на подчёркивания.
Ещё раз изменим ТЗ. То же, кроме начальных и конечных, их удалить.
И ещё раз изменим ТЗ... И ещё...
--
To UNSUBSCRIBE, email to
yuri.nefe...@gmail.com wrote:
man xargs
что-то типа
cat file.list | xargs --replace cp template {}
(Можно и без replace, но мне так нравится больше.)
This option is deprecated; use -I instead.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of
Dmitry Fedorov wrote:
4 июля 2010 г. 21:38 пользователь Serhiy Storchaka написал:
В скрипте, конечно, котов лучше не дудеть, а вот в однострочнике мне так
удобнее. Просто в процессе отладки после cat может ещё не один фильтр в
конвейер влепиться.
cat - первый в конвейере, а значит file
whereis whoami wrote:
Захотелось удалить evolution, а aptitude предлагает выпилить весь гном,
ибо метапакет. Т.е. куча всякого мне не нужного прибито гвоздями к понятию
гноме-десктоп %) Если ли штатный гвоздодер с надписью debian-way,
разобрать чтобы метапакет этот и зависимости нормальные
Malcolm Reed wrote:
Да. Но можно сделать каталог с правами 0770 принадлежащий более широкой
группе и в нем каталог c правами 0775 принадлежащий более узкой группе,
которой можно писать. Как-то так, кажется.
Вы явно где-то ошиблись.
У внешнего каталога права 0750, у внутреннего -- 0770. Кому
Ed wrote:
Пожалуй и всё пока. Повторюсь, главное - простота и удобство.
Если потребности скромны -- Xdialog/zenity/kdialog. Если посложнее --
посмотреть kommander. Ещё серьёзнее -- Tcl/Tk, придётся нырнуть с головой,
но потом станет просто. Если очень захотеть, то и от вырвиглаза избавиться
Dmitry E. Oboukhov wrote:
есть ли еще способы различить файловые системы?
stat(2), поле stat.st_dev.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive:
Илья wrote:
01.04.10, 17:40, Denis Feklushkin denis.feklush...@gmail.com:
у них там что-то с табуляцией или локализацией и название столбиков
съезжают
Это шняга связана с локализацией, переводчик их на форуме мне сказал, что
их инструмент кажется розета режет концевые пробелы и они
Nicholas wrote:
Serhiy Storchaka wrote:
.mc/ini
ftpfs_use_passive_connections=1
Options | Virtual FS | Use passive mode
Что характерно, по умолчанию включено.
Видимо сам же и правил, и теперь понятно почему:
Проблема все равно осталась - в passive mode соединяется, показывает все
файлы
Nicholas wrote:
Oleg A. Anisimov wrote:
Использую одни и теже логин/пасс в FF и MC:
Браузер, очевидно, использует пассивный режим, в отличие от...
Действительно
.mc/ini
ftpfs_use_passive_connections=1
исправило ситуацию.
Что интересно - когда редактировал .mc/ini через сам mc ,
Павел Марченко wrote:
верно и еще удалить все папки настроек локальных приложений, т.к.
могут быть конфликт версий конфигов
что-то вроде rm -rf /home/%user%/.*
Например .kde или .mozilla-thunderbird, в которых лежит почта.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
Andrey Rahmatullin wrote:
On Tue, Mar 23, 2010 at 11:28:15AM +0300, Anton Kovalenko wrote:
А у вас-то какой?
zsh, какой ещё может быть шелл.
Помимо default city и default os появился default shell?
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of
Павел Марченко wrote:
23 марта 2010 г. 14:32 пользователь Andrey Rahmatullin
w...@altlinux.org написал:
On Tue, Mar 23, 2010 at 02:31:23PM +0200, Serhiy Storchaka wrote:
верно и еще удалить все папки настроек локальных приложений, т.к.
могут быть конфликт версий конфигов
что-то вроде rm
Alexey Pechnikov wrote:
Идейно это распределенная нереляционная база данных:
http://www.fossil-scm.org/index.html/doc/tip/www/theory1.wiki
Любопытно, что But in the case of Fossil, the use of TCL was actually
making the code longer and more difficult to understand. Что они с этим
тиклем делали?
Nicholas wrote:
Использую одни и теже логин/пасс в FF и MC:
в броузере
ftp://login@domain.ru:pass@domain.ru
дает доступ к фтп (и отображает папки и файлы),
а в mc 4.6.1 (.mc/hotlist)
ENTRY domain.ru URL /#ftp://login@domain.ru:pass@domain.ru
коннектится без вопросов, но показывает 0
Dmitry Nezhevenko wrote:
Нет, это то что выдает sizeof(). Туда, например, можно безопасно положить
указатель.
Разве?
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Archive:
Oleksandr Gavenko wrote:
Недавно же стала доступна
The New C Standard. An Economicand Cultural Commentary
http://www.knosof.co.uk/cbook/cbook.html
Очень понравился список в разделе Tools. Особенно первый пункт.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a
Andrey Zhidenkov wrote:
Я как-то хотел написать похожую программу. Основная задача состоит в том,
чтобы определить для какого набора символов есть изображения в файле
шрифта. Какие шрифты вы имеете ввилу - TTF или X11?
Любые. При выборе шрифта для интерфейса, редактора или браузера важна не
Иван Лох wrote:
fc-list -v [pattern]
даст среди прочего
charset:
это и есть именно то, что Вы ищете
Что-то
fc-list -v '*sans*'
даёт нифига.
Или в каком формате шаблон записывается? Мана нет.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of
Иван Лох wrote:
On Sat, Feb 27, 2010 at 11:48:07AM +, Serhiy Storchaka wrote:
Или в каком формате шаблон записывается? Мана нет.
fc-list -v :family=Arial
Но проще взять любой биндинг fontconfig все это есть в API
Все-равно, то что выдает fc-list не очень human friendly
Опытным путём
George Shuklin wrote:
Обнаружил, что очень не хватает хорошего 16-ричного (и вообще,
двоично/бинарного) вьюера, который бы не тащил файлы по 4-8Гб в память
целиком.
biew/hiew/фаровский вьюер и т.д.
Есть что? Если оно будет ещё хорошо масштабироваться (не строго 80
колонок), ей цены не
Artem Chuprina wrote:
Serhiy Storchaka - debian-russian@lists.debian.org @ Thu, 18 Feb 2010
07:54:20 +:
SS Неплохо бы аналогичное и для неустановленных шрифтов из репозитария.
Последнее пожелание особенно изящно...
Желать — так с размахом.
--
To UNSUBSCRIBE, email to debian-russian
Artur G. Sibagatullin wrote:
Если это действительно действующие правила русского языка, то и вопроса
собственно нет. Из этих правил совершенно понятно, где надо обязательно
её писать, а где нет. Во всех остальных случаях кому как нравится так и
пишет. Тогда нормальным выходом я думаю будет
Artem Chuprina wrote:
Serhiy Storchaka - debian-russian@lists.debian.org @ Thu, 18 Feb 2010
12:56:27 +:
SS Неплохо бы аналогичное и для неустановленных шрифтов из
репозитария.
Последнее пожелание особенно изящно...
SS Желать — так с размахом.
Тогда уж сразу и для шрифтов
Alexander GQ Gerasiov wrote:
Thu, 18 Feb 2010 13:00:19 +
Serhiy Storchaka storch...@gmail.com wrote:
Нет уж. Тогда делать два словаря — чтобы можно было отловить
записанные через «е» вместо «ё» (хотя часть таких случаев).
Если есть возможность - да надо. Но пока у нас только один словарь
Как можно узнать, в каких шрифтах содержится определённый символ?
Хотелось бы инструмент, который на входе принимал бы строку символов, а на
выходе давал бы список установленных в системе шрифтов, содержащих каждый
из этих символов, а ещё лучше — и показывал бы строку во всех этих шрифтах
(а то
alexander barakin wrote:
On Tue, Feb 16, 2010 at 07:57:27PM +0300, Artem Chuprina wrote:
это позволяет превысить предел в 4 группы, хотя я
не знаю живых людей, пользующихся более чем тремя
есть такие буквы в этом слове. но больше четырёх и мне не требуется.
поэтому и не экспериментировал с
Victor Wagner wrote:
On 2010.02.17 at 09:12:31 +0300, Artur G. Sibagatullin wrote:
Лично моё мнение. что буква ё -- полноценная буква русского алфавита и
ей надо пользоваться пока она в нём есть. Ею раньше не пользовались
из-за технических проблем при печати, сейчас это не так. Зачем же из
Alexey Pechnikov wrote:
Имя файла - последнее в строке. Так что задача получения имени файла
идентична cut -f$N- возвращает конец строки, включая поле $N
cut -d ' ' -f$N- не сложнее.
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble?
Alexey Pechnikov wrote:
Откуда настойчивое желание вручную всем утилитам разделитель указывать?
По умолчанию таб, пусть таковым и остается, зачем менять-то?
OFS по умолчанию пробел, зачем менять-то?
Откуда у человека, путающегося с пробелами и табуляциями в редакторе,
желание использовать эту
Alexey Pechnikov wrote:
On Monday 15 February 2010 17:35:47 Maxim Nikulin wrote:
Алексей, а в чем проблемы с p7zip-rar? формат вывода вроде тот же, что и
у 7z.
Тогда для обработки rar-архивов придется ставить 7zfull, и ладно бы еще он
свободный был. rar при желании можно и свободный
Alexey Pechnikov wrote:
Интересует размер файла, дата добавления в архив или дата последней
модификации, имя файла в архиве. Для zip,7z, etc. все легко и просто -
вывели список файлов в архве, грепнули, позвали awk и готово. Но вот
rar архив отличился - имя файла выдает _первым_ аргументом, а
Andrey Rahmatullin wrote:
On Sun, Feb 14, 2010 at 04:32:41PM +0200, Serhiy Storchaka wrote:
Можно поиграться локалью и перекодировками. Костыль тот ещё будет. В
любом случае большинство архивов rar сейчас версии 3+, поэтому
unrar-nonfree неприменим.
*unrar-free
Да.
--
To UNSUBSCRIBE
Alexey Pechnikov wrote:
Фантастика! А если в архиве поддиректории есть, возможно в такой же формат
привести?
sed -re '1,/^-+$/d;/^-+$/,$d' \
| while read name read size packed ratio date time attr crc meth ver
do
echo $size $date $time $name
done
Или сразу вместо echo исполнять
Alexey Pechnikov wrote:
awk 'BEGIN {OUT=0} /^-/ {BASE=NR; OUT=!OUT} /^[^-]/ { if (OUT) { if
((NR-BASE)%2) { FILENAME=substr($0,2) } else {print $1, \t, $4, $5,
\t, FILENAME } } }'
Можно и так (только \t лишние). Или короче:
awk '/^-+$/ {OUT+=1; next}
OUT==1 {FILENAME=substr($0,2); getline;
Serhiy Storchaka wrote:
Можно и на чистом sed-е сделать.
sed -nre '1,/^-+$/d;/^-+$/,$d;N;s/ (.*)\n +([0-9]+) +[0-9]+ +[0-9]+%
+([0-9]+-[0-9]+-[0-9]+) +([0-9]+:[0-9]+) .*$/\2 \3 \4 \1/p'
Но на shell или скриптовом языке общего назначения разумеется гибче будет.
--
To UNSUBSCRIBE, email
Alexey Pechnikov wrote:
On Sunday 14 February 2010 20:18:18 Serhiy Storchaka wrote:
Можно и так (только \t лишние).
\t не лишние, поскольку результат еще надо потом разобрать на поля и в
базу сложить. Я там на всякий случай зарезервировал 4 поля на усмотрение
пользователя, ежели кому
Alexey Pechnikov wrote:
On Sunday 14 February 2010 21:36:55 Serhiy Storchaka wrote:
Лишнее, потому что на самом деле разделитель получается \t .
Это только если запятые ставить.
Вот именно.
Если уж так
хочется использовать табуляцию, то OFS=\t (или конкатенация вместо
запятой). Но
Сергей Крайко wrote:
On Fri, 12 Feb 2010 11:12:05 +0300
Mikhail A Antonov b...@solarnet.ru wrote:
Это значит что скрипты, зовущие /bin/sh будут фактически звать dash
вместо bash.
Это понятно. Но меня интересует в терминале какая оболочка будет?
Какая назначена. См. /etc/passwd.
--
To
Alexey Pechnikov wrote:
On Friday 12 February 2010 00:56:45 Serhiy Storchaka wrote:
Если хуже — написать собственный парсер, аналог tidy.
Интересуют готовые решения, я вовсе не планирую для сотен различных
форматов обработчики с нуля писать, это нереально и лишено смысла к тому
же. Вопрос в
Сергей Крайко wrote:
Скажу другими словами:
Сейчас при создании нового пользователя по умолчанию предлагается bash,
что предложит debian 6 - dash или всё же bash
bash
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact
Alexey Pechnikov wrote:
Хм. Мелкое и шустрое, говорите...
Не говорю. Но за три часа прогнало мою библиотеку из 25 тыс. файлов.
Достаточно.
$ time echo|dash
$ time echo|/bin/true
А перловой версии случаем нет, раз уж проект fb2-perl-tools?
Нет. Но для вас ведь не составит труда переписать
Dmitri V. Ivanov wrote:
On Thu, Feb 11, 2010 at 07:29:04PM +0300, Artem Chuprina wrote:
А утилита для открытия файлов, сокетов и прочей фигни называется socat.
Вот это - утилита, которая умеет ровно открыть и поделиться
дескриптором. Но умеет это хорошо. В отличие от.
Спасибо. Интересная
Alexey Pechnikov wrote:
В процессе обработки выяснилось, что библиотеки содержат жуткую смесь
валидных и невалидных документов. Пытаюсь выправить чем-то вроде
exec cat $2 | enconv | sed 's/?xml version=1.0 encoding=.*/?xml
version=1.0 encoding=utf-8?/' | tidy -q -xml -utf8 2/dev/null |
Alexey Pechnikov wrote:
On Saturday 06 February 2010 12:01:25 Serhiy Storchaka wrote:
В идеале программа должна уметь принимать список файлов как из командной
строки, так и из файла или stdin (при указании специального ключа).
poisk-cmdline file1 ... fileN | poisk-files-add
Чем это лучше
Alexey Pechnikov wrote:
On Tuesday 09 February 2010 23:42:08 Serhiy Storchaka wrote:
Десятикратная разница в скорости показывает проблему реализации. Но все
равно непосредственно сам поиск как минимум на два порядка быстрее,
нежели построение фрагмента с найденным текстом.
Это вы
Alexey Pechnikov wrote:
On Wednesday 10 February 2010 20:26:34 Dmitry E. Oboukhov wrote:
AP Покажите задачу, которую решает демонизация процесса.
отвязка от терминала, родителя и каталога запуска?
больше ничем демон от программы вроде не отличается
Это не задача, это средство. А вот для
Alexey Pechnikov wrote:
On Wednesday 10 February 2010 22:41:57 Serhiy Storchaka wrote:
замечу, что снижение цены форка не будем
обсуждать - недавно я уже показывал, что на современном десктопе
легко можно многие тысячи форков в секунду выполнять, что явно
на порядки превосходит
Denis Feklushkin wrote:
Столкнулся с тем что юзернеймы, содержащие / обрезаются до слэша при
логине через ssh и совсем не пускаются при попытке зайти локально (через
su)
Хотел обозвать внесистемных юзеров таким образом: vovan/root, вроде и
kerberos такое одобряет
Из исходников adduser и
Alexey Pechnikov wrote:
$ time find /tmp/* | POISK_DB=DB ./poisk-add-file.tcl
Лучше бы чтение имён файлов из stdin сделать опциональным, при указании
специального ключика.
Сейчас
обрабатываю как xml, с помощью sed заменяя амперсанд (кривой
xml в fb2 - вместо amp; в нем фигачат просто ).
Alexey Pechnikov wrote:
Утилита find в дебиане майм-тип для *.fb2 отдает как application/xml,
так что или верить расширению, или пользоваться универсальным парсером для
xml. В обоих случаях есть свои плюсы и минусы.
The environment variable MAGIC can be used to set the default magic
number
Alexey Pechnikov wrote:
On Tuesday 09 February 2010 15:00:18 Serhiy Storchaka wrote:
Alexey Pechnikov wrote:
Сейчас
обрабатываю как xml, с помощью sed заменяя амперсанд (кривой
xml в fb2 - вместо amp; в нем фигачат просто ).
Такие файлы лучше сразу отвергать.
Эдак мы рискуем
Alexey Pechnikov wrote:
Спасибо, но сейчас у меня задача несколько иная - обеспечить
индексирование оригинального набора документов. _Посоветовать_ исправить -
хорошо, но уж никак не игнорировать. Если по уму, то все не-юникодные
документы следует тоже выбросить, но что же тогда останется...
Константин wrote:
Есть задача: забрать rss с сайта, выдрать из него ссылки на полную
новость (поле link, наск. помню), и отдать их [ссылки] по одной на выход
[вгету с параметрами].
Есть условие: строго консольно, писанины - макс. правка конфига
(предложение написать скрипт и т.д. не
Alexey Pechnikov wrote:
Когда каждый документ будет fb2-файлом, упакованным в zip-архив, то нужно
достать файл из архива, преобразовать в текст и получить найденный
фрагмент - то есть придется немало операций выполнить. Так что идея
открывать _много_ файлов для построения выделенных фрагментов
Константин wrote:
[Для rss2mail тоже, подозреваю, придется нечто руками писать, чего
хотелось бы сильно избежать, но похоже...]
Да, знакомо. Но, как понимаю, там требуется знание питона? Тогда см.
условие выше, ибо питон не знаю.
Ну, в любом случае писать придётся. Немного, несколько
Alexey Pechnikov wrote:
Десятикратная разница в скорости показывает проблему реализации. Но все
равно непосредственно сам поиск как минимум на два порядка быстрее, нежели
построение фрагмента с найденным текстом.
Это вы тестируете когда база закеширована в памяти? На стогигабайтной базе с
Artem Chuprina wrote:
Serhiy Storchaka - debian-russian@lists.debian.org @ Sat, 06 Feb 2010
10:04:19 +0200:
SS Нет-нет. Если это пользовательская утилита, то она должна быть
SS простой в использовании для типичных применений. Указал в кронтабе
SS poisk-scanner /var/www/mysite — и оно
Artem Chuprina wrote:
Serhiy Storchaka - debian-russian@lists.debian.org @ Sat, 06 Feb 2010
09:57:21 +0200:
SS Достаточно -exec poisk-add.
Я тоже сначала так подумал. Но это будет, вообще говоря, другая модель
использования.
В stdin ты ему их сможешь передать сразу все, а через
Можно проверять дату последней модификации файла до вычисления хэша и
определения типа mime. Это значительно ускорит повторное сканирование.
И разве в tcllib нет реализации md5, что дёргается внешний бинарник?
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject
Oleksandr Gavenko wrote:
Если кому интересно имеется официальный документ
по транслитерации из украинского в латиницу:
http://zakon1.rada.gov.ua/cgi-bin/laws/main.cgi?nreg=55-2010-%EFp=1264427739007490
Неплохо. Более-менее фонетично, логично, однозначно. И при этом традиционно
(давно
Alexey Pechnikov wrote:
On Friday 05 February 2010 18:13:24 Serhiy Storchaka wrote:
Можно проверять дату последней модификации файла до вычисления хэша и
определения типа mime. Это значительно ускорит повторное сканирование.
Проверка по mtime имхо совершенно ненадежна, предпочитаю по хэшу
Victor Wagner wrote:
On 2010.02.05 at 18:18:57 +0300, Alexey Pechnikov wrote:
Проверка по mtime имхо совершенно ненадежна, предпочитаю по хэшу.
Зато - быстра. И то недостаточно Вот FBReader при старте делает mtime
всем файлам, которые уже видел, так если его на миррор lib.rus.ec
напустить,
Victor Wagner wrote:
On 2010.02.05 at 17:54:25 +0200, Serhiy Storchaka wrote:
Victor Wagner wrote:
On 2010.02.05 at 18:18:57 +0300, Alexey Pechnikov wrote:
Проверка по mtime имхо совершенно ненадежна, предпочитаю по хэшу.
Зато - быстра. И то недостаточно Вот FBReader при старте делает
Victor Wagner wrote:
On 2010.02.05 at 20:18:19 +0200, Serhiy Storchaka wrote:
Торможение может быть или из-за чтения каталогов (а в таких библиотеках
каждый текст лежит в своём отдельном каталоге), или из-за вызовов stat. С
Там нифига не каждый текст был в отдельном каталоге. Когда я это
Alexey Pechnikov wrote:
А, понял. В таком случае утилиту обработки файлов переименую в poisk-add,
велю ей список файлов принимать на stdin, а poisk-scanner сделаю оберткой.
poisk-scanner-у нужно иметь возможность указать не только, что
индексировать, но и что пропускать. По маске имени, явно
Artem Chuprina wrote:
Alexey Pechnikov - debian-russian@lists.debian.org @ Sat, 6 Feb 2010
00:51:38 +0300:
AP find $@ 2/dev/null | poisk-add $POISKDB
Ох... Вот бы не так топорно, а хотя бы find $@ -print0, и poisk-add
обучить по нуль-символу видеть границу имени файла. Ибо про перевод
Artem Chuprina wrote:
Serhiy Storchaka - debian-russian@lists.debian.org @ Fri, 05 Feb 2010
23:22:07 +0200:
SS poisk-scanner-у нужно иметь возможность указать не только, что
SS индексировать, но и что пропускать. По маске имени, явно указывая
SS пути.
Пусть сделает poisk-add. А poisk
Разве dash распространён за пределами Дебиана?
--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org
Alexey Pechnikov wrote:
On Thursday 04 February 2010 11:29:40 Serhiy Storchaka wrote:
Разве dash распространён за пределами Дебиана?
Не могу сказать. Но запускается он вдвое быстрее, чем bash,
и на обработке большого количества небольших документов
выигрыш при использовании dash весьма
Artem Chuprina wrote:
Alexey Pechnikov - debian-russian@lists.debian.org @ Thu, 4 Feb 2010
16:28:42 +0300:
AP А можете подробнее рассказать? Я не в курсе, что с exec может быть
быстрее.
На самом деле быстрее - вряд ли. Это потеря скорее в памяти. exec -
запуск без fork, с заменой
Alexey Pechnikov wrote:
Recommends и depends нынче эквивалентны. Разве что в Suggests поставить.
От Recommends отказаться можно. От Depends — нет.
Suggests придется ручками доставлять, а мне бы хотелось автоматизма.
Вот sqlite3, насколько я понимаю, можно в Suggests или вообще убрать.
--
Alexey Pechnikov wrote:
On Thursday 04 February 2010 19:43:40 Serhiy Storchaka wrote:
Не только. Вероятно сам fork (за которым потом всё равно следует exec)
всё же дорог. Попробуйте
time seq 1 | xargs -n 1 ./x-c /dev/null /dev/null
и то же с exec в x-c. Разница есть.
Еще какая
Результаты 1 - 100 из 326 matches
Mail list logo