date:20110216

Re: [room] безумные (банальные?) идеи

2011-02-16 Пенетрантность Алексей Синицын

16 февраля 2011 г. 0:21 пользователь Денис Черносов
denis0...@gmail.com написал:
2011/2/15 Алексей Синицын asinitsins...@gmail.com:
Программисты уже потихоньку понимают что использовать БД удобнее чем plain
files, и в эту сторону начинается активное движение.

Я много на эту тему размышлял и пришёл к своему базовому понятийному
кирпичику, от которого вытанцовываются все остальные выводы. Имя ему -
контекст.

См. http://ru.wikipedia.org/wiki/Контекст и особо обратите внимание на
строчку:

Любое событие происходящие в жизни субъекта интерпретируется исходя
из контекста ситуации отраженной в *памяти* субъекта

Контекст это хорошо. Но если мы потянем за эту ниточку, то можем
утянуть далеко. Если мы начнём выяснять что такое контекст, то найдём
что это текст, просто относящийся к текущему как внешний. Естественно
попытаться уточнить что такое текст, и тут мы найдём что текст это
дамп информации, которая, в свою очередь является моделью. Модель,
которую строит ЦНС живого организма, то есть, вне нас информации не
существует вообще. А обмен информацией это синхронизация моделей
отдельных людей.

Любые наши понятия, любые наши действия и особенно ВЗАИМОдействия -
модельны и контекстны. Память и время на обработку - ограничены. А мир
- бесконечен.

cite Сначала он находил это забавным. Он изобрел закон, который с
юмором, подобным закону Паркинсона, утверждал, что количество
рациональных гипотез, способных объяснить любое данное явление,
бесконечно. Ему нравилось никогда не испытывать недостатка в
гипотезах. Даже когда все его возможные методы экспериментальной
работы, казалось, заводили в тупик, он знал, что если просто сядет и
повозится с работой достаточно долго, то, конечно же, появится еще
одна гипотеза. И она всегда появлялась. И только месяцы спустя после
того, как он придумал этот закон, начали возникать кое-какие сомнения
по поводу его юмора или полезности. /cite

Роберт М. Пирсиг

Чем более громоздок и универсален контекст - тем более дороги его
освоение, поддержка и использование. Слишком примитивный контекст не
позволяет реализовать адекватную модель. Бесконечный контекст -
потребует бесконечной памяти и сведёт на нет все плюсы от его
использования.

Истина где-то между, но тысячелетия практики обработки данных
показывают, что везде, где это возможно - лучше идти по пути
максимального упрощения модели, требующей соотв. минимального
контекста. И формализации бизнес-процессов. Плюс механизм расширения
функционала под каждую конкретную задачу.

Да. Правильная модель будет минимальными средствами описывать
максимально возможное число явлений. Простота, точность и ёмкость.

Описывая общие случаи, оставляя частные как информацию личного
характера, не представляющую общего интереса.

Нуу.., кроме бизнес-процессов. Про это ничего не могу сказать :)
Возможно всё то же самое.

А запихивать всё подряд в одну кучу - это вообще не решение, если нет
ответа на вопрос как эти данные будут использоваться. Всё, что я
прочитал в ваших постах - это, извините, плюшкинство. Пусть лежит на
всякий случай разный хлам в огромной куче.

Не совсем. Наверно можно сказать скорее так: мне не нравится большое
количество баз данных в системе, на каждый дигикам по СУБД. Мне
кажется разумной идея свести их в одну. Почти не сомневаюсь что кроме
простой экономии это даст и другие полезные побочные эффекты.

Формат и объем метаданных - это отражение модели и контекста.
Индексирование метаданных = выделение контекста. Контекст выделяется
для облегчения работы с данными, но когда индексы становятся
сравнимыми по объему с исходными данными - нафиг они не нужны! В
какой-то момент нужно останавливаться и доставать таблетки от
жадности.

В какой то момент дампы (тексты) станут мало нужны и обращения к ним
станут происходить крайне редко. Работа с информацией будет проходить
на уровне метаинформации, содержания. Но это будет нескоро. Думаю я не
доживу.

В народ идут только достаточно простые НЕуниверсальные контексты,
привязанные к конкретным задачам.

Google waves в народ не пошёл, хотя мегамогучая фиговина, стирающая
грани между большинством протоколов и хранилищ. А электронная почта
никак не убивается, несмотря на все её очевидные недостатки.

Ой, видел я эти волны. Может и мощно, но ничего не понятно и всё тормозит.

Видеохостинг развивается достаточно независимо от календаря. И т.д. и
т.п. Специализация оказывается дешевле универсализации.

А потом приходит общая теория, которая включает в себя все предыдущие
как частные случаи :)

Впрочем, повторно вспоминаю akonadi + strigi. Поставьте в индексацию
системные файлы и они будут ими индексироваться. Вот только зачем?
Что вы надеетесь чудесным образом наковырять в служебных файлах? Если
у вас есть ответ на этот вопрос - автоматизация уже не проблема... а
задача. Причём, типовая.

Ну можно системные и не индексировать. Но на фоне файлопомоек, эти
два-три гигабайта кажутся несущественными.

Re: [room] безумные (банальные?) идеи

2011-02-16 Пенетрантность Денис Смирнов

On Wed, Feb 16, 2011 at 08:45:57PM +0300, Алексей Синицын wrote:

Наверно тогда лучше так. Мне говорили что база SQL это один файл. Это
не соответствует? И если сответствует, то что произойдёт если во время
записи пропадёт питание? Да, мы вроде про домашние устройства, где
возможно отсутствие ИБП. ФС убиваются в хлам, насколько мне известно,
не так часто. Чаще теряется часть файлов. Большее количество файлов
может дать большую устойчивость.

БД бывают разные. Некоторые в одном файле (как sqlite), некоторые в группе
файлов (как постгрес или mysql), некоторые умеют работать на raw disk (как
оракл).

И у них есть свои средства восстановления после сбоев.

Да, наверно можно базу и на сыром разделе держать, но тогда СУБД так
или иначе всё равно вынуждена будет выполнять функции ФС. Возможно
дешевле оставить ФС как носитель.

Для БД которые в одном файле, например, не придется. Потому что им от ФС
нужно очень-очень мало.

--
С уважением, Денис

http://mithraen.ru/

signature.asc
Description: Digital signature
___
smoke-room mailing list
smoke-room@lists.altlinux.org
https://lists.altlinux.org/mailman/listinfo/smoke-room

Re: [room] безумные (банальные?) идеи

2011-02-16 Пенетрантность Алексей Синицын

16 февраля 2011 г. 3:05 пользователь Денис Смирнов
mithr...@freesource.info написал:
On Wed, Feb 16, 2011 at 12:21:21AM +0300, Денис Черносов wrote:

ППКС.

Простота и пустота не одно и то же.

Когда простая модель описывает многое - это очень ценная модель.
Когда модель описывает один частный случай - такая модель мало стоит
независимо от её сложности.

Иногда индексы нужны даже если их объем существенно превышает объем
данных.

Суть индекса в получении _быстрого_ ответа. И потому требования к нему
зависят исключительно от используемых процессов, и могут быть никак не
связаны с размером данных.

Индексы нужны хотя бы потому, что это, как верно замечено выше,
метаинформация.

То есть, модель более общего характера, что очевидно более ценно. И с
чем манипуляции будут происходить более эффективно.

Google waves не пошел потому что неочевиден. Гугль не смогли создать
простые и эффективные usecases.

Во! Например, я, как простой нормальный человек, посмотрел и
ужаснулся с этого их чатика. Правда потом мне объяснили, что это у
гугля такие одноклассники, что он просто нашёл в социальных сетях один
фатальный недостаток. Но даже после этого я не осилил, впрочем
возможно уже потому что и одноклассниками не пользуюсь.

А в ходе это специализации рождаются универсальные технологии (memcached в
web -- самый известный пример). Ну или тот же nginx :)

Да, да! Надо сделать одну базу, в которой будут записи для каждого
файла. И к каждому будет бирка: системный, пользовательский,
музыка, видео, текст, можно несколько бирок. Потом ещё, для
каждого типа опять горсть бирок. Зуб даю, из этого сейчас разовьётся
что нибудь новое и универсальное.

Говорите такое уже есть? А я могу к этому аконади или к стриги, к
биглю, если он ещё живой, как к бэкенду, подключить проигрыватель
музыки, прсмотрщик изборажений? А что, в случае нескольких
пользователей это опять куча баз у кучи СУБД?

Вот формулирование нужных процессов, а также удобный инструмент
автоматизации их (на уровне пользователь может сконфигурять сам без
команды крутых спецов с суммарной з/п 50k$/месяц) и есть проблема.

Такие универсальные вещи можно конфигурять и спецами. Чем
универсальнее, тем шире применение. Ядро под себя уже далеко не каждый
пересобирает, а патчат и того меньше.
___
smoke-room mailing list
smoke-room@lists.altlinux.org
https://lists.altlinux.org/mailman/listinfo/smoke-room

Re: [room] безумные (банальные?) идеи

2011-02-16 Пенетрантность Rinat Bikov

15 февраля 2011 г. 22:30 Денис Смирнов написал:
 БД на многих задачах и так сильно быстрее чем обычные FS. Кроме того в БД
 есть фишки недоступные в FS, например транзакции.
ZFS? С точками восстановления и откатами?
Вроде бы те же самые транзакции :).

-- 
С уважением, Ринат Биков.
___
smoke-room mailing list
smoke-room@lists.altlinux.org
https://lists.altlinux.org/mailman/listinfo/smoke-room

Re: [room] безумные (банальные?) идеи

2011-02-16 Пенетрантность Денис Смирнов

On Wed, Feb 16, 2011 at 10:43:52PM +0300, Rinat Bikov wrote:

RB ZFS? С точками восстановления и откатами?
RB Вроде бы те же самые транзакции :).

Ну ZFS это уже несколько... э... необычная FS. С учетом того что у нее и
LVM свой, и вообще она разве что кофе варить не умеет.

-- 
С уважением, Денис

http://mithraen.ru/



signature.asc
Description: Digital signature
___
smoke-room mailing list
smoke-room@lists.altlinux.org
https://lists.altlinux.org/mailman/listinfo/smoke-room

Re: [room] безумные (банальные?) идеи

Re: [room] безумные (банальные?) идеи

Re: [room] безумные (банальные?) идеи

Re: [room] безумные (банальные?) идеи

Re: [room] безумные (банальные?) идеи

5 matches

Site Navigation

Mail list logo

Footer information