Re: [room] безумные (банальные?) идеи

2011-02-16 Пенетрантность Алексей Синицын
16 февраля 2011 г. 0:21 пользователь Денис Черносов
denis0...@gmail.com написал:
 2011/2/15 Алексей Синицын asinitsins...@gmail.com:
 Программисты уже потихоньку понимают что использовать БД удобнее чем plain
 files, и в эту сторону начинается активное движение.

 Я много на эту тему размышлял и пришёл к своему базовому понятийному
 кирпичику, от которого вытанцовываются все остальные выводы. Имя ему -
 контекст.

 См. http://ru.wikipedia.org/wiki/Контекст и особо обратите внимание на 
 строчку:

 Любое событие происходящие в жизни субъекта интерпретируется исходя
 из контекста ситуации отраженной в *памяти* субъекта


 Контекст это хорошо. Но если мы потянем за эту ниточку, то можем
утянуть далеко. Если мы начнём выяснять что такое контекст, то найдём
что это текст, просто относящийся к текущему как внешний. Естественно
попытаться уточнить что такое текст, и тут мы найдём что текст это
дамп информации, которая, в свою очередь является моделью. Модель,
которую строит ЦНС живого организма, то есть, вне нас информации не
существует вообще. А обмен информацией это синхронизация моделей
отдельных людей.

 Любые наши понятия, любые наши действия и особенно ВЗАИМОдействия -
 модельны и контекстны. Память и время на обработку - ограничены. А мир
 - бесконечен.


cite Сначала он находил это забавным. Он изобрел закон, который с
юмором, подобным закону Паркинсона, утверждал, что количество
рациональных гипотез, способных объяснить любое данное явление,
бесконечно. Ему нравилось никогда не испытывать недостатка в
гипотезах. Даже когда все его возможные методы экспериментальной
работы, казалось, заводили в тупик, он знал, что если просто сядет и
повозится с работой достаточно долго, то, конечно же, появится еще
одна гипотеза. И она всегда появлялась. И только месяцы спустя после
того, как он придумал этот закон, начали возникать кое-какие сомнения
по поводу его юмора или полезности. /cite

Роберт М. Пирсиг

 Чем более громоздок и универсален контекст - тем более дороги его
 освоение, поддержка и использование.  Слишком примитивный контекст не
 позволяет реализовать адекватную модель. Бесконечный контекст -
 потребует бесконечной памяти и сведёт на нет все плюсы от его
 использования.

 Истина где-то между, но тысячелетия практики обработки данных
 показывают, что везде, где это возможно - лучше идти по пути
 максимального упрощения модели, требующей соотв. минимального
 контекста. И формализации бизнес-процессов. Плюс механизм расширения
 функционала под каждую конкретную задачу.


 Да. Правильная модель будет минимальными средствами описывать
максимально возможное число явлений. Простота, точность и ёмкость.

 Описывая общие случаи, оставляя частные как информацию личного
характера, не представляющую общего интереса.

 Нуу.., кроме бизнес-процессов. Про это ничего не могу сказать :)
Возможно всё то же самое.

 А запихивать всё подряд в одну кучу - это вообще не решение, если нет
 ответа на вопрос как эти данные будут использоваться. Всё, что я
 прочитал в ваших постах - это, извините, плюшкинство. Пусть лежит на
 всякий случай разный хлам в огромной куче.


 Не совсем. Наверно можно сказать скорее так: мне не нравится большое
количество баз данных в системе, на каждый дигикам по СУБД. Мне
кажется разумной идея свести их в одну. Почти не сомневаюсь что кроме
простой экономии это даст и другие полезные побочные эффекты.

 Формат и объем метаданных - это отражение модели и контекста.
 Индексирование метаданных = выделение контекста. Контекст выделяется
 для облегчения работы с данными, но когда индексы становятся
 сравнимыми по объему с исходными данными - нафиг они не нужны! В
 какой-то момент нужно останавливаться и доставать таблетки от
 жадности.


 В какой то момент дампы (тексты) станут мало нужны и обращения к ним
станут происходить крайне редко. Работа с информацией будет проходить
на уровне метаинформации, содержания. Но это будет нескоро. Думаю я не
доживу.

 В народ идут только достаточно простые НЕуниверсальные контексты,
 привязанные к конкретным задачам.

 Google waves в народ не пошёл, хотя мегамогучая фиговина, стирающая
 грани между большинством протоколов и хранилищ. А электронная почта
 никак не убивается, несмотря на все её очевидные недостатки.


 Ой, видел я эти волны. Может и мощно, но ничего не понятно и всё тормозит.

 Видеохостинг развивается достаточно независимо от календаря. И т.д. и
 т.п. Специализация оказывается дешевле универсализации.


 А потом приходит общая теория, которая включает в себя все предыдущие
как частные случаи :)

 Впрочем, повторно вспоминаю akonadi + strigi. Поставьте в индексацию
 системные файлы и они будут ими индексироваться. Вот только зачем?
 Что вы надеетесь чудесным образом наковырять в служебных файлах?  Если
 у вас есть ответ на этот вопрос - автоматизация уже не проблема... а
 задача. Причём, типовая.


 Ну можно системные и не индексировать. Но на фоне файлопомоек, эти
два-три гигабайта кажутся несущественными.

Re: [room] безумные (банальные?) идеи

2011-02-16 Пенетрантность Денис Смирнов
On Wed, Feb 16, 2011 at 08:45:57PM +0300, Алексей Синицын wrote:

  Наверно тогда лучше так. Мне говорили что база SQL это один файл. Это
 не соответствует? И если сответствует, то что произойдёт если во время
 записи пропадёт питание? Да, мы вроде про домашние устройства, где
 возможно отсутствие ИБП. ФС убиваются в хлам, насколько мне известно,
 не так часто. Чаще теряется часть файлов. Большее количество файлов
 может дать большую устойчивость.

БД бывают разные. Некоторые в одном файле (как sqlite), некоторые в группе
файлов (как постгрес или mysql), некоторые умеют работать на raw disk (как
оракл).

И у них есть свои средства восстановления после сбоев.

  Да, наверно можно базу и на сыром разделе держать, но тогда СУБД так
 или иначе всё равно вынуждена будет выполнять функции ФС. Возможно
 дешевле оставить ФС как носитель.

Для БД которые в одном файле, например, не придется. Потому что им от ФС
нужно очень-очень мало.

-- 
С уважением, Денис

http://mithraen.ru/



signature.asc
Description: Digital signature
___
smoke-room mailing list
smoke-room@lists.altlinux.org
https://lists.altlinux.org/mailman/listinfo/smoke-room

Re: [room] безумные (банальные?) идеи

2011-02-16 Пенетрантность Алексей Синицын
16 февраля 2011 г. 3:05 пользователь Денис Смирнов
mithr...@freesource.info написал:
 On Wed, Feb 16, 2011 at 12:21:21AM +0300, Денис Черносов wrote:

 Истина где-то между, но тысячелетия практики обработки данных
 показывают, что везде, где это возможно - лучше идти по пути
 максимального упрощения модели, требующей соотв. минимального
 контекста. И формализации бизнес-процессов. Плюс механизм расширения
 функционала под каждую конкретную задачу.

 ППКС.


 Простота и пустота не одно и то же.

 Когда простая модель описывает многое - это очень ценная модель.
Когда модель описывает один частный случай - такая модель мало стоит
независимо от её сложности.

 Формат и объем метаданных - это отражение модели и контекста.
 Индексирование метаданных = выделение контекста. Контекст выделяется
 для облегчения работы с данными, но когда индексы становятся
 сравнимыми по объему с исходными данными - нафиг они не нужны! В
 какой-то момент нужно останавливаться и доставать таблетки от
 жадности.

 Иногда индексы нужны даже если их объем существенно превышает объем
 данных.

 Суть индекса в получении _быстрого_ ответа. И потому требования к нему
 зависят исключительно от используемых процессов, и могут быть никак не
 связаны с размером данных.


 Индексы нужны хотя бы потому, что это, как верно замечено выше,
метаинформация.

 То есть, модель более общего характера, что очевидно более ценно. И с
чем манипуляции будут происходить более эффективно.

 Google waves в народ не пошёл, хотя мегамогучая фиговина, стирающая
 грани между большинством протоколов и хранилищ. А электронная почта
 никак не убивается, несмотря на все её очевидные недостатки.

 Google waves не пошел потому что неочевиден. Гугль не смогли создать
 простые и эффективные usecases.


 Во! Например, я, как простой нормальный человек, посмотрел и
ужаснулся с этого их чатика. Правда потом мне объяснили, что это у
гугля такие одноклассники, что он просто нашёл в социальных сетях один
фатальный недостаток. Но даже после этого я не осилил, впрочем
возможно уже потому что и одноклассниками не пользуюсь.

 Видеохостинг развивается достаточно независимо от календаря. И т.д. и
 т.п. Специализация оказывается дешевле универсализации.

 А в ходе это специализации рождаются универсальные технологии (memcached в
 web -- самый известный пример). Ну или тот же nginx :)


 Да, да! Надо сделать одну базу, в которой будут записи для каждого
файла. И к каждому будет бирка: системный, пользовательский,
музыка, видео, текст, можно несколько бирок. Потом ещё, для
каждого типа опять горсть бирок. Зуб даю, из этого сейчас разовьётся
что нибудь новое и универсальное.

 Говорите такое уже есть? А я могу к этому аконади или к стриги, к
биглю, если он ещё живой, как к бэкенду, подключить проигрыватель
музыки, прсмотрщик изборажений? А что, в случае нескольких
пользователей это опять куча баз у кучи СУБД?

 Впрочем, повторно вспоминаю akonadi + strigi. Поставьте в индексацию
 системные файлы и они будут ими индексироваться. Вот только зачем?
 Что вы надеетесь чудесным образом наковырять в служебных файлах?  Если
 у вас есть ответ на этот вопрос - автоматизация уже не проблема... а
 задача. Причём, типовая.

 Вот формулирование нужных процессов, а также удобный инструмент
 автоматизации их (на уровне пользователь может сконфигурять сам без
 команды крутых спецов с суммарной з/п 50k$/месяц) и есть проблема.


 Такие универсальные вещи можно конфигурять и спецами. Чем
универсальнее, тем шире применение. Ядро под себя уже далеко не каждый
пересобирает, а патчат и того меньше.
___
smoke-room mailing list
smoke-room@lists.altlinux.org
https://lists.altlinux.org/mailman/listinfo/smoke-room

Re: [room] безумные (банальные?) идеи

2011-02-16 Пенетрантность Rinat Bikov
15 февраля 2011 г. 22:30 Денис Смирнов написал:
 БД на многих задачах и так сильно быстрее чем обычные FS. Кроме того в БД
 есть фишки недоступные в FS, например транзакции.
ZFS? С точками восстановления и откатами?
Вроде бы те же самые транзакции :).

-- 
С уважением, Ринат Биков.
___
smoke-room mailing list
smoke-room@lists.altlinux.org
https://lists.altlinux.org/mailman/listinfo/smoke-room

Re: [room] безумные (банальные?) идеи

2011-02-16 Пенетрантность Денис Смирнов
On Wed, Feb 16, 2011 at 10:43:52PM +0300, Rinat Bikov wrote:

RB ZFS? С точками восстановления и откатами?
RB Вроде бы те же самые транзакции :).

Ну ZFS это уже несколько... э... необычная FS. С учетом того что у нее и
LVM свой, и вообще она разве что кофе варить не умеет.

-- 
С уважением, Денис

http://mithraen.ru/



signature.asc
Description: Digital signature
___
smoke-room mailing list
smoke-room@lists.altlinux.org
https://lists.altlinux.org/mailman/listinfo/smoke-room