Доброе!

2014-08-17 19:53 GMT+04:00 rubin.happy <rubin.ha...@gmail.com>:
> По статистике я еще попробую что-нибудь сделать (например, поговорить с
> разработчиком stats.grok.se),

  А что с грок? Просто внешний сервер, который парсит дамп WMF. Это
любой может делать. Вопрос же не к ним. Кстати сейчас модный другой:
http://tools.wmflabs.org/wikiviewstats/

> просто значительная часть того, что нас
> интересует, упирается в конфиденциальность читателей:

  Это такая отмазка, не имеющая под собой оснований. Чтобы убедиться,
нужно выписать виды обычной групповой статистики и задать по каждому
пункту вопрос: Каким конкретно нашим условиям он противоречит и каким
образом.

  Например, групповые отчёты по:
- количество хостов/идентифицированных посетивших страницу (а не
хитов, как всю дорогу демонстрируют)
- конкретный урл, с которого юзер зашёл на страниц (а не просто домен,
по которому найти урл где на нас стоит ссылка не составляет труда, но
это лишние танцы с бубнами)
- пути по сайту (точки входа, переходы, точки выхода)
- страны из которых заходили на проект
- браузеры которыми пользуются
... и т.д. просто берёшь гугль аналитик и по списку спрашиваешь...

 Несколько раз в сеть попадали крупные дампы анализа статистики
больших сайтов. Они анонимизируют IP (куки, если есть) на первом этапе
- ставя ему в соответствие некий ID с общими параметрами (страна,
свойства браузера, например язык, и т.д). Далее же они хранят в базе
подробную инфу только по этому ID. Теоретически, имея доступ к базе
теоретически можно деанонимизировать ID, но речь идёт о групповых
отчётах, т.е. если ты смотришь количество ID, посетивших страницу,
деанонимизировать отдельный ID проблематично, аналогично, если
смотреть какие поисковые запросы и сколько ID их делало, также
вытащить кто это был в реальном мире крайне сложно.

  Большую часть из этой информации можно выдавать в дампе
сгруппированных отчётов, но в идеале это нужно делать через
собственный интервейс, тогда больше всего можно отразить без опаски
раскрыть информацию о конкретных ID.

> поэтому нам не дадут
> информацию, откуда конкретно пришли на конкретную страницу читатели, куда
> они потом ушли,

  зачем абстракции, нужно задавать конкретные вопросы по каждому
пункту - какому условию это противоречит и каким образом, а если не
противоречит, значит нужно делать

  мне, например, непонятно, как конкретные урлы, с которых к нам
переходили (потому, что на них стоят прямые ссылки), как-то
противоречат нашим условиям...

  если аккуратно анализировать, то получится, что в наших условиях нет
ничего, что бы противоречило созданию практически полнофункциональной
групповой статистики...

> что-то аналитического характера о самих пользователях, и
> многое другое, что могло бы быть интересно.

  Ладно, давай тогда в принципе.
  То что можно сделать сейчас написал выше, а эта часть не для
практических действий - она запросто утонет в обсуждениях, но понимать
её нужно. Может в будущем что-то прорастёт.

  Политика ВМ по конфиденциальности, как впрочем и подавляющего
большинства других проектов, - это обман пользователей и
предоставление им ложного чувства анонимности. Более того, ВМ -
первейший враг анонимности. Но дальше хуже - политика
"конфиденциальности" мало того, что является обманом и самообманом,
она противоречит нашим целям. Обосную.

  Например, я утверждаю, что любой админ Википроекта путём нехитрых
манипуляций может получить всю информацию о пользователях и это
непрерывно делается, чаще всего случайно, практически не выявляемо, и
всем на это плевать.
  Я сам однажды по запросу создал фичу, которую потом на голубом глазу
с благодарностью прикрутили без необходимой коррекции и только через
год сообразил, что могу через неё деанонимизировать вообще всех. Т.к.
мне эта информация не была нужна, я просто тихо поофигевал и забыл.
Через некоторое время её случайно "исправили", но не потому, что
поняли в чём прикол, а лишь в качестве "оптимизации". Сейчас той моей
возможности нет, но повторить её может каждый в любой момент.

  Или вот ещё более наглядно AddThis и любое "поделись" не теряет ни
единого байта информации за всю свою историю и открыто этими данными
торгует, а у нас оно иногда вообще в теле страницы появляется. Но даже
если это лишь ссылка, о какой анонимизации можно говорить, если мы
сознательно подсовываем юзеру брешь в его безопасности на всех
страницах.

  Или ещё больший разрыв шаблона - мы навечно сохраняем IP правки,
из-за которой его обладатель, например, в России может быть обвинён по
любому из массы законов (экстремизм, распространение, призывы и т.д.)
и тупо посажен за решётку. Но при этом мы стыдимся сохранить IP при
чтении страницы.

  Или с ником... вона НОВОРОССа (другие буквы) деанонимизировали
недавно по характеру его правок и кросс-информации, вообще вчистую.
Через пару часов не вставая с места теперь о нём можно узнать вообще
всё. Хоть письма бумажные по адресу с благодарностями посылай, за всё
то где он наследил и что сеть бережно сохранила. Ну и зачем этот цирк?
Зачем этот обман пользователей?

  Мы вообще первейшие враги анонимности и конфиденциальности, если уж
на то пошло. В каком ещё месте с таким упорством идиота ставят препоны
любым попыткам анонимизации, вместо того, чтобы придумать как с ними
жить.

  Google прав - ни о какой анонимности при регулярной работе в сети
речи вестись не может. Если хочешь анонимности, ходи со специально
заточенного для этого гаджета не из места своей основной локации и
после использования уничтожай его. В любом другом случае получить всю
информацию о пользователе дело лишь идей и времени.

  Поэтому вместо обмана юзеров на счёт их анонимности, следовало бы
менять политику конфиденциальности и общую политику (хотя бы по тем же
открытым проксям). Хочешь быть анонимным - будь, но на нашей стороне
это обеспечить невозможно. Мы и так навечно записываем и
распространяем IP при каждой правке, ничему не противоречит быть
последовательными и записывать IP при каждом посещении сохраняя это в
дампе. Ну а для зарегистрированных пользователей можно выдавать ник,
чего уж там. Или пойти по пути псевдоанонимного ID, что внешне будет
выглядеть благопристойней, а для обывателя менее напряжно.

  Вообще говоря, мы занимаемся свободным созданием и распространением
знаний. Статистика посещений - это кладез информации, необходимой и в
бизнес и научных целях. Её сбор и распространение запросто принесли бы
человечеству пользы, проектам - ориентировок и оптимизации, а ВМ -
дополнительного дохода. А мы с ней так безобразно обходимся.

>
> А про количество/качество еще философы говорили :)
> https://ru.wikipedia.org/wiki/Закон_перехода_количественных_изменений_в_качественные
>
> Поэтому совсем отрекаться от количественной нагонки просмотров при
> отсутствии прямого эффекта в донорах/участниках я не буду, авось что-то
> хорошее из этого выйдет - особых усилий от нас это не требует.

  Позволь выдвинуть следующую гипотезу, что реклама в Google даёт в
целом положительную отдачу заказчикам, иначе в конкурентной среде она
бы просто перестала существовать.
  Т.е. вложив 100 рублей, её использователь должен получить назад как
минимум 101 - т.е. какую-то "копеечку" чистого профита.
  Но мы не возвращаем даже 10% от вложенного, иначе это было бы
заметно в отчётах. У нас практически 100% бумажный убыток.

  Таким образом напрашивается вывод, что мы делаем что-то совершенно
не то и требуются принципиальные изменения.
  Например, для меня стало откровением, когда узнал, что ты посылаешь
пользователей не на форму, где они могут без лишних хлопот расстаться
со своими кровными ради благих целей, а на какое-то бла-бла на вики ВМ
РУ, и т.д.

  Нам дали неслабый в нашем положении ресурс, а мы его целиком
спускаем, по-другому результат оценить сложно.

  Если сами не умеем, давай привлечём специалистов, хоть за половину с
принесённого в результате этого дохода, но просто сидеть, ожидать чуда
и смотреть на выбрасывание таких шайб нельзя.

саша.

>
> Линар
>
>
> 17 августа 2014 г., 19:42 пользователь Alexander N Krassotkin
> <krassot...@gmail.com> написал:
>>
>> Доброе!
>>
>> 2014-08-17 17:39 GMT+04:00 rubin.happy <rubin.ha...@gmail.com>:
>> ...
>> > PS: А реклама в поисковике Гугла дает нам львиную долю переходов на
>> > сайт...
>>
>>   Ну это ещё отсюда было понятно (давал на форуме):
>> http://www.similarweb.com/website/ru.wikimedia.org
>>
>>   Только толку? Денег это не приносит, людей, желающих принять участие
>> в деятельности тоже.
>>
>>   А статистика, конечно, да... даже в прошлом веке у всех лучше была,
>> чем нам удётся выклянчить.
>>
>> саша.
>>
>>
>> >
>> > Линар
>> _______________________________________________
>> Wikimedia-RU mailing list
>> Wikimedia-RU@lists.wikimedia.org
>> https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru
>
>
>
> _______________________________________________
> Wikimedia-RU mailing list
> Wikimedia-RU@lists.wikimedia.org
> https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru
>
_______________________________________________
Wikimedia-RU mailing list
Wikimedia-RU@lists.wikimedia.org
https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru

Ответить