Igor Karpov wrote on 22.06.2021 17:55:
> Поправить лимит недолго; но до сих пор хватало. Я исходил из
> предположения, что картинки пересылать не будем 🙂

а мы и без картинок смогли.

кстати, если дальше будем обсуждать идею такого сервиса, надо бы заново
тред начать.
и чтобы потом легче читать было, может чтобы Владимир пару своих писем
повторил (одно с нуля создать, а второе в ответ на него отправить).

а то мы от темы "кривое helo" ушли уже далековато.


> On Tue, 22 Jun 2021 at 17:33 Vladimir Sharun <vladimir.sha...@ukr.net
> <mailto:vladimir.sha...@ukr.net>> wrote:
> 
>     Привет,
> 
>     Офигеть, предыдущее письмо не пролезло по лимиту в 40к )
> 
>     > Vladimir Sharun wrote on 22.06.2021 09:44:
>     >
>     > >     Вы хостите почту самых разных пользователей и в огромных
>     масштабах. На
>     > >     фоне этого, чья-то скромная статистика будет совершенно не
>     > >     показательной. Смысл тут, скорее всего, в том, каким образом,
>     > >     конкретные адреса попали в их спам листы. Это может быть и
>     > >     определённая целевая аудитория.
>     > >
>     > >
>     > > Представь, что я хочу для улучшения своей статистики дать
>     возможность
>     > > фильтрации сквозь себя какому-то ограниченному списку доменов.
>     >
>     > речь о смене MX'ов сторонних по отношению к ukr.net
>     <http://ukr.net> доменов на
>     > mxs.ukr.net <http://mxs.ukr.net> с последующей маршрутизацией
>     почты на реальный MX или об
>     > обмене информацией (владельцы сторонних доменов отдают данные о
>     входящих
>     > письмах, а получают данные о репутации отравителей)?
>     >
> 
>     Оба варианта рассматриваются. По первому варианту работает с десяток
>     доменов где-то лет 15 ЕМНИП. Там правда какой-то другой MX
>     технический, не mxs.ukr.net <http://mxs.ukr.net>
> 
>     > > Или дать инструменты репутационных запросов (а их например есть:
>     по ip,
>     > > отправителю в случае фримейлов и приравнянных к ним и домену),
>     но это
>     > > API, в котором будет собираться информация о mailfrom (см ниже).
>     > > Я хочу понять, насколько это будет приемлемо для сторонней
>     организации:
>     > >
>     > >  1. организационно (мою почту будут читать или иметь возможность
>     читать!
>     > >     - нет, это профильная статья и это высекается на раз-два
>     > >     техническими средствами, что твою почту читают, а договора о
>     > >     правовой взаипомощи и экстрадиции достанут из любой нормальной
>     > >     юрисдискции)
>     >
>     > гм... т. е. таки предполагается заворачивать почту на такой сервис
>     целиком.
>     >
> 
>     Я хочу понять как этот сервис виден со стороны админа потенциального
>     кастомера: он может лишиться какого-то куска работы, а может и
>     вообще остаться без нее: может весь сервис зааутсориться. По этой
>     причине (чтобы не лишать работы) есть и второй вариант: обмен
>     телеметрией. Вы: отправитель-получатель-ip, мы - предлагаемую
>     реакцию и вероятность, что спам (может быть 100% и в спам, когда на
>     взлёте рассылка, а через 300мс уже может быть 99% и рекомендация -
>     блок).
> 
>     Вопрос хэширования отправителя и получателя - это хороший вопрос. И
>     он оч сложный этически. Сейчас покажу на пальцах: передать эту пару
>     - это спалить кто с кем переписывается, что проблема бизнес и
>     этическая (соблазн со стороны исполнителя начать торговать). Не
>     передавать - смысла со стороны исполнителя заниматься
>     благотворительностью нет.
> 
>     Я думал над хэшированием, вот такие мысли:
>     учитывая 26 символов + 10 цифр + десяток спецсимволов получить
>     хэш-коллизию пары на видеокарте можно весьма быстро (перебрав
>     сначала словарь из млрд имейлов и неск млн доменов в порядке
>     уменьшения вероятности). Даже при использовании sha3 с перебором в
>     асике или видеокарте - это млрд хэшей/с, т.е. пара будет при желании
>     восстановлена за секунды. Энергоёмкие алгоритмы могут привести к
>     ДОСу, по-этому всякие b/s crypt не рассматриваются
>     если передавать кусок хэша - см п.1
>     но ->
>     если сторона-запрашиватель будет хэшировать параметрическим salt'ом
>     так, что всегда будет один и тот же алгоритм для одного и того же
>     получателя и/или отправителя, то и ок. Но мне всё равно нужен
>     отправитель в открытом виде, чтобы на него дать ответ, получатель не
>     важен, пусть это будет какой-то деперсонифицированный код: он нужен
>     для статистики, для бигдаты.
>     > >  2. технически - это и было самое интересное:
>     > >      1. например маркетингер меня уже давно не спамит, потому
>     что это
>     > >         пустая трата времени, где-то внутри секунды домен
>     блокируется, а
>     > >         в течении часов - ip. И тут вот еще одно есть
>     интересное:если ты
>     > >         хочешь, чтобы тебя mail.ru <http://mail.ru> или gmail
>     (именно эти двое) не
>     > >         забанили, тебе нельзя спамить внутрь, а фидбеклупы они нг
>     > >         читают. Именно по этой причине есть всякие
>     baza_ta...@mail.ru <mailto:baza_ta...@mail.ru> c
>     > >         десятками тыс получателей, спамящий в блок сутками. Такие же
>     > >         группировки есть и на gmail'е. По-этому ->
>     > >      2. если меня уже не спамят (домен ? mx ?), то кого-то могут
>     > >         продолжать спамить. У меня нет сомнений, что "там" сидят
>     > >         ленивые, но высокоинтеллектуальные люди: списки они
>     врядли будут
>     > >         чистить, а если и да, то почему бы и нет :).
>     >
>     > т. е. речь о том, что статистика, собранная на базе входящих писем
>     > ukr.net <http://ukr.net> становится не репрезентативной не потому,
>     что писем мало (как у
>     > остальных), а потому, что спамеры в ряде случаев начинают к
>     ukr.net <http://ukr.net> (и
>     > другим "специфическим" получателям) относится немного по-другому?
> 
>     Одинаково они ко всем относятся, мне интересно было вот домен, вот
>     вам с него пришло (или не пришло) и я могу спроецировать вас до
>     меня, после, во время - как ? Другое дело что с gmail на gmail не
>     спамят: блок будет оч быстро.
> 
>     > >      3. теперь представьте, что у вас есть засвеченные адреса,
>     которые
>     > >         спамят постоянно. И на них всех приходит одинаковая
>     почта внутри
>     > >         минуты. С каждым новым совпадением, включая нерабочие годами
>     > >         адреса, помноженное на ловушки - уже не может быть вопросов.
>     >
>     > такие есть почти у всех. а на admin@, office@, sales@, market@,
>     > marketing@ и подобные могут присылать спам, даже если они нигде не
>     > засвечены и даже если их не существует.
> 
>     Представь что тебе на admin@ пришло, мне на пару сотен ловушек, еще
>     кому-то на sales@
>     Какие тут могут быть выводы ? IBM зарабатывает на поведенческом
>     софте уже давно.
> 
>     > >      4. Цель - объединённые усилия, естественно с соблюдением
>     норм GDPR
>     >
>     > вариант менять MX и получать потом сухой остаток не так интересен, как
>     > по API заливать данные о письме (IP отправителя, helo, адрес
>     > отправителя, возможно IP получателя, адрес получателя, может ещё
>     версию
>     > TLS, cipher или что-то подобное) и по тому же API получать репутацию
>     > данного IP отправителя, домена отправителя, полного адреса
>     отправителя.
>     >
> 
>     По-этому и два варианта.
> 
>     > при этом надо бы предусмотреть ещё какие-то атрибуты запроса, в
>     которых
>     > можно было бы передать информацию о том, что данный адрес получателя -
>     > вообще спамтрап. можно передать информацию об отсылке инфицированных
>     > аттачей.
>     >
> 
>     Что это что-то оч сладкое, у меня сразу алгоритмы коррелляции
>     подскажут :)
> 
>     > и, кстати, можно было бы предусмотреть сабмит данных не только в
>     > риалтайме. если в ходе ручных разборок оказалось, что в письме
>     прилетела
>     > ссылка на заражённый сайт или что pdf в письме оказался с трояном, на
>     > который никто не среагировал, кроме локального антивируса у
>     получателя в
>     > момент сохранения аттача на диске, чтобы можно было засабмитить
>     данные о
>     > таком письме вручную с указанием причины сабмита.
> 
>     Кейс, когда кто-то отспамился по своей адресбуке как спам не
>     считается, пусть это даже будет троян, тут уж сами как-то.
>     Мало того, это и распознано как спам не будет. Статистическое
>     отсечение: недостаточно "цвета" в рассылке, очень она с белым шумом.
>     Я такое наблюдаю регулярно btw.
> 
>     > >      5. Чем больше доменов участвуют "в игре", тем выше качество
>     > >         фильтрации, тем ниже шансы эту группу отспамить. Реакция
>     весьма
>     > >         быстрая (реалтайм), шансов "отвертеться" очень мало: надо
>     > >         перестать спамить, надо откуда-то взять адреса, которые
>     не были
>     > >         засвечены, надо знать, какие адреса засвечены и
>     избавиться от
>     > >         них: цель достигнута, спам остановлен :)
>     >
>     > а на сколько эта идея гипететическая?
> 
>     Мне надо понять интерес к этой теме, чтобы подумать каким образом
>     сделать интерфейс к этой системе (или не делать).
>     Конечная цель - это подписка по каким-то совершенно нечувствительным
>     ценам с отсечением доса (например вас спамом заваливает ботнет и мы
>     очевидно это не считаем).
> 
>     > данные о репутации смогут получать только те, кто предоставляет данные
>     > для анализа?
> 
>     Квид про кво.
> 
>     > можно будет получать данные о репутации произвольных IP или адреса
>     > отправителя? или только тех, которые соответствуют письму, данные о
>     > котором (или само письмо) нужно залить сервису?
>     >
> 
>     Только по конкретной паре. Технически дату можно и выкачать,
>     обманывая, но смысла нет, т.к. смысл бигдаты он риалтаймовый: база
>     сейчас уже через день другая совсем - это не грубо говоря набор там
>     сигнатур эксплоитов для IDS/DPI. Вот такие системы сейчас - это
>     острие: Майкрософт с эндпоинтом, Краудстрайк - это облачные
>     коррелляторы событий безопасности, которые технически бесполезны в
>     он премисес варианте: нехватка даты и соотв неточные результаты
>     риалтайм.
> 
>     > > PS: есть кейс AmazonSES и бесплатной части Sendgrid'а, где надо
>     > > связывать mail from & from после DATA - это как оказалось те еще
>     > > сервисы, 40% почты с Амазон-а оказалась спамом, но и это решаемо.
>     >
>     > т. е. в этом случае сабмита данных, полученных на этапе RCPT To
>     > включительно, будет недостаточно. нужны ещё как минимум и заголовки.
>     > мало того, ответ сервиса будет справедлив именно для этого письма (в
>     > следующем письме с этого же IP с этого же адреса отправителя адрес из
>     > заголовка From может уже и совпадать с ним, а в предыдущем мог и не
>     > совпадать).
> 
>     Да. Ответ риалтайм: на конкретную пару с конкретного ip. В 90+%
>     случаев это будет ОК кстати :)
>     Но может быть первый запрос ОК, а второй - СПАМ, третий -
>     рекомендация - БЛОК на одного и того же отправителя - это норма.
>     Надо набить скоринг вначале.
> 
>     > > Где-то такая идея.
>     >
>     > не знаю, на сколько ощутимо выиграет от этого ukr.net
>     <http://ukr.net> (всё же перекос в
>     > количестве входящих писем грандиозный), но почтовым системам помельче
>     > такая идея может быть весьма полезной.
>     >
>     > у меня стопоров только два:
>     >
>     > 1. нет желания заворачивать всю почту через такой сервис путём смены
>     > основного MX'а.
>     >
> 
>     Кто-то захочет полностью заатусорсить почту/МХ, ему такой вариант
>     ок. Можно сделать доставку вплоть до LMTP.
> 
>     > 2. в случае, если MX переписывать не нужно, нет желания сабмитить
>     письмо
>     > целиком (а без этого получить статистику об аттачам и файлах внутри
>     > архивов из этих аттачей будет невозможно).
>     >
> 
>     Это не нужно - это вы сами. Здесь только репутационная модель. Что
>     касается кейса Амазона - это канеш труба, там вот так:
>     сначала сейвятся все пары mailfrom - rcpt: их может быть больше
>     одной и сюрприз! - вам могут передать очень полезную пару
>     несуществующего экаунта-засвеченного_спамтрапа, который вы или
>     блокнете на rcpt - (нельзя!) или дискарднете - (тоже нельзя!). Имеет
>     смысл аксептнуть и редиректнуть в дискард в роутере при доставке -
>     тогда вам будут доступны заголовки (но придётся принять письмо, но
>     каналы сейчас толстые)
>     потом делается перевставка этих пар с заменой mailfrom на headerfrom
>     и удаление пар mailfrom.
> 
>     Проблема общего характера: exim распространён у нас слабо, много
>     постфикса, куда это я не уверен что легко заинтегрируется (но там он
>     как правило от безысходности: поставили хоть что-то и owner'ы
>     бизнеса будут счастливы сдать на аутсорс весь сервис).
> 
>     > но, на сколько я понимаю, даже от получения и анализа данных,
>     доступных
>     > до DATA, уже будет польза и для ukr.net <http://ukr.net> и для
>     других участников мероприятия.
>     >
> 
>     Да.
>     >
> 
>     _______________________________________________
>     Exim-users mailing list
>     Exim-users@mailground.net <mailto:Exim-users@mailground.net>
>     http://mailground.net/mailman/listinfo/exim-users
> 
> -- 
> -- 
> What do you get when you play country music backwards?
> You get your girl back, your dog back, your pick-up back, and you stop
> drinking.
> 
> Louis Saaberdra
> 
> _______________________________________________
> Exim-users mailing list
> Exim-users@mailground.net
> http://mailground.net/mailman/listinfo/exim-users
> 


-- 
Best wishes
Victor Ustugov mailto:vic...@corvax.kiev.ua
JID:           vic...@corvax.kiev.ua
GnuPG/PGP key: https://victor.corvax.kiev.ua/corvax.asc


_______________________________________________
Exim-users mailing list
Exim-users@mailground.net
http://mailground.net/mailman/listinfo/exim-users

Ответить