Re: [Exim-users] кривое helo

Igor Karpov Tue, 22 Jun 2021 07:58:44 -0700

Поправить лимит недолго; но до сих пор хватало. Я исходил из предположения,
что картинки пересылать не будем 🙂


On Tue, 22 Jun 2021 at 17:33 Vladimir Sharun <vladimir.sha...@ukr.net>
wrote:

> Привет,
>
> Офигеть, предыдущее письмо не пролезло по лимиту в 40к )
>
> > Vladimir Sharun wrote on 22.06.2021 09:44:
> >
> > >     Вы хостите почту самых разных пользователей и в огромных
> масштабах. На
> > >     фоне этого, чья-то скромная статистика будет совершенно не
> > >     показательной. Смысл тут, скорее всего, в том, каким образом,
> > >     конкретные адреса попали в их спам листы. Это может быть и
> > >     определённая целевая аудитория.
> > >
> > >
> > > Представь, что я хочу для улучшения своей статистики дать возможность
> > > фильтрации сквозь себя какому-то ограниченному списку доменов.
> >
> > речь о смене MX'ов сторонних по отношению к ukr.net доменов на
> > mxs.ukr.net с последующей маршрутизацией почты на реальный MX или об
> > обмене информацией (владельцы сторонних доменов отдают данные о входящих
> > письмах, а получают данные о репутации отравителей)?
> >
>
> Оба варианта рассматриваются. По первому варианту работает с десяток
> доменов где-то лет 15 ЕМНИП. Там правда какой-то другой MX технический, не
> mxs.ukr.net
>
> > > Или дать инструменты репутационных запросов (а их например есть: по ip,
> > > отправителю в случае фримейлов и приравнянных к ним и домену), но это
> > > API, в котором будет собираться информация о mailfrom (см ниже).
> > > Я хочу понять, насколько это будет приемлемо для сторонней организации:
> > >
> > >  1. организационно (мою почту будут читать или иметь возможность
> читать!
> > >     - нет, это профильная статья и это высекается на раз-два
> > >     техническими средствами, что твою почту читают, а договора о
> > >     правовой взаипомощи и экстрадиции достанут из любой нормальной
> > >     юрисдискции)
> >
> > гм... т. е. таки предполагается заворачивать почту на такой сервис
> целиком.
> >
>
> Я хочу понять как этот сервис виден со стороны админа потенциального
> кастомера: он может лишиться какого-то куска работы, а может и вообще
> остаться без нее: может весь сервис зааутсориться. По этой причине (чтобы
> не лишать работы) есть и второй вариант: обмен телеметрией. Вы:
> отправитель-получатель-ip, мы - предлагаемую реакцию и вероятность, что
> спам (может быть 100% и в спам, когда на взлёте рассылка, а через 300мс уже
> может быть 99% и рекомендация - блок).
>
> Вопрос хэширования отправителя и получателя - это хороший вопрос. И он оч
> сложный этически. Сейчас покажу на пальцах: передать эту пару - это спалить
> кто с кем переписывается, что проблема бизнес и этическая (соблазн со
> стороны исполнителя начать торговать). Не передавать - смысла со стороны
> исполнителя заниматься благотворительностью нет.
>
> Я думал над хэшированием, вот такие мысли:
> учитывая 26 символов + 10 цифр + десяток спецсимволов получить
> хэш-коллизию пары на видеокарте можно весьма быстро (перебрав сначала
> словарь из млрд имейлов и неск млн доменов в порядке уменьшения
> вероятности). Даже при использовании sha3 с перебором в асике или
> видеокарте - это млрд хэшей/с, т.е. пара будет при желании восстановлена за
> секунды. Энергоёмкие алгоритмы могут привести к ДОСу, по-этому всякие b/s
> crypt не рассматриваются
> если передавать кусок хэша - см п.1
> но ->
> если сторона-запрашиватель будет хэшировать параметрическим salt'ом так,
> что всегда будет один и тот же алгоритм для одного и того же получателя
> и/или отправителя, то и ок. Но мне всё равно нужен отправитель в открытом
> виде, чтобы на него дать ответ, получатель не важен, пусть это будет
> какой-то деперсонифицированный код: он нужен для статистики, для бигдаты.
> > >  2. технически - это и было самое интересное:
> > >      1. например маркетингер меня уже давно не спамит, потому что это
> > >         пустая трата времени, где-то внутри секунды домен блокируется,
> а
> > >         в течении часов - ip. И тут вот еще одно есть интересное:если
> ты
> > >         хочешь, чтобы тебя mail.ru или gmail (именно эти двое) не
> > >         забанили, тебе нельзя спамить внутрь, а фидбеклупы они нг
> > >         читают. Именно по этой причине есть всякие baza_ta...@mail.ru
> c
> > >         десятками тыс получателей, спамящий в блок сутками. Такие же
> > >         группировки есть и на gmail'е. По-этому ->
> > >      2. если меня уже не спамят (домен ? mx ?), то кого-то могут
> > >         продолжать спамить. У меня нет сомнений, что "там" сидят
> > >         ленивые, но высокоинтеллектуальные люди: списки они врядли
> будут
> > >         чистить, а если и да, то почему бы и нет :).
> >
> > т. е. речь о том, что статистика, собранная на базе входящих писем
> > ukr.net становится не репрезентативной не потому, что писем мало (как у
> > остальных), а потому, что спамеры в ряде случаев начинают к ukr.net (и
> > другим "специфическим" получателям) относится немного по-другому?
>
> Одинаково они ко всем относятся, мне интересно было вот домен, вот вам с
> него пришло (или не пришло) и я могу спроецировать вас до меня, после, во
> время - как ? Другое дело что с gmail на gmail не спамят: блок будет оч
> быстро.
>
> > >      3. теперь представьте, что у вас есть засвеченные адреса, которые
> > >         спамят постоянно. И на них всех приходит одинаковая почта
> внутри
> > >         минуты. С каждым новым совпадением, включая нерабочие годами
> > >         адреса, помноженное на ловушки - уже не может быть вопросов.
> >
> > такие есть почти у всех. а на admin@, office@, sales@, market@,
> > marketing@ и подобные могут присылать спам, даже если они нигде не
> > засвечены и даже если их не существует.
>
> Представь что тебе на admin@ пришло, мне на пару сотен ловушек, еще
> кому-то на sales@
> Какие тут могут быть выводы ? IBM зарабатывает на поведенческом софте уже
> давно.
>
> > >      4. Цель - объединённые усилия, естественно с соблюдением норм GDPR
> >
> > вариант менять MX и получать потом сухой остаток не так интересен, как
> > по API заливать данные о письме (IP отправителя, helo, адрес
> > отправителя, возможно IP получателя, адрес получателя, может ещё версию
> > TLS, cipher или что-то подобное) и по тому же API получать репутацию
> > данного IP отправителя, домена отправителя, полного адреса отправителя.
> >
>
> По-этому и два варианта.
>
> > при этом надо бы предусмотреть ещё какие-то атрибуты запроса, в которых
> > можно было бы передать информацию о том, что данный адрес получателя -
> > вообще спамтрап. можно передать информацию об отсылке инфицированных
> > аттачей.
> >
>
> Что это что-то оч сладкое, у меня сразу алгоритмы коррелляции подскажут :)
>
> > и, кстати, можно было бы предусмотреть сабмит данных не только в
> > риалтайме. если в ходе ручных разборок оказалось, что в письме прилетела
> > ссылка на заражённый сайт или что pdf в письме оказался с трояном, на
> > который никто не среагировал, кроме локального антивируса у получателя в
> > момент сохранения аттача на диске, чтобы можно было засабмитить данные о
> > таком письме вручную с указанием причины сабмита.
>
> Кейс, когда кто-то отспамился по своей адресбуке как спам не считается,
> пусть это даже будет троян, тут уж сами как-то.
> Мало того, это и распознано как спам не будет. Статистическое отсечение:
> недостаточно "цвета" в рассылке, очень она с белым шумом.
> Я такое наблюдаю регулярно btw.
>
> > >      5. Чем больше доменов участвуют "в игре", тем выше качество
> > >         фильтрации, тем ниже шансы эту группу отспамить. Реакция весьма
> > >         быстрая (реалтайм), шансов "отвертеться" очень мало: надо
> > >         перестать спамить, надо откуда-то взять адреса, которые не были
> > >         засвечены, надо знать, какие адреса засвечены и избавиться от
> > >         них: цель достигнута, спам остановлен :)
> >
> > а на сколько эта идея гипететическая?
>
> Мне надо понять интерес к этой теме, чтобы подумать каким образом сделать
> интерфейс к этой системе (или не делать).
> Конечная цель - это подписка по каким-то совершенно нечувствительным ценам
> с отсечением доса (например вас спамом заваливает ботнет и мы очевидно это
> не считаем).
>
> > данные о репутации смогут получать только те, кто предоставляет данные
> > для анализа?
>
> Квид про кво.
>
> > можно будет получать данные о репутации произвольных IP или адреса
> > отправителя? или только тех, которые соответствуют письму, данные о
> > котором (или само письмо) нужно залить сервису?
> >
>
> Только по конкретной паре. Технически дату можно и выкачать, обманывая, но
> смысла нет, т.к. смысл бигдаты он риалтаймовый: база сейчас уже через день
> другая совсем - это не грубо говоря набор там сигнатур эксплоитов для
> IDS/DPI. Вот такие системы сейчас - это острие: Майкрософт с эндпоинтом,
> Краудстрайк - это облачные коррелляторы событий безопасности, которые
> технически бесполезны в он премисес варианте: нехватка даты и соотв
> неточные результаты риалтайм.
>
> > > PS: есть кейс AmazonSES и бесплатной части Sendgrid'а, где надо
> > > связывать mail from & from после DATA - это как оказалось те еще
> > > сервисы, 40% почты с Амазон-а оказалась спамом, но и это решаемо.
> >
> > т. е. в этом случае сабмита данных, полученных на этапе RCPT To
> > включительно, будет недостаточно. нужны ещё как минимум и заголовки.
> > мало того, ответ сервиса будет справедлив именно для этого письма (в
> > следующем письме с этого же IP с этого же адреса отправителя адрес из
> > заголовка From может уже и совпадать с ним, а в предыдущем мог и не
> > совпадать).
>
> Да. Ответ риалтайм: на конкретную пару с конкретного ip. В 90+% случаев
> это будет ОК кстати :)
> Но может быть первый запрос ОК, а второй - СПАМ, третий - рекомендация -
> БЛОК на одного и того же отправителя - это норма. Надо набить скоринг
> вначале.
>
> > > Где-то такая идея.
> >
> > не знаю, на сколько ощутимо выиграет от этого ukr.net (всё же перекос в
> > количестве входящих писем грандиозный), но почтовым системам помельче
> > такая идея может быть весьма полезной.
> >
> > у меня стопоров только два:
> >
> > 1. нет желания заворачивать всю почту через такой сервис путём смены
> > основного MX'а.
> >
>
> Кто-то захочет полностью заатусорсить почту/МХ, ему такой вариант ок.
> Можно сделать доставку вплоть до LMTP.
>
> > 2. в случае, если MX переписывать не нужно, нет желания сабмитить письмо
> > целиком (а без этого получить статистику об аттачам и файлах внутри
> > архивов из этих аттачей будет невозможно).
> >
>
> Это не нужно - это вы сами. Здесь только репутационная модель. Что
> касается кейса Амазона - это канеш труба, там вот так:
> сначала сейвятся все пары mailfrom - rcpt: их может быть больше одной и
> сюрприз! - вам могут передать очень полезную пару несуществующего
> экаунта-засвеченного_спамтрапа, который вы или блокнете на rcpt - (нельзя!)
> или дискарднете - (тоже нельзя!). Имеет смысл аксептнуть и редиректнуть в
> дискард в роутере при доставке - тогда вам будут доступны заголовки (но
> придётся принять письмо, но каналы сейчас толстые)
> потом делается перевставка этих пар с заменой mailfrom на headerfrom и
> удаление пар mailfrom.
>
> Проблема общего характера: exim распространён у нас слабо, много
> постфикса, куда это я не уверен что легко заинтегрируется (но там он как
> правило от безысходности: поставили хоть что-то и owner'ы бизнеса будут
> счастливы сдать на аутсорс весь сервис).
>
> > но, на сколько я понимаю, даже от получения и анализа данных, доступных
> > до DATA, уже будет польза и для ukr.net и для других участников
> мероприятия.
> >
>
> Да.
> >
>
> _______________________________________________
> Exim-users mailing list
> Exim-users@mailground.net
> http://mailground.net/mailman/listinfo/exim-users
>
> --
-- 
What do you get when you play country music backwards?
You get your girl back, your dog back, your pick-up back, and you stop
drinking.

Louis Saaberdra

_______________________________________________
Exim-users mailing list
Exim-users@mailground.net
http://mailground.net/mailman/listinfo/exim-users

Re: [Exim-users] кривое helo

Ответить