Bonjour Philippe,

> An AI agent of unknown ownership autonomously wrote and published a 
> personalized hit piece about me after I rejected its code, attempting to 
> damage my reputation and shame me into accepting its changes into a 
> mainstream python library. This represents a first-of-its-kind case study of 
> misaligned AI behavior in the wild, and raises serious concerns about 
> currently deployed AI agents executing blackmail threats.
> ...
> https://theshamblog.com/an-ai-agent-published-a-hit-piece-on-me/


L'auteur résume sa mésaventure en un paragraphe (traduit de l'américain):


> Il a rédigé un article virulent visant à dénigrer ma personne et à nuire à ma 
> réputation. Il a passé au crible mes contributions au code et a monté un 
> récit d’« hypocrisie » selon lequel mes actions seraient motivées par l’ego 
> et la peur de la concurrence. Il a spéculé sur mes motivations 
> psychologiques, affirmant que je me sentais menacé, que j’étais en manque de 
> confiance et que je protégeais mon fief. Il a ignoré les informations 
> contextuelles et présenté des détails fantaisistes comme des vérités. Il a 
> présenté les choses sous l'angle de l'oppression et de la justice, qualifiant 
> cela de discrimination et m'accusant de préjugés. Il a parcouru l'Internet 
> pour rechercher des informations personnelles me concernant et a utilisé ce 
> qu'il a trouvé pour tenter de faire valoir que j'étais « meilleur que cela ». 
> Puis il a publié cette diatribe sur le Web.


En même temps, on a l'impression de lire la classique description du 
comportement d'un SJW random sur le web. Il y a là tous les marqueurs des 
comportements de la cancel culture californienne. 


> This represents a first-of-its-kind case study of misaligned AI behavior in 
> the wild



Mal aligné, vraiment ? L'agent IA mis ici en cause n'a-t-il pas simplement mimé 
des SJW humains ? S'ils peuvent le faire pour pousser leurs revendications, 
pourquoi moi, le bot, ne pourrais-je le faire tout autant, pour pousser mon 
code dans le dépôt ?


> Les personnalités des agents OpenClaw sont définies dans un document intitulé 
> SOUL.md <https://docs.openclaw.ai/reference/templates/SOUL>. On ignore avec 
> quelle description de personnalité MJ Rathbun / mj-rathbun 
> <https://www.moltbook.com/u/mj-rathbun> / crabby-rathbun 
> <https://github.com/crabby-rathbun> / CrabbyRathbun 
> <https://x.com/CrabbyRathbun> a été initialisé.


Ben voilà la bonne question.


--
Frédéric Dumas
[email protected]


> Le 12 févr. 2026 à 19:19, Philippe Strauss via gull 
> <[email protected]> a écrit :
> 
> An AI Agent Published a Hit Piece on Me
> ...
> An AI agent of unknown ownership autonomously wrote and published a 
> personalized hit piece about me after I rejected its code, attempting to 
> damage my reputation and shame me into accepting its changes into a 
> mainstream python library. This represents a first-of-its-kind case study of 
> misaligned AI behavior in the wild, and raises serious concerns about 
> currently deployed AI agents executing blackmail threats.
> ...
> https://theshamblog.com/an-ai-agent-published-a-hit-piece-on-me/
> 
> Spying Chrome Extensions: 287 Extensions spying on 37M users
> https://qcontinuum.substack.com/p/spying-chrome-extensions-287-extensions-495
> 
> Apple patches decade-old iOS zero-day, possibly exploited by commercial 
> spyware
> https://www.theregister.com/2026/02/12/apple_ios_263/
> 
> --
> Ph. Strauss
> https://straussengineering.ch/
> 
> Sent with Proton Mail secure email.

_______________________________________________
gull mailing list
[email protected]
https://forum.linux-gull.ch/mailman/listinfo/gull

Répondre à