Spam : comment l'éviter ? (en anglais)

Répondre
Partager Rechercher
Une intéressante étude sur le spam, menée durant 6 mois par le Center for Democracy & Technology. Des adresses tests ont été disséminées un peu partout, et les résultats ont ensuite été analysés. Edifiant : 97% du spam reçu l'a été sur des adresses publiées en clair sur des sites web ("contact", "écrire au webmaster" etc.). Les autres adresses, postées sur des newsgroups, des forums web, des sites de vente aux enchères, données lors d'enregistrement à des services web ou des newsletters etc. n'ont généré que très peu de spam. C'est donc bien la traditionnelle rubrique "contact" des sites persos ou pros qui expose l'imprudent à un déluge de spam.

L'article donne une astuce simple et conforme aux standards W3C : crypter son e-mail grâce aux Character Entities. Le navigateur sait décrypter, mais les robots des spammeurs passent sur ces e-mails sans s'arrêter (pour l'instant ! On peut parier que ça ne durera pas, hélas).

L'outil en ligne pour crypter son e-mail.
Par ailleurs, on peut observer qu'après l'échec des filtres mails dits "durs" (ie un outil qui empèche le mail de passer s'il contient certains termes: "enlarge", "teen chicks", etc...), les filtres à analyse statistiques arrivent, avec beaucoup plus d'efficacité.

Le grand problème des filtres durs, c'est qu'ils peuvent en toute bonne foi virer les mails sérieux ou bien d'un ami qui vous envoie une blague stupide, dont vous pourriez certes vous passer, mais bon. Donc résultat on est obligé de vérifier si ces messages sont du spam ou pas manuellement. De plus, les spammeurs contournent très vite le problème en vous envoyant des "e n l a r g e" ou autre détournement orthographique

Aussi plutôt que de tenter une analyse bète et méchante, une analyse statistique permet de prédire avec plus de succès si un message est du spam.
Problème, le filtre a besoin d'une base d'analyse: on lui fournit n messages considérés comme du spam, et lui va farfouiller dedans, s'ébat gaiement, et revient avec tous plein d'informations du genre:
- si un message contient les mots "free" "chicks" "pictures" consécutifs, il a une probabilité de 99% d'être du spam
- si un message commence par: "xxxxx", il a plus de chance d'être du spam que s'il commence par "Salut"

Après il ne reste plus qu'à l'utilisateur le choix de son degré de protection (ie "ne pas laisser passer les messages qui ont 50% de chances ou plus d'être du spam") et les résultats semblent être plutôt corrects!

Je pense que de toute manière, le filtrage final doit se trouver chez l'utilisateur, puisque comme le dit FautVoir, à terme les spammeurs contourneront ce système d'adresse cryptées

Un peu de lecture (en anglais)
Répondre

Connectés sur ce fil

 
1 connecté (0 membre et 1 invité) Afficher la liste détaillée des connectés