Par ailleurs, on peut observer qu'après l'échec des filtres mails dits "durs" (ie un outil qui empèche le mail de passer s'il contient certains termes: "enlarge", "teen chicks", etc...), les filtres à analyse statistiques arrivent, avec beaucoup plus d'efficacité.
Le grand problème des filtres durs, c'est qu'ils peuvent en toute bonne foi virer les mails sérieux ou bien d'un ami qui vous envoie une blague stupide, dont vous pourriez certes vous passer, mais bon. Donc résultat on est obligé de vérifier si ces messages sont du spam ou pas manuellement. De plus, les spammeurs contournent très vite le problème en vous envoyant des "e n l a r g e" ou autre détournement orthographique
Aussi plutôt que de tenter une analyse bète et méchante, une analyse statistique permet de prédire avec plus de succès si un message est du spam.
Problème, le filtre a besoin d'une base d'analyse: on lui fournit n messages considérés comme du spam, et lui va farfouiller dedans, s'ébat gaiement, et revient avec tous plein d'informations du genre:
- si un message contient les mots "free" "chicks" "pictures" consécutifs, il a une probabilité de 99% d'être du spam
- si un message commence par: "xxxxx", il a plus de chance d'être du spam que s'il commence par "Salut"
Après il ne reste plus qu'à l'utilisateur le choix de son degré de protection (ie "ne pas laisser passer les messages qui ont 50% de chances ou plus d'être du spam") et les résultats semblent être plutôt corrects!
Je pense que de toute manière, le filtrage final doit se trouver chez l'utilisateur, puisque comme le dit FautVoir, à terme les spammeurs contourneront ce système d'adresse cryptées
Un peu de lecture (en anglais)