15-06-2013, 03:31 PM
Faut toutefois faire gaffe avec les posts d'informatique qui contiennent parfois 80% de code, à 99% en anglais...
Mais oui, ma solution briderait les nouveaux, c'est vrai... Ca "emm**derait" les visiteurs légitimes, ce qui est un tort.
Au vu de l'âge du forum aussi, n'y a-t-il pas moyen de faire une statistique sur la longueur des messages, le nombre de mots, et les mots récurrents?
Les messages de spam font souvent des pages et des pages, avec des liens partout, mais surtout, avec des mots jamais vus avant dans le forum... Qu'il y ai quelques "nouveaux" mots dans un message, ok, mais que 90% du message soit composé de mots jamais rencontrés avant ou très très peu utilisés, cela peut être une bonne détection, non?
Mais oui, ma solution briderait les nouveaux, c'est vrai... Ca "emm**derait" les visiteurs légitimes, ce qui est un tort.
Au vu de l'âge du forum aussi, n'y a-t-il pas moyen de faire une statistique sur la longueur des messages, le nombre de mots, et les mots récurrents?
Les messages de spam font souvent des pages et des pages, avec des liens partout, mais surtout, avec des mots jamais vus avant dans le forum... Qu'il y ai quelques "nouveaux" mots dans un message, ok, mais que 90% du message soit composé de mots jamais rencontrés avant ou très très peu utilisés, cela peut être une bonne détection, non?