Spam

Le spam, courriel indésirable ou pourriel (terme recommandé au Québec par l'OQLF) est une communication électronique non sollicitée, en premier lieu via le courrier électronique. Il s'agit en général d'envois en grande quantité effectués à des fins publicitaires.
Le premier spam a été envoyé le 3 mai 1978 par Gary Thuerk, marketeur travaillant chez DEC. Il envoya son message à près de la totalité des utilisateurs d'ARPAnet (ancêtre d'Internet) vivant sur la côte ouest des États-Unis, soit environ 600 personnes. Il fit cela sans mauvaise intention, afin d'inviter ces utilisateurs technophiles à une démonstration de la gamme DEC. Voulant éviter d'écrire un message à chaque adresse, il mit les 600 adresses directement dans le champ « Destinataire ». Les réactions furent vives et contrastées, l'administration américaine gérant le réseau condamnant d'office la pratique, la jugeant non conforme aux termes d'utilisation du réseau.
Certains préconisent le terme « polluriel » pour définir les messages inutiles, souvent provocateurs et n'ayant aucun lien avec le sujet de discussion, qui sont diffusés massivement sur de nombreux forums ou groupes de nouvelles, ce qui entraîne une pollution des réseaux.
En France, 95 % des messages échangés courant décembre 2006 étaient des spams. Ces pourcentages varient selon les articles publiés, mais la barre des 90 % est toujours dépassée. En mai 2009, Symantec annonce le chiffre de 90,4 %. Pour Microsoft, concernant la période de juillet à décembre 2008, la proportion de messages indésirables est de 97 %.
SPAM est une marque créée et déposée par Hormel Foods en 1937, l'origine du nom étant « Spiced Ham » (« jambon épicé », le produit ayant été nommé "Hormel Spiced Ham" à ses débuts). Cette viande précuite en boîte a largement été utilisée par l'intendance des forces armées américaines pour la nourriture des soldats pendant la Seconde Guerre mondiale et sera introduite dans diverses régions du monde à cette occasion.
L'association de « spam » et de « indésirable » provient d'un sketch comique des Monty Python, intitulé "Spam", dans lequel le mot « spam », désignant le fameux jambon en boîte, envahit la conversation et le menu d'un petit restaurant (il entre dans la composition de chaque plat et est répété à tout bout de champ). Un groupe de Vikings présent dans le restaurant, interrompt régulièrement la conversation en chantant bruyamment . Le sketch parodie une publicité radiophonique pour "SPAM", pendant laquelle la marque était répétée de nombreuses fois ().
Sur l'emploi du terme « "spam" » pour parler de courrier indésirable, la BBC fournit l'explication suivante en octobre 1999 : le début d'Internet coïncide plus ou moins avec la diffusion du sketch "Spam". Parmi les premiers utilisateurs d'Internet certains étaient des fans des Monty Python, qui connaissaient par cœur les sketchs de leurs humoristes préférés et les répétaient sans cesse. Ceux-ci avaient d’ailleurs créé un newsgroup dédié aux Monty Python. Le sketch "Spam" étant populaire, un message apparut dans ce newsgroup, contenant uniquement le mot « spam » répété des centaines de fois, à la manière du sketch. Ce message fut repris régulièrement et finit par atterrir dans d'autres newsgroups où il continua à être diffusé. C'est ainsi que le fait de poster des messages sans référence au thème d'un newsgroup finit par être appelé « "spamming" ».
Par opposition aux messages indésirables, les logiciels de filtrage de courrier électronique tels que SpamAssassin définissent comme « "ham" », littéralement « jambon », tout message électronique légitime.
Le verbe « spammer » est souvent utilisé dans le langage familier pour qualifier l'action d'envoyer des messages indésirables. Le mot « spammeur » désigne celui qui envoie ces messages.
Le mot « pourriel », proposé par l'Office québécois de la langue française (OQLF) en mai 1997, est un mot-valise construit à partir de « poubelle » et « courriel » tandis que « polluriel » est construit à partir de « pollution » et « courriel ». Le mot « pourriel » est d'usage courant au Québec, alors qu'en Europe, « spam » est l'appellation privilégiée. Le terme « polluriel », quant à lui, est plutôt réservé au contexte des messages indésirables dans les forums de discussion et groupes de nouvelles Usenet. La proposition d'officialisation de « pourriel » par la Commission générale de terminologie et de néologie française a été rejetée par l'Académie française parce que phonétiquement trop proche de « courriel ». Le mot québécois « pourriel » a toutefois été consigné dans les éditions récentes du "Petit Larousse illustré" et du "Petit Robert".
Le verbe « polluposter », proposé par l'OQLF, est utilisé pour désigner l'action d'envoyer des pourriels. Le mot « polluposteur » (en anglais : « "spammer" ») désigne celui qui envoie les pourriels, action désignée par le mot « pollupostage » (en anglais : « "spamming" »).
Il s'agit d'un exemple classique de spam qui repose sur le principe suivant : le message demande de l'aide afin de transférer des fonds depuis un compte en banque. Le destinataire (supposé compatissant) est censé faire l'intermédiaire pour la transaction.
Les anglophones parlent de « "nigerian scam" » (littéralement « arnaque nigériane ») car une bonne partie de ces messages émanaient du Nigeria. On rencontre aussi le terme de « fraude 4-1-9 », la numérotation étant relative à un texte de loi du Nigeria.
Le principe de ces messages n'est pas nouveau : ils sont inspirés des Lettres de Jérusalem qui remontent à la Révolution française. Les mêmes messages étaient diffusés par fax dans les années 1980.
C'est l'une des formes les plus courantes de spam, consistant à l'envoi en masse d'un message publicitaire. Les auteurs de ce spam utilisent souvent frauduleusement les ressources informatiques d'autrui via des « machines zombies », car la génération automatique de millions d'adresses destinataires nécessite une large bande passante et une certaine puissance de calcul.
Le spam continue d'exister et de prospérer grâce aux revenus qu'il peut engendrer, ce qui motive certains commanditaires car près de 11 % d'internautes admettent avoir acheté un produit à la suite de la réception d'un spam publicitaire, d'après une étude de Sophos.
Le spam peut s'attaquer à divers médias électroniques : les courriels, les forums de discussion de Usenet, les moteurs de recherche, les wikis, les messageries instantanées, les blogues.
Le spam par courrier électronique est le type de spam le plus répandu. Le coût d'envoi d'un courrier électronique étant négligeable, il est facile d'envoyer un message à des millions de destinataires. Les destinataires assument le coût de réception et de stockage en boîte aux lettres, ce qui peut causer des coûts non négligeables aux prestataires de services, à cause du volume pris par le spam qui lui est considérable : 95 % des courriers reçus en 2009 seraient des spams.
Contrairement aux promotions commerciales pour lesquelles les utilisateurs peuvent avoir donné leur accord, le spam n'est pas sollicité. Il est souvent rédigé spécialement pour contourner les filtres anti-spams. Un mot clé tel que Viagra (souvent vanté dans les spams) peut être ainsi écrit « vi@gr@ » ou « v|agra » ou « v i a g r a » de manière à tromper un filtrage automatique basé sur ce mot. Une autre méthode employée, appelée « spam image » consiste à accompagner un texte anodin d'une image sur laquelle se trouve le véritable message publicitaire, l'absence de mot compromettant en dehors de l'image rendant le filtrage de ces messages très compliqué.
Les expéditeurs de spam redoublent d'imagination pour masquer leurs activités et ne pas être démasqués, que ce soit en falsifiant les adresses d'expéditeur ou en utilisant des serveurs SMTP (serveur de courrier électronique) non sécurisés qui permettent des envois anonymes.
Les adresses auxquelles envoyer du spam sont généralement collectées par des robots d'indexation (« "web crawler" »). Il existe un marché pour les listes d'adresses (sous forme de CD-ROM, ou autres, contenant des milliers d'adresses...) qui aggrave le phénomène du spam : une fois qu'une adresse électronique est divulguée publiquement sur le net et collectée, sa divulgation se fera par le biais du marché noir et non plus sur le seul support du Net.
En novembre 2004, Steve Ballmer, CEO de Microsoft, indique que le fondateur de celle-ci, Bill Gates, qui donne son adresse à chaque prise de parole en public, est sans doute la personne la plus « spammée » au monde, puisqu'il reçoit à l'époque jusqu'à quatre millions d'e-mails par jour. Tout un service de Microsoft est consacré à trier cette masse, essentiellement composée de spams, et dont seulement dix messages par jour arrivent finalement à Bill Gates.
Ce type de spam est apparu sur Usenet avant celui par courrier électronique. Les forums de discussion de Usenet sont une cible facile de spam. En effet, un message envoyé à un forum touche tous les lecteurs du forum. Certains groupes de discussion ne reçoivent pratiquement plus que du spam (c'est l'une des raisons pour lesquelles de nombreux forums sont modérés, c'est-à-dire surveillés par un humain ou un robot qui effectue un tri parmi les articles proposés). D'autre part, les participants de Usenet faisant généralement figurer leur adresse électronique dans leurs articles, les expéditeurs de spam peuvent facilement récolter des milliers d'adresses au moyen d'un robot, puis envoyer du spam aux auteurs de ces articles par courrier électronique.
Le phénomène est rendu encore plus pénible par la publication croisée ou la publication multiple, qui consistent respectivement à destiner un message à plusieurs groupes simultanément ou à envoyer le message dans plusieurs groupes de suite.
Pour cette raison, tout message de promotion, quel qu'il soit, est prohibé dans les forums Usenet, à l'exception du groupe alt.business et apparentés.
Dans Usenet, on parle également de spam lorsqu'un article, quel que soit son contenu, et même s'il n'appartient pas aux catégories usuelles de messages abusifs (publicités commerciales, escroqueries, insultes…) est publié en un nombre d'exemplaires excessif : tous les exemplaires d'un tel article peuvent être annulés par les utilisateurs (les critères numériques exacts permettant d'identifier de tels spams dans la principale hiérarchie francophone sont donnés dans la documentation du forum). Les diverses hiérarchies possédant des critères différents pour identifier et annuler les articles de spam, il existe une certaine incertitude quant aux traitements qui peuvent être appliqués aux spams diffusés simultanément dans plusieurs de ces hiérarchies. Une règle particulièrement simple décide du sort des escroqueries manifestes, c'est-à-dire des articles proposant de « gagner de l'argent rapidement et sans rien faire » (habituellement appelés « MMF », de l'anglais « "Make money fast" » - « gagnez de l'argent rapidement ») : ces articles peuvent être annulés immédiatement par n'importe quel utilisateur.
Les actions des usenautes spécialisés dans la lutte contre le spam donnent souvent lieu à des accusations de censure et de cabale.
Depuis peu, le terme général de « "spamposting" » est parfois utilisé pour désigner le spam apparaissant dans les blogs, forums, livre d'or, etc.
Le « "Messenger spam" » est le spam par messagerie instantanée, ou Spim.
Le développement de la voix sur réseau IP (téléphonie par Internet) fait craindre l'arrivée prochaine sur nos combinés d'un nouveau type de spam, le spam vocal, baptisé "SpIT" ("Spam over Internet Telephony"). En effet, des systèmes comme Skype voient déjà une part notable des appels être d'origine non sollicitée, même s'il s'agit encore de contacts personnels plutôt que de sollicitations commerciales.
Le nombre de SMS de type spam est en forte augmentation. Début 2009, trois mois après l'ouverture du service, signalements avaient été transmis au 33700, le numéro mis en place en France pour lutter contre ce type de spam. Le principe est en général d'inciter le destinataire du message à rappeler un numéro Audiotel surtaxé (préfixé en « 0899 »).
Une autre forme de spam est apparue fin 2009, appelée « "ping call" »: étant appelée par un numéro surtaxé qui ne laisse pas le temps de décrocher (une seule sonnerie), la victime rappelle en fait une boîte vocale, facturée entre 1 et .
En juin 2010, le 33700 a été élargi au spams vocaux avec le même principe de signalement. Ainsi, en France, si un consommateur reçoit un appel ou un message douteux, l’incitant à rappeler un numéro surtaxé, il peut envoyer au 33700 la mention « spam vocal + le numéro d’appel » pour réaliser un signalement.
Optimisation abusive des techniques de référencement destinée aux robots d'indexation de moteur de recherche qui consiste à modifier des pages web en utilisant des mots-clés d'une façon abusive pour améliorer le classement dans les moteurs de recherche.
Parmi les techniques utilisées :
Les opérateurs de sites de recherche comme Google cherchent en permanence des moyens de détecter ce genre de choses et les rendre plus difficiles à utiliser effectivement. Par exemple, un nombre excessif de liens provenant de « fermes » comme «codice_3, peut se solder par une diminution de la pertinence attribuée au site pointé, ce qui est l'effet inverse de celui recherché initialement.
La présence de liens vers un site web est un critère important de classement dans les moteurs de recherche. Afin d'augmenter artificiellement le nombre de liens pointant vers leurs sites, certains créent des blogs, ou mettent des messages de commentaires dans des blogs préexistants, uniquement pour ajouter des liens vers un ou plusieurs sites web à promouvoir.
L'automatisation de ce genre de pollution a mené plusieurs logiciels de blog à introduire des contrôles (Captcha) qui rendent cette automatisation par une machine plus complexe à réaliser.
De nombreux expéditeurs de spam ou publicitaires ajoutent des liens vers leurs sites sur des wikis, en particulier ceux modifiables par des personnes non inscrites, comme Wikipédia. En réponse, certains wikis mettent en place des listes noires (liens interdits) ou l'obligation (sauf éventuellement pour les membres inscrits depuis suffisamment de temps) de passer un Captcha pour ajouter un lien vers un autre site lors de la modification d'une page.
Le spam n'est pas qu'une pollution virtuelle ; il se traduit par une hausse significative de la consommation électrique des réseaux et serveurs informatiques :
Ainsi, selon une étude publiée en avril 2009 ; rien qu’en 2008, environ de messages indésirables ont consommé une quantité d’énergie (électricité) correspondant pour sa production à l’émission de de tonnes de , soit 0,2 % des émissions mondiales de gaz à effet de serre (GES) ou l'équivalent des émissions de GES de de voitures en un an.
Un peu plus de la moitié (52 %) de cette énergie est consommée à l’ouverture et lors de la suppression du spam par l’utilisateur ( de kWh/an) alors que la circulation de l'émetteur au récepteur n'a consommé « que » 2 % de toute l’électricité dépensée par le réseau Internet. La moyenne d'émission en d'un seul spam serait de de par spam. Chaque usager professionnel d'Internet a ainsi en 2008 émis indirectement d’équivalent-. Sur ces , environ (22 %) l'ont été à cause des spams ; c’est comme si chaque usager brûlait inutilement américains () de fioul par an. Pour prendre une autre comparaison, les de KWh ainsi gaspillés correspondent environ à l'équivalent de de production de base d'électricité ou à la puissance fournie par quatre grandes nouvelles centrales électriques au charbon.
Les filtres anti-spam consomment aussi de l’énergie ; de kWh/an ; soit 16 % de l’énergie consommée par les spams, ce à quoi il faut ajouter 16 % correspondant à la gestion des « faux positifs ».
La lutte contre le spam s'articule autour de quelques grands axes :
Exemples :
La directive du 24 octobre 1995 relative à la protection des personnes physiques à l'égard du traitement des données à caractère personnel et à la libre circulation de ces données prévoit que les données à caractères personnel doivent être traitées loyalement et licitement, avec le consentement clair de la personne concernée. Ces données ne peuvent être collectées que pour des finalités déterminées et explicites.
La directive du 12 juillet 2002 sur la protection de la vie privée dans le secteur des communications électroniques précise l'interdiction d'envoi de messages commerciaux non sollicités en instaurant le principe dit de l'« "opt-in" » : un opérateur doit obtenir le consentement du destinataire avant de lui envoyer des messages commerciaux.
Le principe introduit par la directive européenne a été transposé en France par la loi du 21 juin 2004 pour la confiance dans l’économie numérique et figure désormais à l'article L.34-5 du code des postes et des communications électroniques, repris à l'article L.121-20-5 du code de la consommation : 
La Cnil indique qu'un formulaire doit demander le consentement d'une personne à l'envoi de messages commerciaux à son adresse ; la case correspondante ne doit pas être pré-cochée. Même si le message est envoyé de manière légale, le courrier de prospection doit proposer au destinataire un moyen simple de refuser toute utilisation ultérieure de ses coordonnées. La formation contentieuse de la Commission a prononcé une sanction pécuniaire de le 12 janvier 2012, à l'encontre d'une société qui utilisait les numéros de téléphone des internautes, contenus dans des petites annonces diffusées en ligne.CNIL. La délibération relève 4 manquements à la Loi informatique et liberté commis par la société D.S.E. France : absence de consentement des prospects ; absence des mentions légales relatives à l'identité du responsable de la collecte et de ses finalités ; absence des mentions légales relatives au droit d'opposition, d’accès ou de rectification de la collecte ; absence de prise en compte des plaintes adressées par les prospects aux responsables de la société D.S.E. France.
La récupération des adresses électroniques (sur le web, sur des forums de discussion) de manière automatique est elle-même interdite. L'article 226-18-1 du code pénal, introduit par une loi du 6 août 2004, punit de cinq ans d'emprisonnement et de d'amende un « traitement de données à caractère personnel concernant une personne physique malgré l'opposition de cette personne, lorsque ce traitement répond à des fins de prospection, notamment commerciale ». Même pour des faits antérieurs à la loi du 6 août 2004, la cour de cassation avait déjà confirmé l'interdiction d'utiliser des robots collecteurs d'adresses électroniques en se basant sur l'article 226-18 du code pénal, qui réprime « le fait de collecter des données par un moyen frauduleux, déloyal ou illicite, ou de procéder à un traitement d'informations nominatives malgré l'opposition de la personne ».
Les États-Unis ont développé une législation anti-spam au niveau d'un grand nombre d'États ainsi qu'au niveau fédéral ("CAN-SPAM Act" du 16 décembre 2003). Le mécanisme est celui de l"'opt-out", c’est-à-dire que le destinataire de messages commerciaux doit avoir la possibilité de demander à ne plus recevoir ces messages, alors que le système européen, plus restrictif pour les auteurs de messages commerciaux, exige un consentement "a priori" du destinataire ("opt-in").
Techniquement, l'envoi de courriel en masse demande des ressources importantes. Les spammeurs n'en disposent pas forcément, et ils souhaitent en outre masquer ou effacer les traces de leur activité frauduleuse. Pour cela, ils attaquent très couramment des machines tierces, notamment pour les transformer en machines zombies. En France, il est donc fréquent que, du point de vue juridique, les expéditeurs de spam tombent également sous le coup des articles 323-1 et suivants du code pénal.
Variantes de spam
Culture informatique générale
Contre-mesures anti spam à l'usage des destinataires
Contre-mesures anti spam pour webmasters