La collecte d’emails (email harvesting en anglais, qui signifie moissonner) est l’acquisition d’adresses email pour de la publicité déloyale, des attaques de phishing et la propagation de logiciels malveillants. Des programmes spécialisés, qui sont des robots moissonneurs d’emails, ou spambots, passent au peigne fin les sites Web, les listes de contact, les forums et les réseaux sociaux à la recherche d’adresses email. La syntaxe caractéristique des adresses email fournit des indices pour identifier les informations convoitées. Par exemples, les robots effectuent des recherches dans les textes sources avec le signe @. En effet, ce signe n’est généralement pas utilisé en tant que tel dans les textes, mais seulement pour séparer le nom de l’utilisateur du domaine dans les adresses email. Les descriptions offrent également une protection insuffisante. Les spambots sophistiqués incluent souvent d’autres orthographes, comme [at], [AT], (at) ou (AT) dans leur recherche :
utilisateur@domaine.fr
utilisateur[at]domaine.fr
Si le signe @ ou ses équivalents contiennent deux termes séparés par un point, c’est une indication claire qu’il s’agit bien d’une adresse email. La description du point caractéristique avant le top level domain offre également une protection faible, et réduit la lisibilité.
utilisateur[AT]domaine[POINT]fr
La référence email HTML est encore plus traitresse, comme dans l’exemple "mailto:utilisateur@domaine.fr". Ceci permet aux visiteurs d’un site Web d’ouvrir leur programme d’email préféré en un seul clic, et l’adresse du destinataire est automatiquement copiée dans le champ correspondant. C’est certes pratique, mais cela permet aussi aux spambots de comprendre clairement qu’il s’agit d’une adresse email prête à être capturée. Par conséquent, les opérateurs de sites Web essaient parfois de forcer les modèles classiques pour fournir des adresses email. Pourtant, il est important de maintenir une lisibilité optimale pour les internautes afin d’autoriser un accès sans obstacle aux adresses email.