Графический спам (сообщения, где либо все содержание, либо существенная его часть переданы графическими вложениями) появился в массовых масштабах в российской сети около года назад. Это был ответ спамеров на развитие методов фильтрации рекламных рассылок по тексту сообщений. Они предполагали, что анализ изображений в антиспам-фильтрах будет реализовать труднее, чем анализ текстов писем.
Первые графические фильтры были внедрены в почтовой системе Mail.ru около года назад в августе 2003 г., что позволило тогда практически полностью решить проблему. Однако, уже через несколько месяцев последовал спамеры резко изменили тактику: к весне 2004 г. существенную долю спама составили т.н. «мутирующие изображения». При помощи специальной программы в момент рассылки автоматически создаются картинки, незначительно отличающиеся друг от друга (например, по углам добавляются маленькие, в несколько пикселей, цветные пятнышки или квадратики). Такое «зашумление» значительно затрудняет автоматический анализ.
Для решения этой проблемы в антиспам-фильтры, установленные на Mail.ru была внедрена технология нечеткого сравнения изображений, игнорирующая внесенный спамерами «графический шум». Новая версия системы использует эвристические алгоритмы, созданные на основе многолетнего анализа спам-изображений. В процессе сканирования технология не использует пополняемой базы данных. Таким образом, обнаруженные массовые рассылки могут быть пресечены на самых ранних стадиях. Длительный период тестирования не зафиксировал каких-либо ложных срабатываний, таким образом, легитимная пересылка изображений не пострадает. Применяемая технология анализа графики пригодна и для работы с другими бинарными вложениями.