Google усиливает борьбу с сайтами-плагиаторами — ресурсами, которые практически слово в слово повторяют контент других сайтов, чтобы улучшить свои позиции в поисковой выдаче. Не так давно поисковик запустил очередное крупное обновление алгоритма Panda, предназначенного специально для этой цели, однако многие добросовестные ресурсы обнаружили снижений позиций в своей выдаче, в то время как многие плагиаторы, напротив, усилились.
Компания заявила: «Google тестирует изменения алгоритма для сайтов-плагиаторов, преимущественно блогов. Мы просим присылать нам примеры таких сайтов — эти данные будут использоваться для тестирования и усовершенствования наших алгоритмов». Разработчики приоткрыли некоторые подробности относительно работы последнего алгоритма, который, впрочем, охраняется крайне тщательно. Он включает несколько сотен ключевых элементов, и порядка пятисот изменений вносятся каждый год.
«В каком-то смысле мы меняем алгоритм почти каждый день», — говорит работник Google Амит Сингх (Amit Singh). Его слова подтверждает технический директор Скотт Хаффман (Scott Huffman): «Всегда есть набор мотивирующих запросов, и поиск по этим запросам работает не так, как нам бы хотелось. В связи с этим инженеры по выдаче выдвигают гипотезу о том, какие сигналы и какие данные нам следует интегрировать в алгоритм». Важнейшей стадией испытания алгоритма является работа с тестировщиками. Это люди, которым предоставляется возможность испытать несколько алгоритмов и определить, в каком из них оптимальная выдача. Разработчик демонстрирует им две версии и предлагает сделать выбор.
Впрочем, в данный процесс вовлечены и рядовые пользователи, которые пользуются общедоступными результатами поиска. Небольшое число пользовательских запросов после обработки поисковиком направляется в лабораторию разработчиков, где проводится их статистический анализ. В 2010 году, по словам сотрудников Google, было проведено более 20 тыс. различных экспериментов, по результатам которых поиск был так или иначе усовершенствован. «Мы проводим глубокое исследование каждого возможного изменения, дабы убедиться, что это необходимо пользователям», — заключил господин Хаффман.