То, что разработка сайтов сегодня не имеет большого смысла без привязки его работы к алгоритму работу поисковой системы, не является большим секретом для более или менее знакомых с этой темой пользователей Интернет.
Внедренная в прошлом году в «Яндексе» система машинного обучения «Матрикснет» облегчает жизнь и специалистам в области Интернет-рекламы, для которых продвижение сайтов в Сети является той деятельностью, с помощью которой они зарабатывают себе на хлеб.
Что же такое «Матрикснет»?
Как известно, предназначение любой поисковой системы заключается в том, чтобы предоставлять пользователям по их запросам максимально точную, полезную и актуальную информацию. На сегодняшний день ресурсов в Интернет так много, что по некоторым запросам система может «предложить» пользователю более миллиона страниц. Ясно, что «переварить» такое огромное количество информации он будет просто не в состоянии.
Для каждого запроса, которые делают пользователи к поисковым машинам, написать собственную программу невозможно. Их больше 100 миллионов и более 50% из них уникальны. Поэтому выход один - поисковая машина должна научиться принимать решения самостоятельно, т.е. быть способной к самообучению. Это означает, что машина должна сама ранжировать страницы правильно, на основе того правила, которое сама и выводит, учитывая массу факторов: есть ли слово-запрос на просматриваемой странице, где оно расположено, есть ли ссылки со сторонних ресурсов на нее и т.п. В какой-то момент робот так «навостриться» искать закономерности, что начинает учитывать такие факторы и находить такие связи, которых вообще не существует.
Метод машинного обучения «Матрикснет» позволяет сохранить устойчивость робота к эффективному переобучению. Он дает возможность поисковой машине строить формулу ранжирования страниц, которая учитывает огромное количество факторов и существенно оптимизировать поиск, сделать его более точным.
Интересно, что, создав метод машинного обучения, компания «Яндекс» даже не запатентовала его. Как объясняют в самой компании, что-то патентовать в софте бессмысленно, т.к. защита технологии может быть обеспечена только знаниями ее разработчиков. Скорее всего, технология «Матрикснет» будет описана в одном из научных или профессиональных журналах. Именно так и развивается этот бизнес, когда узнав о том, что создал лидер, другие предпочитают идти иным путем.