Запросы объединяются по трем основным критериям: семантика запроса, интент и соответствие топ-10.
- По семантике запросы делятся на 2 категории:
- информационные запросы - те, по которым пользователь рассчитывает найти не товар или услугу, а ответ на свой вопрос, информацию.
- транзакционные (коммерческие) запросы - напротив, те, по которым ищут уже конкретное предложение.
- Интент – понятие, сходное с семантикой, но более узкое. Здесь более точное намерение пользователя, с которым он вбивает определенный запрос в строку поиска. Поэтому запрос определяют на конкретную страницу в СЯ – новую или уже существующую.
- Подход по соответствию топ-10 - подход, при котором в выдаче по разным запросам ищут пересекающиеся ссылки на документы. Чем больше страниц пересекается по запросам – тем выше вероятность, что эти запросы нужно в рамках СЯ объединить на одной странице.
Выделяют три метода кластеризации по топ-10: soft, middle и hard. Они различаются трудоемкостью и релевантностью результатов.
Подробнее о принципах кластеризации семантического ядра рассказали в статье.