В данном случае не принципиально какую частотность ключевых слов использовать для кластеризации – частотность используется чтобы определить маркеры – самые частотные ключевые слова – к ним и будут привязываться все остальные ключевые слова.
Не волнуйтесь насчет качества кластеризации
Наш алгоритм проверяет правильно ли привязались ключевые слова. Не подходит ли конкретное ключевое слово другому кластеру больше? И сам автоматически переносит слова между кластерами.
Результат кластеризации практически не зависит от выбранной частотности – разница составляет 1-3%
Практический смысл с точки зрения частотности
Смысл состоит в том – какую частотность вы хотите видеть в результате кластеризации, чтобы потом не притягивать ее вручную. Например, вам нужна частотность «! » для дальнейшей работы с семантикой, а в кластеризации вы использовали частотность « » и частотность «!» вам придется притягивать к кластеризованным запросам вручную в Excel. Так что, выбор частотности для кластеризации – вопрос удобства дальнейшей работы с семантикой. Скоро появится возможность хранить все виды частотности в задачах по кластеризации, следите за обновлениями