05
Окт
2016

Кластеризация текстов после doc2vec

У меня есть выборка из текстов. Пропустил из через doc2vec из библиотеки gensim. Результат хороший. Похожие тексты определяет на ура. Как можно кластеризовать тексты?

Пробовал делать так: получил вектор для каждого текста. Закинул все это в k-means. Результат получился не очень хороший.

Какие еще подходы можно использовать, имея на руках обученную модель doc2vec?

Источник: https://ru.stackoverflow.com/questions/574261/%D0%9A%D0%BB%D0%B0%D1%81%D1%82%D0%B5%D1%80%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F-%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%BE%D0%B2-%D0%BF%D0%BE%D1%81%D0%BB%D0%B5-doc2vec

Тебе может это понравится...

Добавить комментарий