是这样,工作中一直用 tableau 做简单的可视化分析,例如根据用户的使用次数、历史记录关键词词云、主题分布做简单的资源推荐,用户的行为分为检索、浏览、下载三种,其中浏览过且未下载的部分是自愿的推荐点。
如今我想做进一步的分析,思路是想根据用户使用历史的关键词做聚类,然后找到他们浏览过且未下载的资源的特征,然后做可视化分析。
现在已经用 jieba 做好了分词,卡在了根据每个 session id 的关键词聚类分析,想请教各位大佬,给点启发,万谢~