去年写了一个聚合当天“相似”新闻的工具,一个相似的新闻,被越多网站发布,那排序值就越高,同时会展示出来每个网站的发布时间和链接。
但是之前的聚合算法存在一些缺陷,有些八竿子打不着的新闻被聚合成一条了,所以趁着五一假期优化了一下,下面是效果(使用 circle ci ,每小时自动跑一次):
有兴趣的小伙伴可以看看: https://github.com/echosoar/news