<-Back

热贴(retie.fm)发布了

起因

我在去年就注册了retie.fm这个域名,当时是想做一个网站用来搜集互联网上的热门帖子,过去的一年在某公司加班太多(基本上是996),完全没有足够的时间投入到个人项目中,所以开发计划一直搁浅,直到最近才完成了这个项目的第一个版本:http://retie.fm

截图:

项目介绍

整个项目由crawler+web两部分构成,其中:

– web部分:django(1.8) + mongodb

– crawler部分:requests + mongodb

爬虫部分先只开发了豆瓣小组的爬虫,其实大部分代码是从瓦力酱的项目中复用过来的,稍微做了一些调整。

服务器是Linode VPS 2GB Plan 日本东京节点,延迟还算能够接受。帖子列表的排序算法参考了Reddit。

下一步要做的

第一个版本开发周期比较短,没有在UI、代码结构上做太多的优化,只能算的上一个demo吧,因此在下一个版本中,会对UI部分进行重构,代码部分也会持续优化、增加其它站点的爬虫。

“多说”已关闭,原评论数据丢失