V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
liuliliuli2017
V2EX  ›  Python

爬虫学习日记/知乎简史 1

  •  
  •   liuliliuli2017 · 2017-03-22 22:35:38 +08:00 · 1753 次点击
    这是一个创建于 2809 天前的主题,其中的信息可能已经有所发展或是发生改变。

    昨天转载收录的文章有人回复 V2 禁止全文转载。于是我看了下使用指南,的确明确指出反对全文转载,这里表示抱歉,所以说获得作者授权也不能转载么?

    本意是方便学习,所以从现在开始我只对文章进行摘抄好了,文章收录待用,修改转载已取得腾讯云授权


    • 知乎爬虫运行在腾讯云主机上的原因是怕被网站封 IP ,这里提醒下各位程序员在部署爬虫的时候注意不要调的太高并发,对于网站的正常用户访问造成影响,这也算是使用爬虫主要注意的一点基本技术素养吧。

    • 1.知乎 200 位种子用户中创业者占比最高,设计师类活跃度最高。

    • 2.知乎四位创始人在知乎上回答的时间分布-活跃曲线,看看知乎这样的社区产品是不是存在对于创始团队活跃度的依赖?

    • 3.分析回答的问题中涉及关键词的词频分析,看看知乎的社区氛围在创始人们回答中体现的如何?

    小结:从以上数据我们可以看出

    • 1 )知乎的近 200 位种子用户中,互联网领域创业者、投资人、程序员、媒体人偏多,但是从用户活跃数据来看,知乎上、艺术、教育、电影等其他类目的用户也颇为活跃,“互联网”以外其他话题的火热,也是知乎能够走到今日用户规模的重要原因。
    • 2 )知乎社区亟待形成认真回答氛围的早期,需要创始团队积极参与社区内容建设。知乎的 4 位创始人在知乎成立的头三年 2010-2012 年累计回答了 2345 个问题,占他们 4 人累积回答数的 86%, 13-15 年合计回答了 312 个问题, 16 年-17 年一共才回答了 39 个问题,说明社区的氛围走上轨道了。
    • 3 )知乎的创始人们回答问题也不是都能达到超过 1000 个赞,知乎创始人们累计回答 2696 个问题,获赞 27 万,也就是平均 1 个回答 100 个赞左右,所以你的知乎回答,获赞数量有没有超过 100 个赞这个水准呢?

    后续计划在下一篇文章中分析知乎产品迭代的版本历史,分析哪些是核心的功能迭代,知乎整体的信息流来源与分发机制,商业变现的产品形态;从知乎小管家的文章看社区机制的变化,社区成长的不同阶段, KOL 群体演化的历史,比如传说中的知乎万粉群的存在。


    原文来自: https://www.qcloud.com/community/article/245046001488461803

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2777 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 09:59 · PVG 17:59 · LAX 01:59 · JFK 04:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.