@贱贱同学认识好久了(整整12天),对贱贱同学的博学,有趣,高产深深的吸引,带着对贱贱同学的无比崇拜之情(以上皆为假客套),我自费请了一个会汉语的法(fà)国小哥,叫作农德基艾斯,花了整整一晚上的时间,帮我整理出了一份贱贱同学的个人知乎数据。

数据是周六晚上(2018-01-20)整理出来的,感谢农德同学的辛苦,欠你的工资等下个月发工资了一定还你。

共整理出 关注者75,426人,关注的人1,921人,回答881篇,文章44篇,共获赞同数201,529(包含已折叠的回答),总评论数98,240(不包含想法的评论和已折叠的评论)。

其中,第一篇回答,诞生于2017年建军节的零点,我想知道建军节那天到底发生了什么,让你决定开始来知乎分享你刚编的故事。

刚又看了一下(2018-01-22),关注者为75,843人,回答892篇,获得赞数203,051。这个增长量。。不得不说。。贱贱大哥真是高产似。。。

假装一不小心打多了一个"似"。

男女比例

先简单看下男女比例:

{
  "option": {
    "title": {
      "text": "关注者男女比例",
      "x": "center"
    },
    "series": [
      {
        "type": "pie",
        "data": [
          {
            "value": 30645,"name": "未知"
          },
          {
            "value": 16118,"name": "女"
          },
          {
            "value": 28663,"name": "男"
          }
        ]
      }
    ]
  }
}
{
  "option": {
    "title": {
      "text": "关注的人男女比例",
      "x": "center"
    },
    "series": [
      {
        "type": "pie",
        "data": [
          {
            "value": 90,"name": "未知"
          },
          {
            "value": 425,"name": "女"
          },
          {
            "value": 1406,"name": "男"
          }
        ]
      }
    ]
  }
}

不管是关注者还是关注的人,汉子都是半边天啊。看来不管是撩汉子还是被汉子撩,贱贱哥都很有一手啊。不知道贱贱哥什么时候有空,我们一起去gay吧坐坐。

其中互相关注的有1916人。如图:

{
    "option": {
                      "legend":{"show":false},
                      "series": [
                          {
                              "type": "pie",
                              "radius": [0, "65%"],
                              "label": {
                                  "position": "inner",
                                  "align": "left",
                                  "verticalAlign": "top",
                                  "formatter": "{b}:{c}({d}%)"
                              },
                              "data": [
                                  {"value": 5, "name": "非互相关注","labelLine":{"show":false}},
                                  {"value": 1916, "name": "互相关注"}
                              ]
                          },
                          {
                              "type": "pie",
                              "radius": ["60%", "80%"],
                              "data": [
                                  {"value": 5, "name": "非互相关注","label":{"show":false},"labelLine":{"show":false,"emphasis":{"show":false}}},
                                  {"value": 1404, "label":{"formatter":"男:1404(73.27%)"},"tooltip":{"formatter":"互相关注-男:1404(73.27%)"}},
                                  {"value": 423, "label":{"formatter":"女:423(22.08%)"},"tooltip":{"formatter":"互相关注-女:423(22.08%)"}},
                                  {"value": 89,"label":{"formatter":"未知:89(4.65%)"},"tooltip":{"formatter":"互相关注-未知:89(4.65%)"}}
                              ]
                          }
                      ]
                  }
}

这TM什么情况?!忍不住感慨一句: 卧槽 !
怎么还有剩下5个人没有互相关注? 统计了一下,剩下五个人的关注者总人数为:1,034,235。平均每人206,847。嗯。。可能这五个人觉得贱贱哥的咖位还不够吧。

最后,希望多点热爱自然科学的妹子关注@贱贱,也希望@贱贱也多关注点热爱自然科学的妹子,哈哈。

关注度分析

通过关注度,对用户做一个简单的分级:

分别看下关注的人和关注者的用户情况:

{
  "option": {
    "title": {
        "text": "关注的人",
        "x": "left"
      },
    "series": [{
        "type": "pie",
        "radius":"75%",
        "data": [
          {"value": 470,"name": "初级用户"},
          {"value": 717,"name": "中级用户"},
          {"value": 378,"name": "高级用户"},
          {"value": 191,"name": "小V用户"},
          {"value": 94,"name": "中V用户"},
          {"value": 64,"name": "大V用户"},
          {"value": 7,"name": "普通用户"}
        ]
    }]
  }
}
{
  "option": {
    "title": {
        "text": "关注者",
        "x": "left"
      },
    "series": [{
        "type": "pie",
        "radius":"75%",
        "data": [
          {"value": 15437,"name": "初级用户"},
          {"value": 899,"name": "中级用户"},
          {"value": 416,"name": "高级用户"},
          {"value": 206,"name": "小V用户"},
          {"value": 101,"name": "中V用户"},
          {"value": 68,"name": "大V用户"},
          {"value": 58299,"name": "普通用户"}
        ]
    }]
  }
}

其中,关注的人当中,关注度最高的为902,167; 关注者当中(相互关注的除外),关注度最高的为208,871。

对比这两个图,至少可以说明,贱贱哥的占比99.7%的相互关注也许大概可能并不是逢人就点的。。
而在关注的人当中,大部分处于中级用户,我个人猜测,很有可能处在这个阶段的知乎用户是最活跃的,而很多大V用户现在基本不怎么活跃了,所以曝光度不是很高。所以很有可能整个知乎,在回答的产出上,也是这个区间的人是最活跃的。

以上这个观点纯属瞎猜,如果你也这么觉得,那么。。你一定也是瞎猜。

@贱贱,看我这么认真的揣测你。来评论区说下你点关注的原则呗。

活跃度分析

知乎是个很神奇的应用,刚来的时候,会感觉发现了一个新的世界,时间久了,也就主要是跟着带逛。

所以有的知乎账号,号还在,但人没了。对于这种没有灵魂的账号,称之为僵尸用户。那贱贱同学关注的人与关注者有多少僵尸用户呢?

所以,我又让农德同学统计了所有 关注的人和关注者 的动态。

根据最近一条动态的时间,对用户活跃程度做一个定义:

同时对活跃用户,又细分为四个区间:

关注者的活跃度如图:

{
    "option":{
                     "legend": {"show": false},
                     "series": [
                         {
                             "type": "pie",
                             "radius": [0, "75%"],
                             "label": {
                                 "position": "inside",
                                 "formatter": "{b}:{c}({d}%)"
                             },
                             "data": [
                                 {"value": 72104, "name": "活跃用户"},
                                 {
                                     "value": 3120,
                                     "name": "僵尸用户",
                                     "label": {"padding": [20, 30, 0, 0]}
                                 },
                                 {
                                     "value": 202,
                                     "name": "无动态",
                                     "label": {"padding": [0, 0, 30, 30]}
                                 }
                             ]
                         },
                         {
                             "type": "pie",
                             "radius": ["70%", "100%"],
                             "data": [
                                 {
                                     "value": 43286,
                                     "label": {"formatter": "3天内:43286(60.03%)"},
                                     "tooltip": {"formatter": "3天内:43286(60.03%)"}
                                 },
                                 {
                                     "value": 10923,
                                     "label": {"formatter": "1周内:10923(15.15%)"},
                                     "tooltip": {"formatter": "1周内:10923(15.15%)"}
                                 },
                                 {
                                     "value": 14251,
                                     "label": {"formatter": "1月内:14251(19.76%)"},
                                     "tooltip": {"formatter": "1月内:14251(19.76%)"}
                                 },
                                 {
                                     "value": 3644,
                                     "label": {"formatter": "2月内:3644(5.05%)"},
                                     "tooltip": {"formatter": "2月内:3644(5.05%)"}
                                 },
                                 {
                                     "value": 3120,
                                     "name": "僵尸用户",
                                     "label": {"show": false},
                                     "labelLine": {"show":false,"emphasis":{"show":false}}
                                 },
                                 {
                                     "value": 202,
                                     "name": "无动态",
                                     "label": {"show": false},
                                     "labelLine": {"show":false,"emphasis":{"show":false}}
                                 }
                             ],
                             "label": {"formatter": "{b}:{c}"}
                         }
                     ]
                 }
}

从图看大部分用户还都是活跃用户,活跃用户总人数为72,104人。所有活跃用户的关注者数量为:11,394,799。
也就是说,贱贱哥回答一个问题后,获得的有效曝光度也就7万多人,而假设这7万人都点赞了,又可以间接的曝光给一千多万人。当然这一千万人中,可能也会有不少僵尸用户。

另外可以看到,已经产生了3,120个僵尸用户,如果贱贱哥真的是从第一篇回答才开始玩知乎的话,那从8月份到现在五个多月的时间,就流失了3000多个用户,个人感觉知乎用户的流失问题还挺严重的。

看下贱贱哥关注的人的活跃度情况:

{
"option": {
                           "legend": {"show": false},
                           "series": [
                               {
                                   "type": "pie",
                                   "radius": [0, "75%"],
                                   "label": {
                                       "position": "inner",
                                       "align": "center",
                                       "verticalAlign": "top",
                                       "formatter": "{b}:{c}({d}%)"
                                   },
                                   "data": [
                                       {"value": 1908, "name": "活跃用户"},
                                       {"value": 13, "name": "僵尸用户","labelLine":{"show":false,"emphasis":{"show":false}}}
                                   ]
                               },
                               {
                                   "type": "pie",
                                   "radius": ["70%", "85%"],
                                   "data": [
                                       {"value": 1536,"label":{"formatter":"3天内:1536(80.5%)"},"tooltip":{"formatter":"3天内:1536(80.5%)"}},
                                       {"value": 181, "label":{"formatter":"1周内:181(9.49%)"}, "tooltip":{"formatter":"1周内:181(9.49%)"}},
                                       {"value": 160, "label":{"formatter":"1月内:160(8.39%)"}, "tooltip":{"formatter":"1月内:160(8.39%)"}},
                                       {"value": 31, "label":{"formatter":"2月内:31(0.68%)"}, "tooltip":{"formatter":"2月内:31(0.68%)"}},
                                       {"value": 13, "name": "僵尸用户", "label": {"show": false},"labelLine":{"show":false,"emphasis":{"show":false}}}
                                   ],
                                   "label": {"formatter": "{b}:{c}"}
                               }
                           ]
                       }
}

关注的人中,活跃度相对较高的一点,所以能不能假设活跃情况和用户的关注者人数可能是成正比的。

所以,将关注者的活跃度和关注度做一个对比,由于关注的人中,接近100%都是互相关注的,就不再统计了,如图:

{
    "option":{
                 "legend": {"show": false},
                 "series": [
                     {
                         "type": "pie",
                         "radius": [0, "65%"],
                         "label": {
                             "position": "inner",
                             "align": "center",
                             "formatter": "{b}:{c}({d}%)"
                         },
                         "data": [
                             {"value": 375, "name": "小中大V用户", "label": {"padding": [0, 0, 10, 0]}},
                             {"value": 16752, "name": "初中高级用户", "label": {"padding": [20, 0, 0, 0]}},
                             {"value": 58299, "name": "普通用户"}
                         ]
                     },
                     {
                         "type": "pie",
                         "radius": ["60%", "79%"],
                         "data": [
                             {"value": 373, "label": {"formatter": "活跃用户:373(99.47%)"}, "tooltip": {"formatter": "小中大V-活跃用户:373(99.47%)"}},
                             {"value": 2, "label": {"formatter": "僵尸用户:2(0.53%)"}, "tooltip": {"formatter": "小中大V-僵尸用户:2(0.53%)"}},
                             {"value": 16576, "label": {"formatter": "活跃用户:16576(98.95%)"}, "tooltip": {"formatter": "初中高级-活跃用户:16576(98.95%)"}},
                             {"value": 176, "label": {"formatter": "僵尸用户:176(10.51%)"}, "tooltip": {"formatter": "初中高级-僵尸用户:176(10.51%)"}},
                             {"value": 55155, "label": {"formatter": "活跃用户:55155(94.61%)"}, "tooltip": {"formatter": "普通-活跃用户:55155(94.61%)"}},
                             {"value": 2942, "label": {"formatter": "僵尸用户:2942(5.05%)"}, "tooltip": {"formatter": "普通-僵尸用户:2942(5.05%)"}},
                             {"value": 202, "label": {"formatter": "无动态:202(0.35%)"}, "tooltip": {"formatter": "普通-无动态:202(0.35%)"}}
                         ],
                         "label": {"formatter": "{b}:{c}"}
                     }
                 ]
             }
}

可以看到,在大中小V这个区间里,僵尸用户占比是最小的,不过,我的数据量太小了,参展指标也有点单一,不太好说明两者到底存在哪些确定的关联。

接下来主要看下僵尸用户,查了一下僵尸时间的最后动态时间,
其中关注者中,最僵的用户僵在了2011年07月,关注的人中,最僵的用户僵在了2017年03月。

咦,11年,是不是有点懵逼。。那问题来了,一个不产生任何动态的用户和真正的僵尸用户有什么区别?

直观的看下关注者中僵尸用户的关注度情况:

{
    "option": {
        "series": [{
            "type": "pie",
            "data": [
                {"value": 2942, "name": "普通用户"},
                {"value": 168, "name": "初级用户"},
                {"value": 10, "name": "中级及以上用户"}
            ]
        }]
    }
}

这个占比情况,大概也是符合预期的。而哪些是正经的僵尸用户哪些是深海潜水用户呢?

我觉得,最新的动态在贱贱哥第一篇回答之前的,都有可能只是潜水而已,搞不好哪一天会出来诈个尸。

所以就以贱贱哥的第一篇回答的时间作为起点,所有僵尸用户,僵在在2017年08月01日之前的404人,占比12.95%。话说回来,这四百多位潜水用户,对知乎和贱贱哥还真的是不求回报的默默的喜欢呢。

互动分析

另外,通过统计881篇回答和44篇文章中的所有点赞和评论,点赞最高的用户共赞了618次,评论最多的用户共评论了633条。

这些都还好,最可怕的是,贱贱哥的回复总共38,039条。可见贱贱哥对大家的评论还是很上心的。

通过点赞数,对关注者做一个定义:

{
    "option": {
        "series": [{
            "type": "pie",
            "data": [
                {"value": 11, "name": "忠实粉"},
                {"value": 764, "name": "普通粉"},
                {"value": 19738, "name": "佛系粉"},
                {"value": 54913, "name": "路人粉"}
            ]
        }]
    }
}

哈哈,这个出乎意料,为什么这么多只关注不点赞的,贱贱哥你是不是应该反省一下。

由于我之前的一个回答,和很多人私信后了解到,因为关注者里有比较在意的人,好多人对于点赞都很慎重,因为会展示在别人的首页里。

所以,贱贱哥,大家都不给你点赞,你心里有点13数么?

另外对评论也做一个定义:

{"option":{
              "series": [{
                  "type": "pie",
                 "radius":"73%",
                  "data": [
                      {"value": 224, "name": "普通"},
                      {"value": 7493, "name": "冒泡"},
                      {"value": 67624, "name": "潜水"},
                      {"value": 8, "name": "话痨"},
                      {"value": 20, "name": "活跃"},
                      {"value": 57, "name": "佛系"}
                  ]
              }]
          }}

其中,潜水用户和路人粉重合人数为51,970。所以,贱贱哥,这么多人既不评论也不点赞,你心里是不是该有点13数了。

曝光度分析

其实我们每一个回答,很多时候并不是抱着求赞的心态,主要是希望解答别人的疑惑,或者带给别人一些思考和启发,只要有人觉得我的回答有意思或者有意义,就会觉得写下的这些文字没有白费(本文除外,赞我,使劲赞我!)。

之前我的一个回答,有人特意私信我说他觉得特别有意思,但是因为有比较在意的人关注了他,所以没有点赞。当时真的是蛮感动的(内心OS:那请注册小号点赞)。

不过可以量化的点赞数和感谢数,更容易对每一个回答者带来成就感(不然我回答干嘛)。

同时呢每一次点赞不仅仅是一种认可,也是一种传播,把你赞同的思想分享给每一个关注你的人。

好了,就是写到这里突然想感慨两句,手动分隔一下。

每个回答的曝光,主要有以下几个途径:

  1. 知乎推荐
  2. 提醒关注了该问题的人有了新回答
  3. 会展示给每一个关注者
  4. 点赞后,展示给点赞者的关注者

其中最简单粗暴直接有效的,就是点赞了,也可以说是最主要的途径。

所以计算出该问题下的点赞用户的关注者的总数,就可以粗糙的认为就是该问题的曝光次数。

由于回答和文章较多,这里就只看下曝光数top5的情况:

{
"option":{
            "title": {"text": "文章","x": "left"},
             "legend": {"data":["曝光度","点赞数"]},
             "xAxis": [{
                 "type": "category",
                 "axisLabel": {"interval": 0, "rotate": 20},
                 "data": ["十年以...贬值", "201...”名", "从高校.....", "那些在...目录", "远离那...有毒"]
             }],
             "yAxis": [{"type": "value"}],
             "series": [
                 {
                     "name": "点赞数",
                     "type": "bar",
                     "data": [1812, 287, 837, 547, 560]
                 },
                 {
                     "name": "曝光度",
                     "type": "bar",
                     "data": [1185390, 306273, 255410, 210235, 188856]
                 }
             ]
         }
}
{"option":{
            "title": {"text": "回答","x": "left"},
             "legend": {"data":["曝光度","点赞数"]},
             "xAxis": [{
                 "type": "category",
                 "axisLabel": {"interval": 0, "rotate": 20},
                 "data": ["如何看...A片", "求详细...等等", "如何解...成果", "如何看...控评", "如何看...死亡"]
             }],
             "yAxis": [{"type": "value"}],
             "series": [
                 {
                     "name": "点赞数",
                     "type": "bar",
                     "data": [5207, 5201, 1467, 2369, 1750]
                 },
                 {
                     "name": "曝光度",
                     "type": "bar",
                     "data": [2107102, 1846931, 1300455, 1110441, 1042261]
                 }
             ]
         }
}

文章的总曝光次数为3,726,264,获得总赞数为8,995,转化率为0.241%。
曝光次数最高为1,185,390(1812次点赞,转化率0.153%,链接),最低为106(7次点赞,转化率6.604%,链接),
转化率最高为:6.604%(106曝光,7次点赞,链接),最低为0.046%(124,974曝光,57次点赞,链接)。

回答的总曝光次数为49,475,714,获得总赞数为192,534,转化率为0.389%。
曝光次数最高为:2,107,102(5207次点赞,转化率0.247%,链接),最低为17(2次点赞,转化率21.07%,链接),
转化率最高的回答为:16%(25曝光,4点赞,链接),最低为0.012%(698,147曝光,82次点赞,链接)。

柱状图中点赞的高度基本需要拿着放大镜才能看到,出现这种情况也有可能是因为这个曝光度统计的很粗糙,在关注者中会存在大量的僵尸用户,同时也会有其他增加曝光的方式。所以感觉这里取名叫曝光度貌似也不是很合适。
而且通过统计最大值也可以发现,由于有的回答和文章曝光比较少,造成分母小,从而结果大。不过整体数据就比较粗糙,就不纠结这个小问题了。

最后呢,上个彩蛋,那就是@贱贱算不算是大V呢?按照微博金V的认证规则,需要阅读量超过1000万且粉丝量超过1万,首先粉丝量已经达标了,接下来看阅读量了。
在一个月的时间里(2017-11-20~2018-01-20),贱贱哥共新增222篇回答,6篇文章。回答共获赞66,323,文章共获赞468。新增非折叠评论4,339条。
按照以上计算曝光度的规则,新增的回答曝光度为15,264,245,新增的文章曝光度为278,967。
但是曝光不一定会点开阅读,再加上曝光度数据的粗糙性,这么算下来,搞不好贱贱哥还不算是个大V呢。

哈哈,希望贱贱哥加油,争取早日夺得大V称号!

相关链接

知乎文章: "为@贱贱写的文章"

知乎文章: "知乎半年杂记:答疑以及思考"