正在阅读:

我分析了27万辆共享单车数据 带你看看单车上的魔都

扫一扫下载界面新闻APP

我分析了27万辆共享单车数据 带你看看单车上的魔都

共享单车成为了今年的新风口,那么以上海为例,你知道究竟一座城市究竟有多少单车吗,而哪里又需要最多的单车?

单车公司的各路消息变成贫瘠的融资圈最绚丽的新闻,不时刷着我的朋友圈,公司门口出了 2 个共享单车停放点,上班的路一夜间也被共享单车染成了红黄色。

变化来的太突然,后知后觉的我注册了几个单车 app,才想到这是个很有意义的东西,比如你可以任意地跨城旅行,今天在上海张江上班,明天在西安古城骑车,当然,旅行锦上添花,占正常人 10% 的生活时间就到头了。这些车子更多是解决从地铁到办公室的 15 分钟路程,如果每天节约 15 分钟 * 2 的时间,仔细算算一年能够拯救 1 个星期的无聊时间呢。

一个基本面

全上海单车有多少共享单车?好吧,show me the code,我爬了所有 ofo 和摩拜在上海的单车, 去重后,理出超过 27w 辆摩拜单车,ofo 则少很多,我觉得这基本是 ofo 单车没装 GPS 的问题(按常理,周围 ofo 的车更多),当然仔细想想,25w 这个数字既不多也不贵,2000w 常驻人口只有 1% 数量的摩拜单车,把全上海的单车按 500 块钱算也不一定换得汤臣一品的一套房子。

把上海的凌晨摩拜的所有单车画出来,一副星光闪耀的地图展现在面前:

1

基本模型

根据长时间的数据监控发现,大部分人都只骑很短的路,12 小时里走 600 米 – 700 米的车是最多的(我计算了直线距离,真实距离估计 1km 多点),骑行 5km 以上的人非常聊聊,  因此大致上,单车是城市局部的微交通,所有单车根据短距出行的需求随波逐流。

2

此时我的脑海里浮现出一个模型,半壶热水导入半壶冷水,最后总会变成均匀的温水,热水瓶就是单车的投放车,每辆车走的很短 ,但可能以每天 1km 的速度向外围扩散,日积月累的扩散效应应该还是很大的。单车的投放可能是不均匀的,但最终会趋于一种平衡。

当然,也有一些特例,比如黄浦江应该就是一个保温的热水瓶胆, 黄浦江在市区,桥、隧道、地铁都是不通自行车的,唯一可行的也许就是去码头坐船 (不过特地去 16 铺码头看了看,还真有好多人带共享单车过江的),如果浦西投放了 10w 自行车,浦东没有,那长期来说浦东浦西的供需关系就是不等价的。早些时间,有公众号在网上 po 出这个自行车的对比分布图,浦东某单车投放和浦西形成了巨大的对比。

3

黄浦江是屏障,铁路是屏障,更重要的是跨距离的卫星城,也许,摩拜单车作为新生事物,并没有成熟到可以刻画全上海的人口流动,因此我爬取了上海所有的公交线路和站点,以此刻画经年累月里,城市各个部分的连接关系,可以看出公交车的网络内部致密,连接稀疏,松江、金山、嘉定新城已经变成了离开市区的卫星城,在市区投放单车,自发去卫星城的人应该非常寥寥。
4

哪里需要更多的共享单车

摩拜单车的一个报告说,人们的出行基本都围绕地铁展开。我以地铁站 1km 画圈,地铁一公里覆盖圈基本涵盖内环里的核心城市,确实因此,63% 的摩拜单车都被圈到了里面:

5

当然,这个结论还没啥用,只是说地铁和单车关系很大。

好在俺手上还有一份地铁的数据,以某个星期一的数据为例,我统计了每个站点进出站的总和,很快我们能发现个基本面:

和房价分布比较一致,2 号线也是上海交通的中流砥柱,尤其是虹桥火车站、北新泾、中山公园、南京西路、人民广场、陆家嘴,1 号线老大哥,也很热闹,尤其是莘庄和徐家汇、人民广场和火车站,九号线的泗泾和九亭也不可小视,漕河泾的白领好多住在那。

6

然后,我们统计每个地铁站 500 米内圈到的自行车的数量,咱们把进出站人数和自行车数量做个比例,那基本就算出供需关系了,下图,我们用点的大小代表地铁人流,颜色用来表示人均保有的自行车数量,又蓝又大的点,可能就是单车公司需要去优化自行车投放的,如南京西路、莘庄、徐泾、共富新村、泗泾、九亭这些站点。

7

刚才的图,我们从地铁站为维度去区分流量,我想,还有一种途径,就是根据版块来看待投放的问题,我们假设习大大的 “房子是用来住的,不是用来投资的”,忽略群租房一类的特殊情况,版块内的居住人口,大致等于这个版块包含的户数(有多少套房子)* 3,因此用链家的数据计算版块内总户数,基本可以代表每个版块夜间的常驻人口,只要我们配合凌晨的单车存量,基本可以刻画第二天一早的单车供需关系。

8

你发现,三林、江桥、顾村、金山都是蓄积人口的大户,但是郊区面积也大,真正适合刻画人多人少的,还是按照户数 / 版块面积算人口密度比较合适,你发现环市中心是最密集的部分,包括了甘泉 / 宜川、光新、曲阳这些地方,如下:

9

因此,人均保有单车,更准确的说是每天早晨从家出发的路程的单车供需关系如下:
人均保有单车率 = 这个版块的单车数 / 这个片区的小区户数 ,我们会发现漕河泾、外滩、张江、五角场和金桥比率很大。

10

当然,我们关注的不是哪里单车多而是哪里单车缺,显示深红色的表明,这个版块早上是缺乏共享单车的,当然,这个单车很缺的地方可能人也很少,我们以 5 万户为界限,删掉人口很少的版块,此刻我们发现,普陀区的甘泉 / 宜川版块、 闸北区的彭浦版块、奉贤区的南桥版块、浦东的周浦、浦江版块,这些都是比较缺共享单车的,这也许值得单车公司去优化布局。

11

从这份数据里,我们还可以推测单车公司的投放策略,只要看今天系统中新捕获的单车分布,亮点代表在一个地方叠加了许多单车,这种分布,应是自然过程无法形成的。从昨天看,单车公司在流量最大的 2 号线的某几个站点附近投的单车。

12

单车的数据非常之简单,经度纬度时间 id,而且还不是连续的轨迹,但还是反应了一些问题。当然,我觉得共享单车最重要的不是今天我们讨论的怎么投放车子,而是变成一面数据的镜子,反射出社会的别的层面的问题。

来源:兽脑的世界

原标题:我分析了27万辆共享单车数据 带你看看单车上的魔都

最新更新时间:04/20 09:38

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

我分析了27万辆共享单车数据 带你看看单车上的魔都

共享单车成为了今年的新风口,那么以上海为例,你知道究竟一座城市究竟有多少单车吗,而哪里又需要最多的单车?

单车公司的各路消息变成贫瘠的融资圈最绚丽的新闻,不时刷着我的朋友圈,公司门口出了 2 个共享单车停放点,上班的路一夜间也被共享单车染成了红黄色。

变化来的太突然,后知后觉的我注册了几个单车 app,才想到这是个很有意义的东西,比如你可以任意地跨城旅行,今天在上海张江上班,明天在西安古城骑车,当然,旅行锦上添花,占正常人 10% 的生活时间就到头了。这些车子更多是解决从地铁到办公室的 15 分钟路程,如果每天节约 15 分钟 * 2 的时间,仔细算算一年能够拯救 1 个星期的无聊时间呢。

一个基本面

全上海单车有多少共享单车?好吧,show me the code,我爬了所有 ofo 和摩拜在上海的单车, 去重后,理出超过 27w 辆摩拜单车,ofo 则少很多,我觉得这基本是 ofo 单车没装 GPS 的问题(按常理,周围 ofo 的车更多),当然仔细想想,25w 这个数字既不多也不贵,2000w 常驻人口只有 1% 数量的摩拜单车,把全上海的单车按 500 块钱算也不一定换得汤臣一品的一套房子。

把上海的凌晨摩拜的所有单车画出来,一副星光闪耀的地图展现在面前:

1

基本模型

根据长时间的数据监控发现,大部分人都只骑很短的路,12 小时里走 600 米 – 700 米的车是最多的(我计算了直线距离,真实距离估计 1km 多点),骑行 5km 以上的人非常聊聊,  因此大致上,单车是城市局部的微交通,所有单车根据短距出行的需求随波逐流。

2

此时我的脑海里浮现出一个模型,半壶热水导入半壶冷水,最后总会变成均匀的温水,热水瓶就是单车的投放车,每辆车走的很短 ,但可能以每天 1km 的速度向外围扩散,日积月累的扩散效应应该还是很大的。单车的投放可能是不均匀的,但最终会趋于一种平衡。

当然,也有一些特例,比如黄浦江应该就是一个保温的热水瓶胆, 黄浦江在市区,桥、隧道、地铁都是不通自行车的,唯一可行的也许就是去码头坐船 (不过特地去 16 铺码头看了看,还真有好多人带共享单车过江的),如果浦西投放了 10w 自行车,浦东没有,那长期来说浦东浦西的供需关系就是不等价的。早些时间,有公众号在网上 po 出这个自行车的对比分布图,浦东某单车投放和浦西形成了巨大的对比。

3

黄浦江是屏障,铁路是屏障,更重要的是跨距离的卫星城,也许,摩拜单车作为新生事物,并没有成熟到可以刻画全上海的人口流动,因此我爬取了上海所有的公交线路和站点,以此刻画经年累月里,城市各个部分的连接关系,可以看出公交车的网络内部致密,连接稀疏,松江、金山、嘉定新城已经变成了离开市区的卫星城,在市区投放单车,自发去卫星城的人应该非常寥寥。
4

哪里需要更多的共享单车

摩拜单车的一个报告说,人们的出行基本都围绕地铁展开。我以地铁站 1km 画圈,地铁一公里覆盖圈基本涵盖内环里的核心城市,确实因此,63% 的摩拜单车都被圈到了里面:

5

当然,这个结论还没啥用,只是说地铁和单车关系很大。

好在俺手上还有一份地铁的数据,以某个星期一的数据为例,我统计了每个站点进出站的总和,很快我们能发现个基本面:

和房价分布比较一致,2 号线也是上海交通的中流砥柱,尤其是虹桥火车站、北新泾、中山公园、南京西路、人民广场、陆家嘴,1 号线老大哥,也很热闹,尤其是莘庄和徐家汇、人民广场和火车站,九号线的泗泾和九亭也不可小视,漕河泾的白领好多住在那。

6

然后,我们统计每个地铁站 500 米内圈到的自行车的数量,咱们把进出站人数和自行车数量做个比例,那基本就算出供需关系了,下图,我们用点的大小代表地铁人流,颜色用来表示人均保有的自行车数量,又蓝又大的点,可能就是单车公司需要去优化自行车投放的,如南京西路、莘庄、徐泾、共富新村、泗泾、九亭这些站点。

7

刚才的图,我们从地铁站为维度去区分流量,我想,还有一种途径,就是根据版块来看待投放的问题,我们假设习大大的 “房子是用来住的,不是用来投资的”,忽略群租房一类的特殊情况,版块内的居住人口,大致等于这个版块包含的户数(有多少套房子)* 3,因此用链家的数据计算版块内总户数,基本可以代表每个版块夜间的常驻人口,只要我们配合凌晨的单车存量,基本可以刻画第二天一早的单车供需关系。

8

你发现,三林、江桥、顾村、金山都是蓄积人口的大户,但是郊区面积也大,真正适合刻画人多人少的,还是按照户数 / 版块面积算人口密度比较合适,你发现环市中心是最密集的部分,包括了甘泉 / 宜川、光新、曲阳这些地方,如下:

9

因此,人均保有单车,更准确的说是每天早晨从家出发的路程的单车供需关系如下:
人均保有单车率 = 这个版块的单车数 / 这个片区的小区户数 ,我们会发现漕河泾、外滩、张江、五角场和金桥比率很大。

10

当然,我们关注的不是哪里单车多而是哪里单车缺,显示深红色的表明,这个版块早上是缺乏共享单车的,当然,这个单车很缺的地方可能人也很少,我们以 5 万户为界限,删掉人口很少的版块,此刻我们发现,普陀区的甘泉 / 宜川版块、 闸北区的彭浦版块、奉贤区的南桥版块、浦东的周浦、浦江版块,这些都是比较缺共享单车的,这也许值得单车公司去优化布局。

11

从这份数据里,我们还可以推测单车公司的投放策略,只要看今天系统中新捕获的单车分布,亮点代表在一个地方叠加了许多单车,这种分布,应是自然过程无法形成的。从昨天看,单车公司在流量最大的 2 号线的某几个站点附近投的单车。

12

单车的数据非常之简单,经度纬度时间 id,而且还不是连续的轨迹,但还是反应了一些问题。当然,我觉得共享单车最重要的不是今天我们讨论的怎么投放车子,而是变成一面数据的镜子,反射出社会的别的层面的问题。

来源:兽脑的世界

原标题:我分析了27万辆共享单车数据 带你看看单车上的魔都

最新更新时间:04/20 09:38

本文为转载内容,授权事宜请联系原著作权人。