都说数据是互联网时代的石油,现在还真有人把数据当成了石油生意来做。“聚合数据”就是一家经营数据石油的开放平台,该公司通过对数据的开发(由多渠道捕获数据)、精炼(整理合并、优化、排错等初步加工)、产品化(封装成 API),最终销售给下游的工业企业(网站或 App 开发者)使用。
在开发一款产品时,我们需要用到各种数据。而如果手边没有现成的数据库可用,就需要你自己去设法搭建,这需要占用相当的精力。现在你偶然到“聚合数据”上兜了一圈,你发现这简直是一个数据库超市:从车辆违章信息、航班火车查询、全国加油站实时油价,到在线试题、电影、股票,以至于百度和 Google 地图的全国 POI 都一一在列。也就是说,如果你的产品需要上线某个功能,你可以不必再自己建立和维护数据库,直接嵌入“聚合数据”的 SDK 即可。想想身边这样的场景还不少,比如做一款旅游行程规划 App,餐饮、景点、住宿等 POI 必不可少,或许你还要加上交通查询和空气质量预警,甚至目的地点评等等。每一个功能点都自己搞定的话,程序猿们的头发岂不是要掉光。
目前“聚合数据”提供的数据库有几十类上百种,数据来源主要为两部分:1、用爬虫抓取的网页公开信息 2、通过与一些拥有数据库的公司合作,比如微车、飞常准等等,这有时要支付一定采购成本。在收费方式上,目前主要依靠向大客户提供订购套餐,而中小团队的多数接口可免费使用。“聚合数据”不久前刚刚发布了“电商”“比价”“商品条码”三大数据库,可以对线上全网商品数据(包括天猫、京东、苏宁易购等)进行实时跟踪,并部分覆盖线下商超商品(比如家乐福、沃尔玛等)。基于这三大数据库,任何人都可以轻松做出一款 O2O 购物搜索、比价工具。
由于“聚合数据”提供的都是标准化的 API 接口,开发者可以在此基础上任意二次开发。但除了“电商”“比价”两个数据库外,其他均不提供离线数据,所有的调用、更新都需要通过 API。如果开发者有更深层的需求,比如希望拿到整个数据样本做挖掘,可能需要你单独和“聚合数据”团队联系了。
盯住开发者普遍而细分的需求,用 SDK 降低产品开发和维护成本,你可以将“聚合数据”理解为与个推、友盟类似的卖水者。不过事实上,“聚合数据”除了“卖水”外,还扮演着“数据贸易商”的角色,原因在于它所经营的核心资产——数据——在流通的过程中竟然增值了!
我们可以这么看待“聚合数据”的本质:一方面,数据在输入时是各种碎片化的“孤岛”,而在输出时则在一定程度上得到整合。我们知道,整合后的数据永远比作为“孤岛”的数据更具价值。另一方面,数据在输入时掺杂着各种垃圾信息,而经过“聚合数据”的“精炼”加工后,数据的可用性得到提升。再加上“聚合数据”致力于让一些原本封闭的数据库更加开放(不管是通过免费还是有偿手段),这也在更大范围内实现了数据的流通——从这个角度出发,你也就理解我开篇将“聚合数据”比作石油公司的用意了。
“聚合数据”平台 11 年正式运行,目前已有 12 万注册开发者账户,所支持的 App、网站、微信号、软件已超过上万款,覆盖用户推算在上亿级别。该公司 11 年收获元禾资本 500 万天使,12 年收获某知名投资人数百万投资,13 年则又完成了数千万 A 轮。由于手上掌握着足够的数据样本,事实上“聚合数据”能像友盟一样提供一些行业层面的咨询建议,未来也确实有开展相关业务的打算。