品玩

科技创新者的每日必读

打开APP
关闭
瓜子二手车

瓜子二手车的技术马拉松

产业互联网中,技术与人互动的一个样本。

Decode

发布于 2019年10月21日

纸、笔和 PC 电脑。

2016 年 4 月,张小沛第一次去到二手车业务一线。当她看到这些工具时,颇感诧异 —— 中国移动互联网已到成熟期,而二手车评估师的工作方式,还停留在 PC 时代。

一个月前,在杨浩涌的邀请下,张小沛加入了瓜子二手车,任 CTO 一职。她此前在大数据、在线广告领域工作,完全没有接触过这方面的知识。

上任后,她 4 月份一半时间都周旋于不同城市,访谈客户、销售和评估师,以建立起对二手车交易的认知。

一线的情况超乎张小沛想象。瓜子二手车最早采用 C2C 模式,一边是卖家,一边是买家,评估师在中间为二手车估价。评估师看完车况,先用笔写在纸上,晚上回到办公室,再上传到电脑。有时候比较着急,很多信息写得不全,评估信息就失真了。

从评估到上传,隔了好几个小时。从上传到审核,又隔了一夜。第二天审核团队一上班,就有很多工单积在队列里。

审核团队一张一张地看。这辆车忘记拍车头了,门重复拍了五张,后座的照片没拍…… 总会有不合规范的工单,审核不得不打回。评估师只能再约卖家,重新拍摄。

这种情况在线下二手车商里普遍存在着。一些比瓜子二手车早几年创立的对手,已经有意识去改善流程。

有时卖家会把一辆车放在不同二手车电商平台,“瓜子这边前前后后三天都过去了,还没审核通过,对手就已经把车卖掉了”。

“在内部,我们把这段时期称为‘冷兵器时代’。” 张小沛告诉 PingWest 品玩。

广告战背后的技术构想

2015 年 9 月起,瓜子二手车的广告铺天盖地——电梯间、地铁里、公交站,广告语简单直接:个人直接卖给个人,没有中间商赚差价。

(2015 年广告战时瓜子打出来的广告)
(2015 年广告战时瓜子打出来的广告)

2015 年 4 月,赶集和 58 同城宣布合并。在合并后的第一次董事会上,杨浩涌申请了 2 亿预算作为瓜子二手车的市场推广费。9 月,瓜子二手车开启了大规模烧钱宣传模式。

广告战让瓜子二手车成功抢占了用户心智,“没有中间商赚差价” 的形象深入人心。与此同时,杨浩涌还意识到修炼内功的重要性。

2015 年底,杨浩涌找到了张小沛,和她聊 “二手车电商赛道是怎么样的、中国什么格局、美国什么格局”。

张小沛和杨浩涌结识于 2013 年。当时,张小沛是金融科技公司宜信的 CTO,主管大数据、营销和风控等业务。更早前,她在微软做过在线广告,在 Hulu 做过个性化推荐。杨浩涌则是分类信息网站赶集网的 CEO。

虽然两人从事领域不同,但由于杨浩涌修过计算机科学,所以 “两人话语体系比较相似,沟通起来比较同频”。

每次一聊,两人就聊三、四个小时,碰撞出了不少想法 —— 有计算机背景的杨浩涌直觉认为,数据在非标准化的二手车交易中非常重要。张小沛跟他说,“积累够数据后,可以用算法去定价”。后来,这些想法成了瓜子整个技术框架的基石。

因为 “感觉人和事比较靠谱”,张小沛于 2016 年 3 月加入了瓜子二手车,任 CTO。

入职后,她做的第一件事就是下到一线去。当看到一线评估师的工作工具还处于 “冷兵器时代” 时,她感到 “挺震惊的”。但这也说明,“二手车行业有很多‘低垂的果实’”。

“先做无纸化吧。” 张小沛找来清华毕业的师弟师妹,着手搭建技术团队。

张小沛团队首先把工作流程移动化、在线化,让评估师通过手机 App 现场作业 —— 关于车辆的所有文字信息和图片,都汇集在一处,随时随地可上传到后台,方便审核。

然后,用深度学习方法来进行图像识别,以取代人工审核。

张小沛说,2016 年初,瓜子二手车一个月成交大概 1000 多单,需要 50 个审核人员。2016 月 8 月左右,成交单数上去了,但审核团队一个人都没有了,完全被深度学习算法所替代。这成了瓜子二手车落地深度学习的第一个场景。

技术的顶层设计

解决了最紧急的任务后,张小沛开始有意识地进行技术的顶层设计。2016 年,G3 基因图谱库和瓜子大脑(后改名车好多大脑)两个概念相继被提出。

杨浩涌 2015 年底和张小沛碰撞出来的想法,通过这个顶层设计得以具体化。“后来瓜子二手车的技术演化路线,也是沿着这个大框架进行的”。

G3 基因图谱库是瓜子二手车的数据中台,集中了车辆、卖家、买家的结构化数据。

“现在回想起来,这是我们做得非常对的一步。” 张小沛说,“数据坚决要打通,而且要做成服务,给到不同的模块,即插即用。”

目前,G3 基因图谱库已经积累了过千万车辆、3 亿车主和潜在买家数据。

车好多大脑则是决策中枢,被广泛应用在瓜子的各个业务中,比如智能定价、个性化推荐、智能分单、车辆调度。

而车好多大脑决策的基础,正是 G3 基因图谱库的结构化数据。

“太难了。” 回想起做数据结构化的过程,张小沛依然很感慨,“因为线下流程很长,而且参与流程的人很多。”

在进行结构化的过程中,数据颗粒度要细致到什么程度,是主要的难点。

“整个流程是切成 3 步、20 步还是 50 步,评估维度是看几十个、一百个还是两百多个,都非常考验我们对这件事情的认知。” 张小沛解释道,“颗粒度太细,评估师评估时间就会很长。如何平衡颗粒度和效率之间的关系,是个挺大的考验。”

怎么去除数据里面的大量噪音,是另一个难点。

比如,有些评估师特别赶,就会瞎填;车上一道划痕,有的人看是重度,有的人看却是轻度;还有的评估师为了让自己看的车可以上架,即使看出来是重度划痕,也写轻度。

张小沛说,有些时候不得不用技术手段,来跟人性博弈、跟人的认知差异博弈。

像上面的情况,评估师把照片拍下来上传后,后台会进行图片识别。图片识别结果如果和评估师录入结果有差异,再采取相关措施纠偏。

但问题并没有完全被解决。比如,很多时候汽车底盘的照片难以获取。为此,瓜子二手车又开始测试底盘检测机器人。

“把这个地方的问题解决了,那个地方的问题又出来了。” 张小沛已经对层出不穷的问题习以为常,“这是一个无止境的过程。”

算法定价的逻辑

车好多大脑在被应用在各项业务中,其中最为重要的一个场景,是二手车交易的核心环节 —— 定价。

传统模式中,二手车交易涉及到卖家、中间商和买家三方。“定价” 这个核心的环节,完全掌握在二手车中间商手中。二手车中间商对卖家手中的二手车评估定价,收回来后,再加价卖给出去。

这是二手车行业最典型的差价模式 —— 二手车商的收益来源于买卖价格差。说白了,就是中间商赚差价。

在自由市场中,这种模式陷入了一个恶性循环。二手车中间商定价极度依赖个人经验,是门 “手艺活”。传授经验也普遍采用 “老带新” 的方式。

但新人为了获得更高的收入,往往在学习到足够经验后自立门户。这就造成了二手车中间商数量多而规模小,整个行业碎片化。

难以规模化的二手车中间商,更加依赖单车交易的差价。于是,压价买入和哄抬售价现象屡见不鲜,调表车和泡水车以次充好也常有发生。

种种弊端让消费者购买二手车费时费心,如果不幸买到车况差的,更是费钱。

位于北京南四环的花乡二手车市场,就是整个行业的缩影。各种叫得上叫不上名的二手车商,规模大小不一。好车坏车混杂其中,定价各有标准。在百度搜 “北京花乡二手车市场”,相关搜索第一项是 “花乡卖车骗局”。

2015 年,瓜子二手车喊出 “没有中间商赚差价” 的广告语,背后为其支撑的,是车好多大脑利用数据和算法进行智能定价。

“我们竞争对手也用技术来定价,但他们通常是静态定价。” 张小沛说,“我们认为二手车市场供给双方是动态匹配的,不应该静态地定价。”

因此,瓜子二手车做的是售卖概率预估模型 —— 预测在特定的价位、特定的天数内,二手车被卖出去的概率有多大。

受制于现实条件和算法成熟度,张小沛带领团队做这件事,是分阶段进行的。

第一阶段,是算法服务于 “优先卖” 业务。2016 年下半年,为了和竞争对手抢独家车源,瓜子二手车推出优先卖服务。

瓜子二手车会在每个城市选几个最资深的老师傅(评估师),给他们授权。如果他们觉得一辆车可以在一个月之内卖掉,就给卖家 1000 元,把车源独占。如果这辆车没有在一个月内被卖掉,1000 元就归卖家所有。

2016 年 10 月,在做优先卖服务过程中,张小沛团队开始在老师傅和算法间做 A/B Test(A/B 测试),“在同一座城市,挑一些热销的车型,一部分让老师傅做决策,一部分让算法做决策”。

老师傅和算法做决策的方式完全不同。老师傅靠“手感”和经验,一看到车马上心里就有数,知道要不要给这 1000 元。

“老师傅评估车,我们都觉得是个玄学。” 张小沛说。

算法则不一样,要根据车辆的各个数据维度,去预测一辆车在一个月内卖出去的概率有多大。“如果概率超过预期值,就给卖家 1000 元”。

一开始,算法是比不过老师傅的。厉害的老师傅,“评估 10 台车有 7 台都是准的”。但老师傅们个体差异性非常大,有的不过三成准确率。

而算法做预测,“普遍 10 台车车里只有 3 台是准的”。从整体表现来看,算法弱于老师傅。

张小沛还记得当时老师傅对算法的态度:“那些老师傅都笑,天天说算法厉害,效果也不怎么好。”

不过,算法的优势是可以根据数据不断进化。老师傅虽然当时比算法强,但他们普遍经验导向,不能反向拆解自己的决策流程。

到 2017 年春季前后,算法能做到 “10 台车里有 7 台是准的”。在有些城市里,还能做到 “10 台车里有 9 台都是准的”。整体表现上,算法已经超过了老师傅。

第二阶段,算法服务于 “保卖” 业务。2017 年 3 月份,瓜子二手车开始做 “保卖”,尝试从纯平台撮合的 C2C 模式转变为 C2B2C 的零售模式。

瓜子二手车会挑选一些优质热销的车源,先支付一定比例(50%-80%)的车款,保证在 14 天的保卖期内卖掉,卖掉过户后将余款打给客户。如果保卖期 14 天内没有卖掉,那会在第十五天将余款打给客户。

在这个服务里,瓜子二手车和卖家不会进行签约过户,最终还是卖家和买家交易,“瓜子二手车采用的是寄售模式”。

“保卖和优先卖的难度和挑战完全不一样了。优先卖业务的二手车如果一个月内卖不出去,一台车最多就损失 1000 元。保卖业务的售出时限更短,而且金额都是几万元。如果车辆长期无人问津,瓜子只能亏本降价卖。” 张小沛说。

算法在保卖业务中,经历了比优先卖更加陡峭的成长曲线。

一开始,算法表现 “很差”,很多收回来的车在 14 天内卖不掉。张小沛说:“算法模型需要学习,需要训练,需要交很多学费。”

几个月里,张小沛团队都在慢跑前进:收集数据、训练模型、调整变量的内涵和数量…… 直到 2017 年 8 月份左右,整套算法才规模化跑通。

在规模化过程中让张小沛没有想到的是,当线上的算法落地到线下,人的因素被几倍地放大。

一些从来没有考虑到的情况出现了。由于算法团队和线下团队的合作沟通没有做好,11 月份一周亏损了三千万。

张小沛回忆,之前小范围测试时,算法团队给了线下评估师调价的权限,允许他们在算法定价的基础上,将收车价格上调最高 10% 。

在规模化放量时,算法团队以为已经跟线下团队说清楚,收车价格最多只能上调 2%。

“线下团队可能拿到了这个信息,可能也没有。他们事情太多了,跟其他事情比起来,这个事情对他们来说是个小事。” 张小沛说。

收车价格普遍被评估师手动调高超过 2% 的比例,再加上 “放量放得很猛”,“一个礼拜三千万就没了”。

一直从事线上业务的张小沛后来总结,这是互联网人做产业互联网都会遇到的一个挑战。

凡是涉及线上线下环节、交易链条非常长的领域,其测试的反馈闭环周期都非常长。不像线上做一个应用,立马就能拿到反馈。比如二手车交易,即使客户看车当天就拍板签约,后面还要办过户,整个流程至少要几天。

“线下有很多人的因素在里头,比如一个新政策,不是发布就完了,而是要下去给一线的人做宣导。” 张小沛说,“手动调价比例的问题,我们是一周就发现了。但很多事情,我们可能要测一个月。”

发现问题后,算法团队把整个流程都回顾了一下,并且做了一个新的监督机制。即便如此,张小沛依然认为,因为人的不可控性,线上团队和线下团队的摩擦是不可避免的。“很多时候都是在做改进,让流程更加优化”。

到 2017 年 12 月,保卖业务中的算法逐渐成熟。12 月是二手车交易的旺季,瓜子二手车这个月的成交单有一万多台,平均周转周期只有 7–9 天。而传统的线下二手车商普遍成交一百多台,平均周转周期为 30 天。

技术落地新零售

2017 年 10 月,瓜子二手车进行业务整合,正式更名为 “车好多” 集团。车好多旗下同时拥有瓜子二手车和毛豆新车网两个独立品牌。

伴随着集团化的另一个重大变化是,瓜子二手车和毛豆新车业务都在尝试线下开店,开始做重做深。张小沛说,最终目的还是提高汽车的交易效率。

面积普遍上万平米的瓜子二手车严选店内,不仅有展示区,还有交易区、整备区、复检区、过户区。用户可以在一个地方就可以看车、贷款、过户,不像以前要跑很多地方看车、办手续。

毛豆的店没这么大,但数量更多。截至 2018 年底,毛豆新车在全国开设了 300 家线下店。

一开始,毛豆开店更多地依赖人去决策。技术团队会把一些当地市场的数据给到开店团队,让后者自行解读判断。

张小沛对 PingWest 品玩表示,现在所有这些数据都录入到了 G3 基因图谱库里。根据流量、工单和商圈等数据,车好多大脑给出推荐的地址。“毛豆绝大多数的开店,都已经能够通过数据智能辅助完成了”。

除了开店,毛豆还在全国开中心仓库,面积比店面大得多,“摆放了上千台车”。

同样地,张小沛也让团队在仓库中测试相关技术。比如,借助摄像头和图像识别算法,让毛豆仓库里的车辆自动记录、入库;根据销量的动态变化,自动决定哪款车型摆在靠近门口的地方。

“如果我们不用技术手段,线下的仓库团队就会靠自己的经验,但很多时候他们经验是跟动态变化的销量是脱钩的。” 张小沛说。

技术和人怎么配合、怎么互动、怎么沟通,是一直贯穿车好多整个技术演化的命题。

比如,借助算法定价过程中,评估师担心自己工作会不会受到影响,只能 “一点点地跟他们讲清楚,不是要取代他们,而是技术辅助他们”。

再比如,用摄像头和图像识别算法管理仓库,技术团队和线下团队经常吵得不可开交 —— 前者认为有技术手段后,线下团队就不用操心了,而线下团队不以为然,说他们的摄像头其实很多场景都管不到。

张小沛对此很坦然,技术团队和线下团队是两个不同的物种,话语体系和思维体系都不一样,肯定是会有摩擦的。

“我觉得摩擦不全是坏事。” 张小沛说,“两个物种碰撞,才有活力,能出一些新东西来。我们要做的,只是消解因为不理解而造成的互相质疑、互相鄙视。”

“技术与人如何良性互动”这个问题摆在了所有产业互联网人面前,且没有标准答案。从“纸、笔和 PC 电脑”,到“深度学习、G3 基因图谱库和车好多大脑”,张小沛和车好多集团似乎找到了自己的解题思路。

下载品玩App,比99.9%的人更先知道关于「瓜子二手车」的新故事

下载品玩App

比99.9%的人更先知道关于「瓜子二手车」的新故事

iOS版本 Android版本
立即下载
Decode

品玩作者 线索采集微信:dcba54123关注人工智能、工业和混合现实等新技术、科技创新领域。

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测