品玩

科技创新者的每日必读

打开APP
关闭
百度

深度学习到底能有多落地?这群学生的“暑假作业”把AI落到了果园

“每年收桃季都要多雇四五个人,我的需求就是不再雇人。”深度学习开始抢农民的工作了。

逍遥小妖

发布于 2017年9月11日

9月,是桃子丰收的季节。盛产大桃的平谷果农今年又到了一年中最忙的日子。

但有几个大学生今年比桃农还忙,他们忙着在园子里鼓捣这么一台机器:

你能猜出这台机器是干什么用的么?如果猜不出来的话,看看这几张动图可能就明白了:

对,这是一台自动大桃分拣机!看到上图那三个框了嘛,分别代表着三种不同品相的桃子。

看看第一个框,就知道为什么说平谷是“中国桃乡”了吧?

再多放点桃子试试……

等等好像有哪里不对……这机器这么残暴的把桃子当桌球一样捅,桃子不都捅坏了么?

这台机器的负责人周忠祥急忙解释说,这还只是一台原型机,未来如果真的要投入使用会减轻推拉装置的力度,还会在传送带的另一侧加上斜坡,保障桃子是缓速滚下去而不是“掉”下去的。

这台原型机,正是4位北京工业大学的“暑期作业”,他们当中既有机械自动化的研究生,也有土木工程专业的本科生。

事情的起源很简单,之前学生组织去平谷摘桃,他们注意到现在桃园摘桃、分拣依然全都通过人力完成。因为本身是学习机械自动化的,所以就想利用暑假的时间做一个自动分桃的机器。

 分桃机的控制电路(不含桃子识别部分)
分桃机的控制电路(不含桃子识别部分)

周忠祥负是整个项目的负责人,朱明君负责硬件电路和机械结构设计,刘雪峰负责下位机程序编写和调试,肯尼亚籍留学生机械结构设计与改进。

机器采用传送带的工作方式,前端传送带负责将水果分列、调速,后端传送带加入图像采集计算和水果分级部分。这些数据传入到电脑,然后通过深度学习算法判断桃子的等级。

传送带上装有位置传感器,用于监控桃子在运动过程中几个关键时刻的位置。推拉装置采用气动的方式,并利用电磁气动阀控制气源的通断。控制电路包含一个主控芯片和电磁阀的驱动电路。桃子被放上流水线后,会运送到黑箱中对其进行拍摄,拍摄的图片回传到一台Mac Mini进行识别,之后再根据AI对桃子品相的判断在指定的位置推落。

由于专业对口,机械的部分对学生来说相对比较实现,但究竟如何让算法能识别出好桃和坏桃,对学生来说确是一个难点。

在对多个开源的方案进行对比之后,学生们选择了使用百度的PaddlePaddle平台作为深度学习的核心。

PaddlePaddle是百度内部开发了3年的并行分布深度学习,开源于2016年9月1日百度世界大会,支持多种神经网络结构和优化算法,且以易用性为核心卖点,是最易入门的深度学习平台之一。

在接受采访时,周忠祥坦诚的表示,相比起深度学习他们更擅长于机械控制和电路。虽然让机器动起来的这一部分很简单,但在找到PaddlePaddle之前其实对如何通过计算机判断桃子好坏并没有一个很好的解决方案。在使用PaddlePaddle进行模型训练的过程中,曾经遇到了一些问题并在PaddlePaddle的社区上进行求助。

这个求助帖引起了百度官方的注意,值班的技术人员给予了学生一些技术上的指导,这台原型机才得以顺利完成。

协助学生们进行实机试验的桃园主人是1958年出生的刘连全,种桃经验35年,目前管理的这片桃园有40亩,近3100棵桃树,21种桃型,年产量能达到80万斤。

 桃农刘师傅给一群“科技媒体作者”讲需求
桃农刘师傅给一群“科技媒体作者”讲需求

年轻人都到城里去打工,整个桃园只有刘连全夫妇两人长期照顾,在桃树声张的其它时段还好,但在桃子的收获期集中的7-9月就会忙不过来——桃子一旦成熟,如果不及时采摘、分装、发货运走,很快就会烂在树上。

每年到了丰收期,刘连全夫妇都必须要雇佣5个临时工来分担桃子的摘取和分拣工作。临时工的雇佣费用,每年大约要花去3万元。

摘桃子还好,麻烦的是分桃子,不同的供应商对桃子的质量有较为严格的要求,桃农必须首先自己将桃子至少分为三类以满足他们后续的分拣和包装需求。

如果是之前有干过同样工作的临时工还好,如果雇佣到完全新手的临时工,还要进行一番培训才能顺利上岗……

事实上,原本在市面上就有一些电子选果机,但这些选果机有两个方面不能满足刘连全的需求,一个是只能对大小进行筛选不能对果子的品相进行筛选,另一个是大多数的电子选果机体积巨大需要一个特定的厂房固定安装,无法在多个果农之间移动贡献。

学生团队制作的这款人工智能捡桃机通过视觉识别和深度学习,对6400多张桃子的原始图片进行学习,实现了对桃子“品相”的识别——外观是否完好、是否熟到刚好、是否干净等,分拣的原则更接近于人类。

除了普通的桃农可以使用之外,这个机器还可以用在采摘园让游客体验——每个游客可以把自己摘的桃子放到机器里,然后根据机器的判断来给打个分,增强采摘的乐趣。

当然,正如前面演示的过程中所看到的,这台原型机还远没有达到能够真的实现农业升级的程度。但它为“人工智能可以做什么”这个问题打开了一片全新的思路——

互联网最初只局限于几个狭窄的领域,但随着基础设施的普及,互联网已经在人类现代社会的每一个行业和每一个领域都生根落地。

深度学习和人工智能其实也是如此——在智能音箱、语音助理、无人驾驶之外,所有那些需要对文字、语音、图像进行简单识别和判断和推荐的领域。人工智能事实上都可以替代现有的人力工作。

下载品玩App,比99.9%的人更先知道关于「百度」的新故事

下载品玩App

比99.9%的人更先知道关于「百度」的新故事

iOS版本 Android版本
立即下载
逍遥小妖

这家伙很懒,什么也没留下,却只想留下你!

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测