PingWest品玩

科技创新者的每日必读

打开APP
关闭
美图秀秀

美图秀秀让你变美的背后,是这些技术在起作用

深度学习和 TensorFlow,是美图 AI 的法宝。

Decode

发布于 8月20日

长久以来,一提到 “美图公司”,大家能想到的都是 “美图秀秀”、“美颜相机”、“美拍” 这些美颜类产品,而为这些产品提供 AI 技术支持的美图影像实验室(以下简称 MTlab)一直鲜为人知。

成立于 2010 年的 MTlab,早已不止是一个实验室 —— 它在美图产品线背后扮演着 “大脑” 的角色。在 MTlab 的工具箱里,深度学习模型和 TensorFlow 是最有效的利器。

美图各个产品的功能决定了,MTlab 会大量使用到计算机视觉技术。

“2013 年开始,MTlab 就用机器学习做计算机视觉方面的研发。最早做的是人脸相关技术,以及美颜算法。”MTlab 负责人万鹏飞告诉 PingWest 品玩,“那时开源工具还没有现在这么丰富,很多算法和工具需要自己手动实现。”

采用传统机器学习来做计算机视觉的好处是,整个训练过程完全透明,允许研发人员更好地评估训练出来的算法,是否在训练环境之外依然有效。但不足的地方是,人工提取特征的工作量大,而且鲁棒性差。

万鹏飞对 PingWest 品玩表示,当时他们面临的主要技术挑战,正是“算法在各种极端用户使用场景下的鲁棒性”。

利用深度学习的卷积神经网络模型,能很好解决这个问题。“深度学习这种数据驱动的方法,在鲁棒性方面比传统计算机视觉算法有明显优势。”万鹏飞说。

决定采用深度学习后,他们最早使用的框架是 Caffe。这个深度学习框架于 2013 年在 Github 上发布,作者是加州大学伯克利分校的贾扬清博士。

2015 年,Google 发布深度学习开源框架 TensorFlow,“MTlab 马上就去了解这个工具”。2016 年,MTlab 开始在项目中尝试用 TensorFlow。

万鹏飞介绍道,MTlab 用 TensorFlow 最早做的是图像去噪,整体感觉比较灵活,对自定义的网络结构比较友好。一个灵活的深度学习框架对于算法自研很重要,因为很多实际的问题需要通过一些创新的方法解决,而一个好用的深度学习框架无疑能提高计算机视觉算法研发的效率。

很快,TensorFlow 凭借着灵活的特性成为了他们主要的深度学习框架。2016 年 MTlab 在用深度学习做人像分割功能时,初期使用 Caffe 实现自定义的卷积神经网络层不太方便,需要自己实现前向 / 反向传播算法。Debug(调试)操作起来也比较麻烦。

“后来使用了 TensorFlow,其基于 dataflow graph(数据流向图)的计算结构对于自定义的深度学习操作很友好,也便于 debug。” 万鹏飞说,“另外对循环神经网络的支持也比较好,大大提高了研发效率。”

如今,TensorFlow 已经被应用在美图旗下产品多个功能的网络训练中,如肢体关键点检测、五官分析、人像分割、图像画质增强、天空分割。万鹏飞对 TensorFlow 评价颇高:“TensorFlow 的分布式训练能力,大大提高了深度学习网络的训练效率。”

万鹏飞同时还提及 TensorFlow 社区对 MTlab 的帮助。完善的官方文档说明、丰富的课程、以及对新手友好的互助氛围,都吸引着更多开发者加入 TensorFlow 社区。

TensorFlow 官方也在努力促进社区的壮大。在今年的世界人工智能大会上, TensorFlow将举办“智在启无限”主题论坛,邀请国内外不同领域,数十位重量级嘉宾,共同探讨机器学习如何在商业中应用,帮助企业和开发者解决现实生活的问题:

TensorFlow 全球产品总监将深度解析机器学习的内核;通用电气贝克休斯高级总监将分享如何确保安全生产、预测组件寿命和系统异常、避免意外停机;网易严选算法总监将分享如何实现季节性商品销量预测、提升用户点击、节约仓储和供应链成本;腾讯医疗大数据科学家将分享如何优化用户意图理解、为医院、医生和病人提供更优质的服务。还有一些前沿的机器学习研究者们也将来到本次论坛,分享机器学习在文化和艺术领域取得突破的经验。

8月30-31日,你还能在上海世博中心TensorFlow特色展览中体验到最新最酷“黑科技”。扫码或点击阅读原文,立即报名!


 

下载品玩App,比99.9%的人更先知道关于「美图秀秀」的新故事

下载品玩App

比99.9%的人更先知道关于「美图秀秀」的新故事

iOS版本 Android版本
立即下载
Decode

联系邮箱:oudibj@outlook.com

取消 发布