品玩

科技创新者的每日必读

打开APP
关闭
Google

传一张图片到OneDrive,它也能像人那样理解图片中信息的含义了

当我们把越来越多的图片扔到云端之后,找起来也是一件麻烦事。今天OneDrive就加入了新的功能,让机器自动读取图片中的信息,进而让用户更快搜到对应的图片。我试了一下发现如果是两个人的合影,OneDrive会把这张照片标记为“组照片”;如果图片中又文字,OneDrive也会把它归类到“文字”标签中。所以看上去还是挺智能的。

CY Zhou

发布于 2015年1月29日

就我本人来说,无论是在Google相册还是OneDrive里都自动同步了不少图片,前一段时间PingWest品玩曾经介绍了Google是如何让机器读取图片中的内容,进而让我可以在相册中快速找到想要的那一张。现在,OneDrive也加入了类似功能。

由于我把Instagram上点赞的照片都同步到了OneDrive里,所以每过一段时间文件夹里就会累积很多图片,这样想找到某张图片其实是一件很麻烦的事。现在由于OneDrive也开始自动把用户上传的照片打上标签,比如人、狗、沙滩、落日等等,这样通过标签来过滤一遍再找就会容易许多。

在今天更新的iOS版OneDrive中,照片分类下还加入了一个标签栏。虽然我本人并没有为OneDrive里存的图片打过任何标签,但OneDrive却自动生成了像动物、海滩、建筑物、猫、舞蹈、田野等多组标签。而且如果是两个人的合影,OneDrive会把这张照片标记为“组照片”;如果图片中又文字,OneDrive也会把它归类到“文字”标签中。所以看上去还是挺智能的。

从技术上来说的话,OneDrive能上线这项功能主要得益于微软研究院在计算机视觉技术上的突破。虽然人们对神经网络的使用推动了图像识别技术的快速发展,但目前的卷积神经网络有一个问题就是该算法在实践中识别目标的速度太慢。

不过,微软研究院在2014年最终还是找到了加快识别速度的方式,新的方法让深度学习项目识别系统的速度加快了100倍以上。如果你之前看过Google的方式,那么应该知道Google也是在把训练深度网络的规模提升到以前学术报道中理论值的30倍以上后,才把图片识别技术应用到产品上。

从整体上来说的话,微软把图像识别分为两个部分:图像分类和目标检测。在第一部分中,计算机会被教着去识别目标类别,像人、猫、狗、自行车等等;第二部分计算机则需要提供目标项目在图片中的精确位置。这其中真正困难的地方就在于第二部分,不过当微软的研究人员通过空间金字塔池化层(spatial pyramidpooling)解决了目标项目精确度的问题之后。在加上和Bing搜索的合作,图像识别技术最终也就出现在了OneDrive里。

未来,除了这些标签数据库会随着时间的推移不断增加外,微软也在寻找一些新的方式来利用这些数据,总结来说就是它希望用户能更快在OneDrive中找到想要图片。

图片来自:Shutterstock

下载品玩App,比99.9%的人更先知道关于「Google」的新故事

下载品玩App

比99.9%的人更先知道关于「Google」的新故事

iOS版本 Android版本
立即下载
CY Zhou

PingWest

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测