ã‚レイゴト (Kireigoto)
搜索图像比以往更容易。但是,如果你想在一个不完全明显的位置(不是埃及金字塔或巴黎的巨型拇指雕塑)找到某物的图片,那就比你想象的更难 - 即使根据什么是地理定位信息在图像中。
输入名为Tobias Weyand的谷歌工程师和他的一对同事。根据期刊的一篇新论文 的arXiv (发音为“archive”),三人组建了一个深度学习机,能够仅根据像素分析精确定位几乎任何照片的位置。
为了让机器成功完成这样的任务,你想让它能够根据视觉线索直观地获取信息。换句话说,你想让它思考,就像人类一样。
Weyand开始着手开发人工神经网络 - 一种旨在模仿大脑神经通路的机器系统,使其能够像人类一样学习,处理和回忆信息。这个新系统PlaNet显然能够在确定图像位置时超越人类,无论设置在室内还是室外,并具有任何类型的独特或不明显的视觉线索。
PlaNet如何工作? Weyand和他的团队将世界地图划分为一个网格,在不同区域上放置了26,000个方形的形状,这取决于在这些地方拍摄了多少图像。拍摄很多照片的密集区域适合较小的方块,而较大,较偏远的区域可以切割成较大的方块。
然后,该团队创建了一个已经地理定位的大型图像数据库 - 近1.26亿张不同的照片。大约有9100万用作数据集来教授PlaNet如何确定哪些图像可以放置在世界地图上的哪个网格中。
然后,神经网络的任务是从数据库中对其他3400万个图像进行地理定位。最后,PlaNet设置了来自Flickr的230万个地理标记图像的数据集。
结果? PlaNet可以确定28.4%的照片来源国和48%的非洲大陆。此外,该系统可以精确定位街道位置,占3.6%的Flickr图像,城市级位置占10.1%。
而PlaNet在这方面比大多数人更好 - 甚至是最大的环球旅行者。 Weyand邀请了10位经常旅行的人在Google街景中找到的图片标签位置游戏中与PlaNet竞争。
研究人员写道:“总的来说,PlaNet赢得50轮中的28轮,中位定位误差为1131.7公里,而人类本地化误差中位数为2320.75公里。” “这个小规模的实验表明,PlaNet在街景场景的地理定位任务中达到超人的表现。”
这是真的吗? Google工程师真的只是开发了一个“超人”A.I.系统?
或许,当谈到地理定位图像时。这并不是太令人惊讶 - A.I.的观点。不是从根本上以各种方式模仿人类的大脑,而是以一些特定的方式超越人类的限制来完成更困难的任务。所以在这个意义上,研究人员写的是真的。
尽管如此,将PlaNet称为“神经网络”仍然是一个延伸。这种技术的理想形式是能够比图像地理定位更多地学习。 A.I.系统能够编写明喻和播放 超级马里奥 ,与理想的“主”系统相比,这是一个小东西,可以自动监控和维护生命体,管理运输或能源基础设施等等。
谷歌的“哈利波特”展览揭示了尼古拉斯·弗拉梅尔真实
谷歌艺术与文化推出了一个虚拟的哈利波特展览,揭示角色尼古拉斯弗拉梅尔其实并非如此虚构。