谷歌如何构建地图,这对未来又意味着什么
译者 窄世君子
独家探秘谷歌的地面实况(Ground Truth)项目,他们正在秘密地构建世界上最好的精确地图。
对于你的每次查询,在呈现出来的谷歌地图后面都有一幅更为复杂的地图,它对你的查询很关键但你却看不到它。后台地图包含逻辑信息:路口禁止左转、高速公路的入口匝道、限速及交通状况。这就是谷歌把你从A点导航到B点时你要用到的数据。这是上周谷歌向我展示内部地图并向我演示它是如何构建的时我了解到的。这也是谷歌第一次向外人展示"GT"(Ground Truth地面实况)项目是如何工作的。
谷歌这家公司在自己革新的关键时候走入公众视野。它一开始是一家在线搜索公司,它通过打与用户的查询相关的广告来赚钱,这方面几乎是独此一家。接着移动世界的大爆发,地理信息在搜索中和搜索内容的重要性不相上下。谷歌的应对之策是建立一个品牌化而且开放性的安卓操作系统,它现在是唯一能与苹果的iOS操作系统等量齐观地竞争的系统。
出于好意来看。如果谷歌的使命是组织世界上的所有信息,那它最大的挑战是获取现实世界的信息并使它有用且可用,这当然比网上的索引要难得多。
"如果你看一下网络外的世界,也就是我们生活在的这个世界,你会发现这里的信息并不全在网络上。"马妮科·古普塔(Manik Gupta)这个谷歌地图的高级产品经理如是告诉我。"生活中的需求不断增加,我们正在尝试架起沟通现实世界与网上虚拟世界的桥梁,而地图正是为此。"
这不是个理论问题。地图真真正正地影响手机因为它是现实世界与网络世界的交互界面。你如果样样都像我一样,你使用地图会多过除交流应用以外的其他的一切应用,交流应用包括电话,电子邮件,社交网络,短信。
谷歌公司正在为掌控未来的手机而与苹果这家世界上最大的公司掐架。鉴于苹果的长项是产品设计,供应链和零售,谷歌最明显的优势范畴就是信息。地理信息以及用到它的应用是谷歌只要做好自己就能赢的。这在前几代iPhone上不用担心因为它们用的就是谷歌地图。但现在苹果公司建立了自己的地图服务。两个操作系统将如何收录地理信息并呈现给用户将是手机争夺战的关键战役。
但那也必然会建立一个更好的地图。
谷歌用来建最好的呈现世界的地图的办公室并不值得大书特书。那有免费食物,乒乓球设施以及你期待的克里斯托弗·尼尔曼从谷歌地图得到灵感而作的卡通画。它是栋在山景城101附近的郊区中的低矮建筑。
我被允许会见古普塔以及他们队的"工程魁首"——前美国宇航局工程师迈克尔·威斯马利克,他把他20%的可自由支配的工作时间花在了"谷歌火星"(Google Mars)上——还有尼克·沃尔玛(Nick Volmar),他可是真正在摆弄地图数据的人。
"如果你想要制作一幅地图,那就有一些步骤,你先通过合作伙伴获取数据,在用一系列的工程方法把它们转化为适当的格式并把它与其他的数据合并,紧接着就是这个工具要做的的一系列操作——处理数据,它的产出就能比各个分立的数据的总和还要有价值。"威斯马利克在我们坐在巨型监控器面前时告诉我。
他们是这样开始的,从美国统计局中获取泰格数据库中的数据,这些数据层来自不同的国家的不同渠道。
乍一看来,这些数据棒极了,全部道路都展现出来了而且高速公路被标记出来。在非专业人士看来这图已经很不错了。但更细致的看一下。就会发现数字数据与现实世界不相符的地方。我把很明显的几处在下图中标记出来。
这是仅通过比较地图与卫星图像得到的。但是谷歌还有很多其他类的工具可用。其中就包括从其他的数据源获得数据,比如美国地质调查局,但是地面实况项目还有一个独家数据源来解决地图难题:谷歌街景的录像车的轨迹与图像。更好的数据组织与数据的增加保持步调一致,这个地图小组通过仰仗谷歌街景,就能每两周发布比2006年谷歌所拥有的总和还要多的图像数据。
让我们回过头来回想一下谷歌公司的壮举:单独一家公司让携带定制相机的车到每条它可以行使的道路上去。他们已经驶过五百万英里了。每次行驶会为绘图产生两种切实有用的数据;其一为它走过的路线,它可以作为某条路可走的证据。其二为它拍摄的照片。谷歌街景中的这些照片的重要意义在于谷歌可以通过算法提取出交通标志,然后通过他们的地图工具把这些标志贴到后台地图中。所以在一个典型的纵横交错区域,比如的旧金山的市区(如下图),后台地图就是这样的。
谷歌街景并不想建立这样的地图,但地面实况的地理小组很快意识到这幅地图的电脑版本会为他们的项目带来不可思议的数据。不必走太多的弯路,以上是他们使用谷歌街景图像的开始。就把他们想象成早期的网络先行者(还记得他们吗?)现在来探索现实世界,他们还是要依据页面上的文字。这正是谷歌街景正在做的。它首先被用于找到街道标示以及地址,如此谷歌地图就能更好地理解人类交通系统的逻辑。随着电脑版本及光学字符识别(OCR)的不断提高,任何可以在街上看到的文字都将成为谷歌为现实世界设立的指引。
那天的晚些时候,谷歌地图工程副总裁布莱恩·麦克伦敦(Brian McClendon)如此解说到:"对于现实存在的信息,只要我们能光学字符识别(OCR)并且能处理它,我们就能组织它。我们现在用来构建地图也就只是提取街道名字以及地址,其实还有很多其他的没有用到。"
这更像什么呢?他继续解释道:"我们现在有六百万个商业机构以及两千万个地址的'视野码(view codes)',我们可以很精确的知道我看到的是什么,我们可以通过标识匹配来知道肯德基的标志在哪儿······。我们可以识别并在语义上理解我们摄录的全部像素。这是我们工作的基础。"
但现在,对于谷歌街景的图像,能直接理解其中的地理含义的电脑还没出现。所以你要确定能否在一个路口左转只能让一个人去看交通标志,无论是直接驾车去还是通过看谷歌街景拍摄的图像。
这可与谷歌另一个给人留下深刻印象的项目作个类比。那就是谷歌翻译。看起来是机器智能其实是人类才能的组合。它靠的是被人翻译成不同语言的大量的文本;然后提取出匹配的单词与句子。算法并不是你想像的那般复杂,它有效是因为它有海量数据(也算是人类的才能)可供使用。
谷歌地图的做法也相似。人类把道路的逻辑编码来代表世界,所以电脑就能无限而且及时地重用某个人已经做出的选择。
这个在尼克·沃尔玛那儿得到体现,作为操作员的他将为我们展示地图,而由威斯马利克和古普塔来解说。他大概用了25个快捷方式来在各种数据模式间转换。他那令人惊叹的速度通常只在长期从事Adobe相关设计工作的人以及星际的职业玩家中见过。他显然已经花费了数千小时在上面了。
威斯马利克告诉我为一个国家绘图需要好几百个这样的操作员。(据传他们中的很多人都在班加罗尔的办公室里工作,古普塔就是从那儿提拔上来的。)
但是花费在谷歌地图上的人工就能让人大吃一惊。你能看到的每一条横亘在地图上的道路都是由某个人亲手处理过的。对我来说,最能说明这个的就是每天都要收到几千份用户发来的问题报告。地理小组(Geo team)会尽量在几分钟内解决问题的主要部分,问题当然要是可解决的才行。有一个报告就抱怨谷歌没有显示在一个乡村新建的环状交叉路。卫星图像还没有做出改变,但谷歌街景的车最近开到了那儿,它的路径就很好地展示了那条路。
沃尔玛开始改正地图,他非常快的画出新路并把它连到原有的设施上。也许是因为有3个人在看着他的一举一动从而给他增加了压力,他在慌忙中并没有画出一个完美的由点组成圆。威斯马利克和我就绕到了其他的话题上去了,我们就这样谈了几分钟。等我再来看屏时,沃尔玛已经画了一个有完美精确度的圆并更新了其他的一些东西。这些处理的自动化程度令人惊叹,这些都会促进完美主义。
这就是你的地图看起来是这样的原因:
有些细节需要指出。在中心区域,痕迹被标识出来并被标为可供行走。停车场也被标识出来。所有的小路,比如从左边通向在图右边的空地区的小路,也被标识。某些建筑被绘出轮廓,在左下角,一条路被标为禁止通行。在每个交叉处,都有箭头表示可转向与不可转向。
现在谷歌地图的每一分块都已做过这样的处理,这样的谷歌地图也在过去4年中涵盖了美国及其他30个国家。每个环状交叉路都是完美的圆,每个交叉路口都有正确的方向指引。每一个改动。每一条单向街道。各样的工作量大得难以想象。这不是只需要一些聪明的工程师就能搞定的。
在我离开时我终于相信在整合地理数据方面,大概没有哪家公司能比得上谷歌。成功的秘诀并不是你想的那样:谷歌在数据上有先天优势。而是谷歌有用人力来整合及清理现实世界的数据这样的的意志。谷歌基于人类才能的服务才能独领风骚,也正是这个让电脑能告诉你从旧金山到波士顿的最好的路径。
最好别把谷歌地图想象成纸质地图那样的东西,地理信息系统的的这次跃进就像是从算盘到电脑一样。"我真的认为,对于地图制作,我们见证了一场比手绘到印刷还要深刻的变革,而那发生在文艺复兴时,那个巨大的变革,但这个更大。"伦敦大学的目录历史学家Jerry Brotton如此告诉《悉尼先驱晨报》。
我们通常叠起来并放到手套隔间里的地图是各种线和各种形状的聚合,它层叠着人类的智慧。而现在,正如我们所见,这些线和形状的聚合里面编码有沃尔玛(Volmar)这样的人的才智。
在讨论地图的未来时,我们通常会提到博尔赫斯建立比例尺为1:1的世界地图的梦想。我们已经有一个现实世界了,却还想要有它的一个完整的呈现的这个想法看起来很荒谬。但如果我们认真对待博尔赫斯这个学者关于真实的论点的话,我们就会相信他所说的每个真实空间都被信息"内渗"。每个现实空间都已经算是信息空间了。我们每个人都已经在头脑中存着一幅博尔赫斯(Borgesian)地图,它所代表的空间可以给我们引导并让我们度量世界。谷歌的策略是把思维中的地图组合成可用的形式。
他们的地图作品是这个抱负变得明晰起来。古普塔在印度引领的的一个项目,就是"地面实况"的底层版本。它使得公众能在谷歌地图上编辑自己周围世界的地标及数据。这是一种把人脑中的信息吸纳到因特网上的方式。这个比较像谷歌的公开竞争者——公开街图(Open Street Map),它也证明利用集体智慧是可能的。
当我们越来越沉浸于线上线下都可见到更多的真实的世界,谷歌的地理数据就是最典型代表。并不仅仅是因为它的数据,还因为它的位置数据使得其他谷歌在做的或已知的更有价值的。
或者如我的朋友罗宾·斯隆向我解释的,他也是一个科幻作家,"我始终认为在50年中这是谷歌的核心资产,谷歌会变成一家卖自动驾驶的汽车的公司,靠的是这幅详尽地图,当然,只要他们还有搜索引擎。"
当然,他们要使这些有价值还需要另一些地理信息:你。还有你处的位置,也就是说,你的位置信息就是使谷歌的巨型地理数据机器得以运行的电流。他们已经把这个平台建得对你有足够的吸引力了。它是如此棒,如此智能,如此有用,很难忍住不去试一试。
源地址:
http://article.yeeyan.org/view/286644/316947
(
来自鲜果联播)