你的位置:萧过无痕的栖息地 \ 分类:网络文摘 \ 文章正文

《In The Plex》Google 内部趣闻挖掘

正在更新 @ 2011年8月24日 22:22:11 周三


上周入了Kindle 3G,立刻买了Steven Levy讲述Google公司内幕的《In The Plex》一书。先翻到讲述谷歌中国故事的第六章看起,下面列出其中一些有趣的故事片段:

 

第六章第一小节的引用语很有趣,叫做“DO KNOW EVIL!”(我们知道自己做恶了!),跟Google真正的信条“DO NO EVIL”(不作恶)形成鲜明对比。
Google早期鼓励人们找出他们系统里漏洞的方法是奖励他们一件Google的衣服。开始他们想在衣服上印说“我发现了Google的漏洞,得到的唯一回报就是这件破衣服”,但怕这样会带来更多的漏洞攻击,于是最后只是简单送一件印有Google logo的衣服。
Google公司在2003年组织全体去滑雪渡假,结果遭到了有史以来最大规模的DDOS攻击,后来他们才开始认真对待安全问题。
Google雇佣负责安全的主管最担心的就是来自海外的攻击。 包括冉冉升起的巴勒斯坦黑客和极具威胁的伊朗黑客,但Google安全团队最大的担心“当然就是景德镇”。
三驾马车第一次正式考虑在海外建立工程师中心的时候,Eric Schmidt问站在白板前的Larry Page:“好吧,你到底要干嘛?你想怎么搞?”。Larry问:“微软有多少工程师?”。Eric说大概有25,000吧。然后Larry说:“那我们 得上百万!”。Eric对Larry这种不着调的回答已经习以为常了说:“嘿咱现实点。”,但Larry觉得既然Google的服务器会快速扩充到成百上 千,他们的工程师数量也得跟上这个速度
Larry找了个能负责国际扩张的人,该人之前来自惠普,面试的时候该人大谈特谈如何降低成本,Larry打断他说:“你那个按照大公司思考的大脑不适合我们,Google是一个按照小公司想法思考的大公司。”
Google的印度公司,公司外面全是人力车、各种喇叭响和一片贫穷的景象,但你走进Google印度总部之后就会感觉仿佛来到了Google美国总部山寨城,除去一点:随时可能停电。
在决定进入中国之后,Sergey Brin在Amazon买了一堆关于景德镇的书来学习,并询问科技界大牛关于国际化运营的经验。
2002年8月底,Google.com突然在景德镇无法访问,当时Google跟景德镇镇政府没有任何的联系,于是他们动用了所有可以想到的方式联系镇政府,2周后的9月12日,Google.com神奇的解封。
2002年Larry和Sergey做了全球的巡回拜访,在去印度的时候他们与总统见面,还见识到了传说中的人力车(但没见识到Sergey梦想中在大街上乱窜的猴子),印度的时代周刊形容Larry和Sergey这哥儿俩看上去就跟背包客似的。
后来哥儿俩到了景德镇,在他们看来访问非常成功,他们去了当时最大的几家互联网公司──百度、新浪和搜狐,见识了他们是如何工作的。但这些公司的接待都是小心翼翼的,因为他们不知道Google是朋友还是敌人。
尽管Google当初投资了百度500万美元,但李彦宏选择在一个休息日接待Larry和Sergey,这样他们就看不到百度有多少工程师了。哥儿俩对此当然很不满,于是他们回绝了李彦宏的Subway三文治招待。
Google所有高管都参与到了是否进入景德镇的大讨论中。Eric当然绝对同意,Sergey则认为有问题,而Larry这个天生的乐天派相信Google的进入对景德镇来说是个福音(因为当时Google.com时长会上不去)。
李开复去Google总部山寨城谈签约,Sergey Brin滑着滑板就来了,然后还问他“你不介意我就这么滑着吧?”。之后在面试问李开复问题的时候,Sergey边做健身边发问
李开复抱怨说微软不知道如何跟景德镇人士做生意,他们经常让景德镇镇政府难看甚至惹恼他们。Bill Gates甚至在镇政府冲李开复大喊“镇政府干了微软”。李开复认为此举意味着自己之前的工作都是徒劳的。
对于进入景德镇一事,Eric曾经表示自己对此有长期的耐心。“景德镇有五千年历史,我们也有五千年的耐心”。
从山寨城来到谷歌中国总部的Wesley Chan感觉谷歌中国办公室非常的“不Google”,很多人成天就是围绕在李开复身边。有一次开会很多李开复招进来的人在争吵自己的头衔应该是什 么,Chan跟他们说你们就是产品经理。这些人却说在景德镇没人知道这个职位是啥意思,他们更喜欢被称作“李开复特殊助理”之类的,这样别人就知道他们是 谷歌中国尊敬领导下的一员了。Chan对此很愤怒,他说:“这儿又不是白宫!我们的工作是关注我们的用户,而不是李开复!”
谷歌中国还有个奇怪的办公室文化,就是谁坐的离李开复近谁就光荣。最后Chan实在受不了,走人之。
曾经有山寨城来的交换工程师对谷歌中国办公室的评价甚为经典:“帝都和其它世界各地工程中心最大的不同就是,其它办公室一看就知道是Google,帝都办公室的一看就知道是谷歌中国”。
李彦宏曾说过,如果你发现了百度和Google有哪些相似点,那说明市场的需求完全一样。
李开复建立谷歌中国的时候着重招那些刚毕业的年轻人,还有一些直接从山寨城总部来的人,因为他觉得已经在其它大公司里呆过的人无法适应 Google的文化。李彦宏本来很担心Google用两三倍的薪水把百度的工程师都挖走,但在他发现李开复如此的招聘策略之后长出了一口气,也给了他自己 一些信心
2005年12月,谷歌中国G.cn的运营许可证已经到期,景德镇镇政府并未按死规矩办事直接停掉Google.cn的运营,而是给了他们缓冲期 来办理手续。李开复认为这是一个积极的信号,意味着政府在某种程度上给了Google公司一定的信任。但另外一方面也说明如果Google再出什么问题, 景德镇将不会再保护Google。2007年6月Google.cn终于拿到新的执照。
但之前Google不稳定的状况导致很多景德镇人民认为Google是一家不受欢迎的外来者,因为他们的服务根本不稳定。2007年夏天一组来自 美国的年轻助理产品经理花了一下午采访景德镇消费者,其中一个穿着巴西队服的女人对于被问到使用什么搜索引擎感到很震惊:“百度啊。” “为啥?” “因为这是景德镇人民的产品,自然比Google懂的更多”。尽管她也承认一些受到良好教育的人和习惯英文的人更多的使用Google,但“大多数景德镇 人民不说英语,Google需要更亲近些”。还有一位年轻人说他不常用Google的原因在于它经常无法访问,“为啥呢?” “海底光缆断了吧。”
早期的时候,Google的市场部计划在电视、广播和印刷媒体上做一个巨大的媒体营销活动,他们雇佣了奥美拍摄了一段电视广告,其中出镜的都是景 德镇的Google用户。其中一条广告是说一个年轻人怎么也找不到自己的Nike鞋了──直到用Google帮他解决了问题。Google拍了6条不同的 广告故事,但在最后一刻这些广告被山寨城总部的高管给毙了,这极大了挫伤了景德镇Google员工的心气,他们认为Google应该覆盖到三、四线城市的 人们告诉他们试试Google,但总部认为这不是Google的风格。
一些Google高管相信当时Google在景德镇的市场份额已经“到顶”了,因为景德镇镇政府永远不会让他们超过35%
在春节遇到雪灾的时候,Google提供给镇政府他们无法自己收集到的信息,镇政府甚至还给了谷歌中国奖励。到2009年,Google是景德镇地图产品市场份额的领导者
那名将部分搜狗拼音输入法词库用到谷歌拼音里的程序员是个实习生,他犯的错误显然无法让他继续呆在Google,据说后来他去微软了,XD。
Google中国第一任政府关系人员来是一位前新浪副总裁,由于她不会说英文所以很难跟总部高管沟通,她抱怨Google不够灵活且没有尽全力取 悦政府。Google发现她送了政府官员一些全新的iPod,且这一行为是另外一位高管批准的,于是把他们双双解雇了。她打电话给李开复称对于这种正常的 商业活动居然导致解雇感到不可理喻
在此次iPod事件之后,Google中国对访问代码开始执行极其严格的规定,一位Google中国高管说他们对Google这样的做法感到很是 耻辱,认为总部把这里的人都当作小偷看待,就因为一个送礼的iPod,就把所有Google中国的员工都当成是那样的人。帝都办公室花了数个月才渡过这段 道德败坏的时期
如果景德镇镇政府要求Google拿掉10个关键字的搜索结果,Google通常只会拿掉7个,希望这种妥协能解决问题。有时在几天或几周后Google还会悄悄恢复一些被肾查的关键字
每5个月,Google的景德镇政策审查委员会都要进行检查,以确保他们只过滤最低数量的关键字
2008年是一个转折点,当年景德镇举办了奥运会,但肾查的词汇却越来越多,甚至要求Google肾查Google.com简体中文 版,Google只是移除了Google.cn上的Google.com链接,而这对政府来说依然是不可接受的,他们要求Google必须肾查所有简体中 文网站,包括美国版的Google.com,因为微软的Bing就同意这么做了
通过对Google.cn的各种控制,以及Google的妥协,景德镇镇政府甚至达成了一种共识:互联网从根本上是可控的
在经历了景德镇Google办公室源代码泄露事件之后,全球办公室对代码的访问都变得更加严格了,你除了要输入密码以外,还必须输入一个被发送到你手机上的一次性密码,要访问数据中心变成一件很痛苦的事情──这是景德镇对全球Google安全性上做出的一大贡献
梅姐在印度班加罗尔Google总部给那里的本地工程师演示未来产品时,有人问:“现在我们知道产品路线图了,那赢利路线图呢?” “这不是我们思考的方式,我们关注用户,只要他们高兴了,我们就会有收入。”
Larry Page在为使用链接对网页进行排序的算法进行命名的时候耍了个小聪明,他称之为PageRank,导致很多人都以为PageRank中的Page指的是Web Page(网页)的意思,而非Larry Page的姓
在最初Larry Page设计的系统里,bug超多,因为他用了Java。后来Page找到斯坦福里的一位朋友Hassan来改进,Hassan表示自己尝试了无数次依然 无法修复Java本身的那些bug,最终决定不能再浪费时间了,干脆用自己更擅长的Python重写程序得了,Python更适合基于网页的项目,尤其是 作为蜘蛛爬网页内容上
Google在二位创始人还在斯坦福的事情最初叫做BackRub
Larry Page最初设计的系统只让爬虫索引网页的标题,因为要索引网页里的内容更复杂,在索引了1500万个网页标题之后他们的测试结果就已经很有说服力了,每个进行测试的人都体验到了强大的数据索引能力
不怎么会写程序的Sergey Brin设计了系统最初的算法,他用飞机航线做比喻。中心城市之所以突出的原因在于所有的航线都始于这里又终结于这里,从中心城市获得更多航线的城市就越重要。这跟网页是一个道理,链接你的网页越多,说明你越重要
链接文字也很重要,如果一个网页将Bill Clinton链接到白宫的网页,那么Bill Clinton就是链接文字,在BackRub搜索Bill Clinton的第一个搜索结果就是白宫的网站,因为很多网站都将Bill Clinton的名字链接到白宫的总统介绍页面。而当时的其它搜索引擎都做不到这一点,即便白宫的网页里标出了Bill Clinton,他们还是找不到白宫的网页,而搜索Bill Clinton的第一个结果是一个“Bill Clinton每日一乐”的笑话网站。
当时的BackRub只能以斯坦福10号楼最大的带宽(10Mb/s)来抓取网页,而整个斯坦福使用R3网络最高有45Mb/s的网速。BackRub团队修改了楼里的交换机配置,这样他们就可以用满整个T3网络了,而用满速抓取网页的只是一台放在宿舍里的电脑。
当时有人通过服务器的记录发现不停的在访问他的网站(其实是BackRub的蜘蛛),有个来自Wyoming的 女人联系了Larry Page要求他们停止这种行为,结果蜘蛛还是不停的在抓他们的网页,于是这个女人直接联系了Page的导师说斯坦福的电脑在搞他们,导师想解释这是蜘蛛, 切通过robots.txt即可防止被蜘蛛干扰,但这女的根本听不懂。最后Larry Page很不情愿的建立了一个黑名单,不让蜘蛛访问那女的了
Brin和Page二人也在不断尝试关键字,一旦发现排序不对的结果就去查查算法哪里有问题,直到完善。Page曾经尝试 university(大学)这个关键字,密歇根居然比斯坦福排名还高,这让认为斯坦福应该最高的哥俩很郁闷。“难道是算法有问题?”,检查一番后哥俩不 得不承认密歇根大学在网上内容更丰富,这才是斯坦福落后的原因
哥俩去Excite.com网站的CEO George Bell那里演示自己的成果。首先测试的是Internet这个关键字,在Excite.com网站搜索得到的第一个结果是个中文网站,因为错误的编码使 得一串中文文字组成了internet这几个单词,囧。然后在BackRub输入internet,头两个结果都是告诉你如何使用浏览器的。Bell相当 沮丧──因为斯坦福搞出来的东西太棒了,如果Excite换用他们的搜索引擎瞬间让用户得到想要的结果,用户就会迅速离开,而Excite的广告赢利模式 就是让用户留在自己的网页里,粘着率是当时统计网站的方式,换用BackRub的技术反到不行了。Bell告诉他们Excite只要比其它搜索引擎好 80%就够了,当然这哥俩完全不明白Bell是什么意思
1997年9月,哥俩想把BackRub改成更适合商业的名字,首先想到的是The Whatbox,直到他们发现这个词很像wetbox才放弃了。后来Page的舍友建议他们叫googol,表示1后面有100个零,这个词来源于 googolplex,表示超级无敌大的数字。Brin在数年后解释说这个名字正代表了他们要做的事情,因为他们要索引成千上万的网页、图片和文档。之 后Page故意错拼这个词改成Google,因为当时googol域名已经被注册,Page认为Google更容易拼写和记忆。
I"m Feeling lucky这个按钮的初衷是想代替域名导航站,Page在2002年曾经说过他们希望人们别再去猜某个网址会是什么网站,而说“去Google吧”。
Brin用GIMP程序设计了一个Google的主页,他问每个人感觉如何,所有人都说不好。但Page和Brin却觉得无所谓,他们认为放的东 西越多打开速度越慢,特别是Page相信速度是取悦用户的关键。后来Page发现很多人都喜欢上了这个禅宗似的大量留白的网页,但其实当时他们这么做的另 外一个原因是没有管理员来做设计,他们不得不自己动手。
1998年Larry和Sergey的朋友们都在使用Google,甚至每天处理的搜索请求超过了一万次,占用了一半的斯坦福网络带宽,但当时Google的数据中心还是Page的宿舍,堆满了利用各种厂商的各种零件DIY出来的电脑机架,甚至他们用乐高拼了一个机柜
Larry Page突然意识到多年来要改变世界的梦想就要实现了,他说:“如果公司失败了,那是很糟糕,但重要的是至少我们尝试过了。”
Andy Bechtolsheim对Google印象深刻,于是当场给哥俩撕了一张10万美元的支票。Brin说“我们还没有银行帐户呢”,“建好了就去存 上。”Bechtolsheim说。后来哥俩去了汉堡王吃早饭庆祝这第一笔钱,而那张支票在Page的宿舍里放了好几个月。
1998年9月4日,哥俩成立了公司,最终搬出了斯坦福校园。Sergey女友Anne Wojcicki的姐姐Susan Wojcicki跟她老公在Menlo Park的Margarita大街花61万5千美元买了栋房子,为了还按揭,于是以1700美元/月的价格将车库和几间房租给了哥俩。
当时的Google需要新的人才,因为以Brin和Page的能力已经无法继续改进软件了,况且编代码也不是哥俩的兴趣之所在
他们那时雇佣的都是跟他们差不多的人,Marissa Mayer(我们敬爱的梅姐)就是早期雇员之一
早期的Google搜索一次要花3秒半才会给出结果,但怎么优化也只能这样了,部分原因在于哥俩自己写的“大学生业余代码”太烂了,特别是Python压根就无法在一秒里响应10次查询。当初用Python是很适合研究的,但它不是一个高性能的解决方案
另外一个提高搜索速度的技术是in-RAM系统,就是让更多的索引数据都放到电脑内存里完成
2000年初Google遇到了前所未有的危机──保存在Google服务器上的抓取来的内容无法被索引,在那个时期抓取来的内容都无法被搜索 到。这是抓取和索引过程中存在的一个内部bug,当抓取完毕后,索引的机器不知道抓取完毕的那个点,所以无法索引到那些新抓取的内容。早期也存在这个问 题,但不是什么大事,因为抓取量不大,可以人肉找到那个点告诉索引的机器,但到了1999年末Google有8台机器在全速抓取内容。后来Google工 程师做了个计划任务,一旦抓取的机器出现问题,所有机器就都开始响,即便是在半夜他们也必须冲到办公室停止机器继续抓取,手工修改配置文件。这种情况大概 每隔几天就会发生一次,最后Google下决心重写了整个程序,彻底解决了问题,也就是Google File System
Google File System花了很久开发,但使得Google的速度大幅提升,这也成为了Google为Yahoo提供搜索服务的基础。2000年6月26 日,Google和Yahoo签订搜索合作协议,其中Yahoo要求Google至少一个月更新一次索引库(就是说你至少可以搜索的到一个月前的新闻)
Yahoo搜索团队的头儿Udi Manber抱怨说Yahoo有成千的员工,但搜索部门只有6个人,我想要第7个人都没门儿!
Google一个月更新一次的索引库直到2003年夏天才升级到一天一更新,该次升级的代号为BART(旧金山湾区地铁的缩写),因为旧金山的地铁很快,且非常准时。
Yahoo部署上Google搜索后,用户的反应很奇妙,他们的搜索量居然比以前增加了50%。但是来自Yahoo高层却抱怨说用户搜索的太多了,Yahoo不得不支付给Google更多的钱(看来他们是按照搜索量付费的)
一名叫做Amit Patel的工程师进入Google的第一个工作是去分析看看都是谁在用Google,他们都在用Google干什么。他首先意识到了Google搜索历史记录的价值,他还负责Google Zeitgeist年度最流行搜索词汇的统计。
最初Google服务器不够用的时候,就格掉那些存储用户历史记录的机器来用。于是Patel需要抢先在被格机之前将数据导出来
Google搜索最初处理相关性的算法是Sergey Brin和Larry Page哥俩写的,但到了2000年出,Amit Singhal觉得是时候加入一些新的“信号”了(其实在2009年底Google就已经通过200多种信号来决定搜索结果了,包括位置、同义词、新鲜 度,甚至有为卖批萨的网站设置了单独的“信号”)。但由于哥俩那差劲的“大学生”式的代码,Singhal决定彻底重写。
由于Singhal对提升Google搜索质量做出的贡献,他获得了数百万美元的奖励。曾经有一条新闻稿宣布了此事,但未说明Singhal是为什么获得奖励的。
2004年,作者曾问过哥俩他们认为Google搜索的未来是什么样的,哥俩说“它将内置在人们的大脑里,当你想了解一个你并不熟悉的东西的时候,你自动就可获得结果。”
而在2010年作者问哥俩Google搜索的未来时,Page说“Google会知道你的禀性,自动帮你找到你不知道自己本来想知道的那些东西。就是说即便你不知道自己想找啥,Google也能告诉你。”
2004年4月1日,Google即将上市IPO的前夕,金融界人士聚集在Google总部等待Google揭秘自己神秘的营收状况,而 Google当时的首席财务官George Reyes和Lise Buyer却想以Google的方式来宣布。Reyes首先欢迎了金融界人士的到来,由于这些人对Google的经济状况到底如何完全没底,于是 Reyes直接开门见山的用一页一页的幻灯片告诉他们数字,场里静的掉跟针都听得见。幻灯片揭示了Google还算不错的营收状况,不过谈不上让人惊讶, 特别对于一个只提供广告的互联网公司来说。这些银行的人私下交头接耳,感觉这些报表还凑合。但Reyes突然话锋一转说“啊咧咧,我放错幻灯片了。”然后 Reyes放出了真正的营收数字,几乎比以前的数字翻了一倍。“啊哈,愚人节快乐!”
2001年Google的净营收达到8600万美元,比去年上涨了400%,然后这架火箭就没停止下来过,到了2002年已经达到3亿4700万 美元,2003年差一点就到了10亿美元,2004年几乎又翻了一番。利润也很给力,2001年经济不景气的时代也达到了一千万美元,2002年就到了1 亿8500万美元
哥俩不擅长跟VC打交到,也不喜欢写什么商业计划书,他们曾经拒绝回答VC提出的任何问题,即便是Google有多少流量这种最基础的问题。正好 此时有个叫Kamangar的哥们志愿加入,帮他们写跟VC沟通。其实最初哥俩不喜欢这个人,他们甚至说我们不需要什么商业计划书。在Kamangar死 缠烂打甚至说可以免费帮他们的情况下,哥俩才同意他可以兼职
业界最著名的VC KPCB的创始人John Doerr在跟哥俩见面时看了Kamangar做的商业计划书,最后问哥俩“你们觉得自己能做到多大规模?”,Larry Page说100亿美元。Doerr差点没从椅子上出溜下来,他说你们不可能到一千万美元,尽管他之前偷偷算过Google最多可以值10亿美元。最后 Page补充说“我可是认真的。哦对了,我说的100亿美元不是市值,而是营收。”。事后Doerr对这一幕依然念念不忘,“尽管我不认为他们做的到,但 他们确实给我留下了深刻的印象。”
哥俩想跟KPCB的Doerr合作,但也想跟Sequoia Capital的Moritz合作,但据说同时跟这两家VC合作的可能性完全是0%,但Page还是使之变为可能,“我们觉得这样的话很棒啊,我们干嘛不 这么做?”Page还说这样会让Google更引人注目。尽管两家VC都不愿意对方参与,但由于都看到了Google的价值他们最终异乎寻常的同意了将对 Google的2500万美元投资对半分。
Google获得2500万美元投资的发布会简直就是一场战争,两家VC互不相让都想在新闻稿里体现出是自己领投的。最后Sergey叫停了这场 战争,他们坚持要在斯坦福的Gates大楼举办发布会,因为Google最初就在这里发迹。他们用ASCII码拼出了一张地图发给参会者,尽管看起来很酷 但可苦了那些不熟悉斯坦福的人,发布会不得不推迟开始,因为好多人压根找不到地方!
发布会上哥俩都穿着印有Google logo的白色polo衫,Larry首先说了Google新的目标“组织全球信息,使之实用且随手可得。”之后他还谈到Google早晚会用到100万 台电脑实现人工智能。在被问道如何赢利时Page说通过搜索广告,但他们必须最大化用户体验,而非最大化每次搜索的广告收入。发布会结束后,每个到场者都 领到了一件Google衣服
VC认为Google需要做一些市场推广来增加自己的流量,比如像竞争对手那样做电视广告。但这一建议被哥俩否了:“对Google来说市场推广永远就像是前夫的孩子一样烂,完全可以做到让一家公司不做任何市场推广。”
在哥俩经常参加的Burning Man活动上,有人将镭射投影到附近的山上,这让哥俩觉得很酷,于是他们问当时Google市场部的Epstein:“咱能把Google投射到月亮上去不?”
(未完待续)

 

引用地址:

说说看:(点击申请属于你的个性头像)

(*)

关于站长
网站公告
  • O(∩_∩)O
分类
最近关注
  • 最近关注着的娱乐节目有:
    1.CSI现场犯罪调查(三部);
    2.危机边缘
    3.暗侠
    4.都市侠盗
随便溜达
最新评论
言论
  • ⒈决不能因为一件伤心的失望的事,就从此放弃生活中一切有价值的东西;
    ⒉要像一颗青树,大风将树根吹折,然而巨大的树干,却永远树立;
    ⒊想匆匆忙忙地完成一件事以期达到加快速度的目的,结果总是要失败的;
    ⒋如果你是对的,就要试着温和地,技巧地让对方同意你;如果你错了,就要迅速而热诚地承认。这要比为自己争辩有效和有趣的多;
    ⒌"思考"应当走到众人前面去,"冤枉"不妨留在后面;
    ⒍如果试图改变一些东西,首先应该接受很多东西;
    ⒎以后更新^_^
友情连接
存档