<P>Google使用位于世界各地的GNU/Linux服务器场计算机回答搜索要求并索引网页。服务器场被以shared nothing architecture结构建造.索引是由程序“Googlebot”执行的,它会定期地请求访问已知的网页新拷贝。页面更新愈快,Googlebot访问的也愈多。再通过在这些已知网页上的链接来发现新页面,并加入到数据库。索引数据库和网页缓存大小是以兆兆字节(terabyte)来衡量的。</P>
Google使用的这些机器的精确大小和位于何处至今未知,Google官方刻意含糊其词。在John Hennessy和David A. Patterson所著的《计算机建筑:走进大数》中,推测Google的服务器场中群集计算机群形成的“搜寻场”在2000年大约应该有6000个処理器,12000个普通IDE硬盘(即每个机器2个硬盘1个处理器),他们位于四个地方:二个在 硅谷和二个在 维吉尼亚。每个都以OC 48的线路(2488 Mbit/s,参见宽带)连接着因特网并且有一个OC 12(622 Mbit/s)线路连接着其他3个Google分站点。这些连接使用思科12000网关,用二个Foundry Networks BigIron 8000的以太网交换器分流成4 x 1 Gbit/s的线路连接到64个服务器夹,里面前后各是40台电脑和1台惠普以太网交换机,所以一个架子共有80个机器和2个惠普交换机。 除了搜索网页之外,Google也提供对图象,存在于Usenet上的新闻讨论组,新闻和在线销售商品的搜索服务。截至2005年2月,Google数据库已经索引了80.5亿个网页,11亿8千万图象及8亿4千5百万新闻组帖子-总共为95亿。它也缓存了编入索引中的绝大多数网页的内容。
因为Google的名声,“Google”一个事物做动词表示的是“在Google上寻找某事”。它有宽泛的“搜索网路”的意思。Google官方并不鼓励这种滥用他们公司名字的习惯,因为它可能导致Google变成一个通用商标名。
到目前为止Google一共提供了19个服务和4个工具软件这些服务个软件分别是:
Google网上论坛(新闻组)和Google图片搜索服务
Google新闻
Google网页目录
Google Answer
Froogle
Google Web API
Google Print
Google Maps
Google Earth
Google Moon
Google Scholar
Google Special
Google Talk
University
Wireless
Video
Google Search History
Google Personalized Homepage
Google SiteMapGoogle工具软件
Google工具栏
Google Deskbar
Google Talk
Google Earth当Google已经开始被大众作为首选的搜索工具后,Google也同时成为被批评的对象.其中最大批评是Google对隐私的侵犯。 Google利用唯一标识cookies破坏了访问者的隐私。这些cookies不会过期、并且会在未得到同意的情况下,把用户的搜索请求用于广告的目的。Google宣称cookies是用来获取用户在不同session和网站的参数选择的,用户可以自己选择关闭cookies。
一些人相信Google的GMail会过度的处理信件内容。支持这观点的人一般没有GMail帐号,因为他们不同意GMail的服务条款;但问题是向GMail发信的用户也会收到未经批准的信件内容分析。Google宣称使用GMail发送或接受的信件不会被人类分析:它只用来改进广告内容关联性服务。作者: dukhilu 时间: 2005-9-28 13:40:22