Opus Dei
Ponte al día
Opus Dei: verdades ...
DATOS | DINERO | CRÍTICAS Y SECRETOS | OPUS DEI: ENLACES | FRANCO | LIBROS | LA ESTAMPA | MISCELÁNEA

Escríbenos Escríbenos: correo@pontealdia.net

Todo acerca de Google

Todo acerca de Google

1. Historia de Google. Los comienzos
2. Otros Google's
3. La competencia
4. Sitios web con PR10
5. PagerankTM
6. Tecnología de Google
7. Red Hat Linux Powers Google's Award-Winning Search Engine
8. Computer artist doodles oodles of 'Google's
9. Curiosidades sobre Google
10. The technology behind Google's great results
11. Googlebot
12. FreshBot
13. AdwordsTM. Publicidad en Google
14. AdSenseTM. Ganar dinero con Google
15. Barra 'Google Toolbar'
16. GoogleSyndication
17. ¿Qué es la 'Google Dance'?
18. Fechas de la 'Google Dance'
19. Herramienta 'Google Dance'
20. TouchGraph
21. GoogleStats
22. Google API
23. The Effects of September 11 on the Leading Search Engine by Richard W. Wiggins:
1. Introduction
2. What Users Expected from Google
3. Google on September 11: To Browse, or To Search?
4. Google Evolves After the Disaster
5. Ultimately, Google Acts Like a Portal
6. Google Use in Context
7. Google Responds
8. Where Does Google Go from Here?
9. Footnote: A Sadly Ironic Death

*******************************

1Historia de Google. Los comienzos


- primavera 1995: Sergey Brin (23 años entonces) y Larry Page (24), confundadores de Google y actualmente presidente y CEO, se conocen en un acto que la Universidad de Stanford organiza para los candidatos de su Doctorado en Informática.
- otoño 1995: Larry y Sergey comienzan a trabajar en el 'Digital Library Project' de la Universidad de Stanford. Larry Page, con experiencia en diseño web y el título de Ingeniero Eléctrico, y Sergey Brin, un experto en tratamiento de datos y Licenciado en Informática y Ciencias Matemáticas, comienzan a crear un algoritmo para la búsqueda de datos. Esta tecnología se convertirá mas tarde en el corazón que hará funcionar a Google.
El nombre que Larry Page da a esta tecnologia fue 'PageRank'. En su pagina web personal de la Universidad de Stanford, colgará en 1997 una presentacion que lo explica: 'PageRank: Bringing Order to the Web'.
- enero 1996: Comienzan a desarrollar un buscador llamado 'BackRub'. Este nombre se lo dan debido a que la mayor habilidad de este motor de búsqueda es analizar los 'back links' (enlaces que apuntan a una determinada página).
Tal y como indican en su descripción, Backrub está escrito en Java y Python (incluso Larry Page postea alguna duda en los 'newsgroups'), y corre sobre varias máquinas Sun Ultra y Intel Pentium con Linux. La Base de Datos está alojada en un ordenador Sun Ultra II con 28GB de disco duro.
Si tienes cualquier duda sobre el funcionamiento de este buscador, y no está contestada en sus FAQ, puedes llamar al (415) 723-3154, y preguntar por Larry. Los primeros usuarios son los alumnos y profesores de Stanford, que disfrutan de la precisión con la que el buscador encuentra datos en la web.
- 1997: 'Backrub' se transforma en 'Google'. Le otorgan este peculiar nombre por su parecido a la palabra 'googol', que en inglés es el nombre que que se da a la cifra '10 elevado a 100' (un uno seguido de 100 ceros). Ya tienen indexadas 24 millones de páginas. Mucho antes, ya han tenido problemas de capacidad en sus discos duros, y han tenido que idear ingenios basados en Lego, como este.
En los comienzos de Google (en el dominio google.stanford.edu), su diseño es aún más austero de lo que será posteriormente. En esta antigua versión se incluyen fotografías de los equipos que utilizan
- 1997: Larry y Sergey han registrado el dominio 'google.com'. Además, han dado a conocer su tecnología a la 'Office of Technology Licensing' (OTL) de la Universidad de Stanford, que será la encargada de contactar con diferentes compañías de Internet que puedan estar interesadas en Google.
- enero 1998: A Sergey y Larry no les gusta ninguna de las ofertas recibidas, bien por ser económicamente bajas, o porque no van a desarrollar correctamente la tecnología. Por ello, deciden ser ellos los que creen su propia empresa.
Es entonces cuando el dormitorio de Larry Page se convierte en el nuevo hogar de Google, llevando todos los equipos informáticos junto a su cama. La habitación de Sergey Brin, situada al lado de la de Larry, se convierte en la oficina financiera.
Google sigue indexando paginas rápidamente, y Larry y Sergey necesitan mucha más capacidad en sus discos duros. Tienen que adquirir un terabyte, y finalmente consiguen comprar varios discos duros rebajados, todos por $15,000.
A pesar de la 'fiebre de los punto com' de aquellos días, Larry y Sergey no consiguen encontrar un inversor que financie Google, y tienen que conseguir todo el dinero de sus familias y amigos íntimos. Mientras tanto, habían abandonado su Doctorado en Stanford.
- verano 1998: En casa de un amigo común, Sergey y Larry conocen a Andy Bechtolsheim (cofundador de Sun Microsystems y vicepresidente de Cisco Systems), y comienzan a charlar sobre Google. Después de treinta minutos, Bechtolsheim les firma un cheque por $100,000, a nombre de 'Google Inc.'. Esta empresa, como tal, no existe, y para poder cobrar el cheque (que está dos semanas sobre la mesa de Larry), tienen que buscar un local, y fundar una nueva compañia: 'Google Inc.'.
- septiembre 1998: Google Inc. abre sus puertas en un garaje que un amigo les alquila en Menlo Park, en California. Rápidamente, instalan varias líneas telefónicas, un cable modem, una línea DSL, y una plaza de aparcamiento para su primer empleado, Craig Silverstein (actualmente, Director de Tecnologia de Google). 25 millones de páginas están indexadas, y Google recibe diez mil consultas por día. La revista 'PC Magazine' lo incluye dentro de su lista 'Top 100 Web Sites' de 1998.
En la página web de 'About Google' de este mes, aparecen multitud de referencias sobre todo lo que rodea a Google: las 3 personas que trabajaban en aquel momento, toda la gente que les estaba ayudando, el software y el hardware que utilizaban, las colaboraciones, ...
- febrero 1999: La plantilla asciende a 8 personas, responde a 500.000 consultas por día, se trasladan a unas nuevas oficinas en Palo Alto, y firma su primer contrato comercial con RedHat, el cual empieza a suministrar el Sistema Operativo Linux de los servidores de Google. Mientras tanto, continúan con su campaña comercial: el boca a boca.

Volver al índice


2. Otros Google's
- images.google.com: Buscador de imágenes.
- groups.google.com: Buscador dentro de los grupos de 'news' (newsgroups). Contiene el archivo de DejaNews, adquirida por Google.
- directory.google.com: Utiliza la tenología de Google para buscar dentro de las categorías del Open Directory (DMOZ).
- news.google.com: Buscador de noticias, en más de 4.000 medios de comunicación de Internet.
- Froogle: Es un buscador de información de productos online. Google no es el que vende, simplemente se aprovecha de su motor de búsqueda para reconocer los sitios web que ofrecen productos online y crear una base de datos con sus datos y sus URLs.
- catalogs.google.com: Buscador de productos, dentro de los catálogos de venta por correo de cientos de empresas.
- labs.google.com: Servidor de pruebas de Google, donde se pueden hacer búsquedas de significado de palabras, conjuntos de términos, búsqueda por voz, y búsqueda avanzada por el teclado.
- answers.google.com: Cientos de usuarios realizan sus preguntas, y ofrecen recompensa por las respuestas.
- toolbar.google.com: Integración de una barra de búsqueda de Google dentro del navegador web. Solamente disponible para MS IExplorer sobre MS Windows. Otros navegadores web incluyen una herramienta similar. Por ejemplo, para Mozilla se ha desarrollado googlebar.
- Google USA (Uncle Sam): Busca en los servidores cuyos dominios son .gov, .mil ó .us
- Google Linux: Busca términos relacionados con el Sistema Operativo Linux.
- Google Mac: Busca dentro de todo lo relacionado con Apple y Macintosh.
- Google Microsoft: Busca términos relacionados con la compañía Microsoft.
- Google Universities: Las Universidades de todo el mundo pueden añadir su propio Google.
- www.google.com/wml: Versión WAP de Google.
- Traductor de Google: Traduce páginas webs entre varios idiomas (inglés, español, alemán, francés, ...).
- Google Store: Camisetas, bolígrafos, gorras, ... Todo relacionado con Google.
Volver al índice


3. La competencia
- Teoma: Propiedad de la compañía Ask Jeeves, Inc.
- WiseNut: Propiedad de la empresa LookSmart. Más 1,500 millones de páginas en su Base de Datos.
- AllTheWeb: Utiliza la tecnología de la compañía noruega Fast. Más de 2 mil millones de páginas indexadas. También busca imágenes, ficheros MP3 y noticias.
- Gigablast: Proyecto personal de Matt Wells. Más de 150 millones de páginas indexadas.
Volver al índice



Sitios web con PR10
Esta es una lista con los sitios web que tienen PageRank 10 (el máximo que concede Google, y que varían con cada 'Google Dance').

yahoo.com
Sun Microsystems sun.com
Microsoft microsoft.com
National Science Foundation nsf.gov
Sun Microsystems sun.com
Apple apple.com
University of Oxford ox.ac.uk
nature.com nature.com
Apple Macintosh mac.com
Adobe adobe.com
Macromedia macromedia.com
NASA nasa.gov
US Government firstgov.gov
Google google.com
World Wide Web Consortium w3c.org
PHP php.net
Watchfire Bobby www.cast.org/bobby/
Massachusetts Institute of Technology mit.edu
National Science Foundation nsf.gov
Institut National de Recherche inria.fr


Volver al índice

PagerankTM
PageRankTM (PR) es un valor numérico que representa la importancia que una página web tiene en Internet. Google se hace la idea de que cuando una página coloca un enlace (link) a otra, es de hecho un voto para esta última.
Contra más votos tenga una página, será considerada más importante por Google. Además, la importancia de la página que emite su voto también determina el peso de este voto. De esta manera, Google calcula la importancia de una página gracias a todos los votos que reciba, teniendo en cuenta también la importancia de cada página que emite el voto.
PageRankTM (desarrollado por los fundadores Larry Page y Sergey Brin) es la manera que tiene Google de decidir la importancia de una página. Es un dato valioso, porque es uno de los factores que determinan la posición que va a tener una página dentro de los resultados de la búsqueda. No es el único factor que Google utiliza para clasificar las páginas, pero sí es uno de los más importantes.
Hay que tener en cuenta que no todos los links son tenidos en cuenta por Google. Por ejemplo, Google filtra y descarta los enlaces de páginas dedicadas exclusivamente a colocar links (llamadas 'link farms').
Además, Google admite que una página no puede controlar los links que apuntan hacia ella, pero sí que puede controlar los enlaces que esta página coloca hacia otras páginas. Por ello, links hacia una página no pueden perjudicarla, pero sí que enlaces que una página coloque hacia sitios penalizados, pueden ser perjudiciales para su PageRankTM.
Si un sitio web tiene PR0, generalmente es una web penalizada, y podría ser poco inteligente colocar un link hacia ella.
Una manera de conocer el PageRankTM de una página es decargándose la barra de búsqueda de Google (solamente disponible para MS IExplorer). Aparece una barra en la que se muestra en color verde el valor de PageRankTM en una escala de 0 a 10. Sitios web con PR10 son Yahoo!, Microsoft, Adobe, Macromedia, o la propia Google. Teneis una lista completa con los sitios con PR10.
Si quieres conocer más sobre PageRankTM, puedes descargarte este documento PDF (670 Kb, en inglés).
El algoritmo de 'PageRankTM' fue patentado en Estados Unidos el día 8 de enero de 1998, por Larry Page. El título original es 'Method for node ranking in a linked database', y le fue asignado el número de patente 6,285,999.
Volver al índice

Tecnología de Google
Aparte del 'PageRank' (el sistema de clasificación de la importancia de cada web), una de las claves del éxito de Google es la tecnología de sus servidores.
Google atiende a más de 5,000 millones de búsquedas cada mes (unas dos mil por segundo), y esta cifra aumenta progresivamente cada día. Para atender todas estas peticiones, y buscar entre más de 3,000 millones de documentos, Google optó por la tecnología Linux.
Disponen de un clúster de cerca de 20,000 servidores repartidos en siete 'data centers'. Estos centros de datos se encuentran situados en diversos puntos del planeta, como Washington D.C. (USA), Herndon (Virginia, USA), Santa Clara (California, USA) o Zurich (Suiza). Cada servidor dispone de un solo procesador Intel, y una memoria RAM que va desde 256 Mb a 1 Gb.
Entre estos 'data centers', Google utiliza su propio gestor de tráfico y su propio software de balanceo de cargas, para dirigir cada petición hacia el mejor servidor
En cada PC se encuentran uno o dos discos duros de 40Gb ó 75Gb, de marca IBM. Google prefiere este sistema distribuido de almacenamiento de datos, antes que uno centralizado. Las razones: es mucho más barato y tiene menos posibilidades de fallo.
En cada una de estas máquinas está instalado Linux RedHat. En mayo de 2002, Google llegó a un acuerdo con RedHat para que esta empresa le proporcionase el software del Sistema Operativo.
La elección de Linux fue sencilla para Google: el menor ratio coste/rendimiento, corre en simples PCs, y la posibilidad de personalizar cualquier parte del Sistema Operativo. De hecho, no solamente usan Linux en sus servidores, sino también en la mayoría de los PCs de los empleados. Una vez instalado Linux en cada equipo, los técnicos de Google, lo personalizan a su antojo. Ellos lo llaman 'Googlelizar' el Sistema Operativo con sus propias aplicaciones.
La mayoría de las aplicaciones están programadas en C++ (aunque también utilizan Python y PHP), y las herramientas que utilizan son 'gcc', 'gdb' y 'gnats' para el desarrollo y 'p4' para el control de las versiones. Google dispone de más de 100 desarrolladores en su plantilla.
Debido a la multitud de servidores de los que se dispone, el tamaño de estos es muy importante. Por ello, la compañía californiana Rackable Systems compacta para Google varios servidores en un espacio realmente reducido.
Referente a la seguridad, la mayoría de las máquinas de Google no están accesibles desde Internet, ya que se encuentran detrás de un router/firewall que lo impide. Las que sí están accesibles (los servidores web) son auditados periódicamente para encontrar posibles agujeros de seguridad.
Volver al índice


Red Hat Linux Powers Google's Award-Winning Search Engine
Red Hat Linux is an Essential Component of Google's Innovative Web Searching Technology
RESEARCH TRIANGLE PARK, N.C.-May 30, 2000-Red Hat®, Inc. (Nasdaq:RHAT), a leader in open source Internet infrastructure solutions, today announced that its operating system powers Google's Internet search engine services. Google, one of the fastest growing search engines on the Web, operates its search engine and all of its computing functions on a cluster of more than 4,000 PCs running Red Hat. Google plans to significantly increase its use of the Red Hat Linux operating system as it increases its computing power to meet the growing demand of users worldwide.
Google has used Red Hat Linux for all its Internet computing functions since its inception in 1998. To generate the necessary power for its in-depth searching capabilities, Google needed a large cluster with the dependability and scalability of UNIX, but without the prohibitive cost. With the support of Red Hat, Google has seen significant success. To match the site's growth, Google has scaled its current Linux cluster to more than 4,000 computers, and plans to increase this number as the site's popularity continues to grow.
"Red Hat's easy installation, reliable operating environment, and scalable server support cut down the time and person power needed to oversee the thousands of Internet servers in the Google Linux cluster, thereby helping Google to maintain its focus on developing new technologies that improve a user's search experience," said Urs Hoelzle, Google's vice president of engineering.
Unlike other Internet search engines, Google combines an easy-to-use interface with complex algorithms to determine the importance and relevancy of Web pages - a task that requires a high-performance back-end system.
Google will continue to deploy the Red Hat Linux operating system as more computing power is needed to answer search queries and handle growing worldwide traffic. Red Hat provides the high-performance Linux software necessary for processing and retrieving search queries across all Google data centers.
"By successfully utilizing one of the world's largest Linux clusters, Google has proven Red Hat's scalability and reliability for mission-critical Web solutions," said Billy Marshall, VP of Product Marketing, Red Hat, Inc. "As Google grows, Red Hat will continue to provide the power and support that its innovative searching technology requires."
"IDC's studies show that Linux is often used to support Web infrastructure," said Dan Kusnetzky, vice president, IDC. "By using Red Hat Linux to power its Web searching service, Google is taking advantage of the flexibility and power of Linux. The growth of paid shipments of Linux as a server operating environment has been impressive. It's grown faster than any other server operating environment between 1997 and 1999."
About Red Hat customers
Thousands of organizations around the globe successfully utilize Red Hat's open source products and services, including ISPs, e-Commerce vendors, software developers, government institutions and Fortune 500 companies. To see how Red Hat solutions can help in your industry, or to contribute your own Red Hat success story, visit http://www.redhat.successes.com.
Open source momentum
International Data Corp. (IDC) research states that paid Linux shipments grew faster than any other server operating system over the past two years, and their preliminary figures for 1999 show Linux shipments hold 24.6 percent of the server operating system market, up from 15.8 in 1998. IDC also states that Red Hat Linux is by far the most popular distribution, preferred by 68.7 percent of U.S. Linux users.
Research firm Netcraft, Inc. (www.netcraft.com), states that as of May 2000, 36 percent of all public Web sites run on Linux-based operating systems, making Linux the most popular choice for deploying public Web sites. IDC research shows 40 percent of all spending on Linux servers is for Internet related applications, firmly entrenching Linux servers in the Internet infrastructure.
Finally, IDC predicts that by 2002, there will be more than 55 million handheld and notebook-style information appliance devices and that by 2005, shipments of these appliances will exceed shipments of PCs.
Red Hat's numerous alliances with industry leaders and the demand for Linux-based applications has created open source support from many of the industry's leading software and hardware manufacturers, including Compaq, Computer Associates, Dell, Hewlett-Packard, IBM, Intel, Netscape, Novell, Oracle and SAP.
About Red Hat, Inc.
Founded in 1994, Red Hat (Nasdaq:RHAT), is the leading provider of open source Internet infrastructure solutions, delivering on the promise of open source from small embedded devices to the most prodigious enterprise. Red Hat applies its technological leadership to create open source solutions for Internet infrastructure and post-PC environments, offers services backed by the best understanding of open source and the most comprehensive resources, delivers the brand of a widely trusted open source leader and corporate partner, and persists in an indelible commitment to the virtues of open source to lead a revolution in the computing industry.
Red Hat is based in Research Triangle Park, N.C. and has offices worldwide. Visit Red Hat on the Web at www.redhat.com. For investor inquiries, contact Lippert/Heilshorn at (212) 838-3777.
Forward-looking statements
Forward-looking statements in this press release are made pursuant to the safe harbor provisions of Section 21E of the Securities Exchange Act of 1934. Investors are cautioned that statements in this press release that are not strictly historical statements, including, without limitation, management's plans and objectives for future operations and management's assessment of market factors, constitute forward-looking statements which involve risks and uncertainties. These risks and uncertainties include, without limitation, product plans and performance, the ability to continue to develop the Linux kernel and other software, reliance upon strategic relationships, Red Hat's dependence upon an open source business model, reliance upon independent third-party Linux developers, management of growth, expansion of Red Hat's business focus and operations, the possibility of undetected software errors, the enforceability of the GNU General Public License and other licenses under which Red Hat's products are developed and licensed, the scarcity of Linux-based applications, the risks of economic downturns generally, and in Red Hat's industry specifically, the risks associated with competition and competitive pricing pressures, the viability of the Internet, and other risks detailed in Red Hat's filings with the Securities and Exchange Commission, copies of which may be accessed through the SEC's Web site at http://www.sec.gov.
LINUX is a trademark of Linus Torvalds. RED HAT is a registered trademark of Red Hat, Inc. All other names and trademarks are the property of their respective owners.

Volver al índice


Computer artist doodles oodles of 'Google's

More than 150 million Web surfers around the globe celebrated Korean Independence Day Aug. 15, 2001. Well, at least for a few moments while they were visiting the popular Internet search engine Google. That day, the Korean national flag and several roses of Sharon, the Korean national flower, adorned the familiar "Google" logo on the homepage of the Web site.


Dennis Hwang: Logo designer for Google
Just another day's work for Dennis Hwang (Hwang Jung-moak), a 23-year-old Korean computer artist in the United States, who has been drawing the face of Google for almost two years, creating a buzz of sorts with his simple yet witty designs.
With its seemingly magical ability to produce the most relevant search results, Google is already an established destination for the Internet savvy. Recently, Hwang's creative logos have been expressing the playful heart of Google behind the impressive technology.
For Piet Mondrian's birthday, Hwang transformed the "Google" logo to emulate the artist's signature style of utilizing colorful blocks. Claude Monet's birthday saw the logo turned into a dreamy watercolor, complete with floating lily pads.
Hwang recently spoke with The Korea Herald to give his take on the artistic side of the popular Internet search engine.
The Korea Herald: How long did you live in Korea as a child? What was it like?
Dennis Hwang: I was born in Knoxville, Tenn., but moved to Korea when I was about five years old. My hometown was Gwacheon where I had a very normal childhood. I went through public schools like everyone else, spending six years at Gwacheon Elementary School and two years at Munwon Middle School. Actually, much of my ideas and style stem from the time I spent during my childhood in Korea. Whatever challenges the logos bring, I can often rely on the little doodles that I used to do in school when I was young. Something that used to be frowned upon turned out to be my greatest asset.
Herald: When did you move back to the United States?
Hwang: I came back in 1992 when my father received a Fulbright Scholarship to research in the United States.
Herald: What was it like going to an American school all of a sudden?
Hwang: I was placed in a public middle school but was completely unprepared for it. I didn't speak a word of English. For the first six months, I couldn't communicate with the teachers or students. With the help of ESL programs though, I got better. My father returned to Korea, but my brother and I decided to continue our education in the States. My parents have made unimaginable sacrifices for us over the last 10 years, and I wouldn't be this successful without their support.
Herald: What was the first logo you designed for Google?
Hwang: Google had been using outside contractors to do the earlier logos, so the first project I got was modifying the Fourth of July logo in 2000. The two founders, Larry Page and Sergey Brin, wanted something more fun, so I redrew parts of the image. The next logo was for Bastille Day, which is the first logo I did from scratch.
Herald: Which letters are your favorite targets for manipulation?
Hwang: Understandably, the "O" and the "L" are the easiest to deal with. The "O" has become a Halloween pumpkin, a Nobel Prize medal, the Korean flag symbol and the planet earth. The "L" has been used as a flagpole, the Olympic flame cauldron or a snow ski. The first "G" is the most difficult to deal with, and I don't think the "E" has gotten much action because of its location.
Herald: How did you come to do the Korean Independence Day logo?
Hwang: Google makes a big effort to recognize holidays that aren't necessarily mainstream. The Korean Independence Day logo was seen globally by tens of millions of people. Numerous Korean-Americans wrote to thank us on Aug. 15 last year. Many expressed how proud it made them to see the Korean flag.
Herald: Do you have plans for other Korea-related logos in the future?
Hwang: I'll definitely to a special logo for Korea hosting the World Cup.
Herald: You're only 23 years old. What are your future plans?
Hwang: Who knows? It's very important to me that I can work both technically and artistically. Google is a perfect place to do that. It allows me to have a programming job while letting me express myself artistically, with the added bonus of having my work be seen by tens of millions of people in a single day.
Herald: What is your favorite letter among the ones found in the word "Google?"
Hwang: I've stared at the logo for so long and so often. I love them all equally.
(kimjin@koreaherald.co.kr)


Volver al índice

Curiosidades sobre Google
- El día 1 de abril de 2002 (April Fool's day), Google dio a conocer el PigeonRank (TM), el sistema que realmente clasifica las webs: miles de palomas trabajan ordenando todas los sitios web de Internet.
- En Pascua de 2001, aparecio un curioso juego (realizado en un applet de Java) sobre un conejito que recogía huevos de Pascua.
- En el Zeitgeist de Google vas a poder encontrar un montón de estadísticas: las palabras más buscadas de la semana en diferentes idiomas, los navegadores más utilizados, ... Además, tiene un archivo histórico.
- Google tiene varias ofertas de trabajo: técnicos en software o sistemas, ventas, marketing, finanzas, ... Además de entrar en una gran empresa tecnológica, un seguro médico, y un seleccionado menú para comer, te ofrecen alguna que otra fiesta como esta.
- La gente de Google tiene registrados las decenas de errores que los usuarios han cometido al intentar buscar uno de los nombres más buscados: el de Britney Spears.
- Google tiene registrados algunos dominios que se parecen al verdadero, los cuales difieren en alguna letra, y que -debido a que muchos usuarios escriben mal 'google'- llevan al sitio web correcto: gogle.com, googel.com, ggoogle.com o gogole.com.
- Incluso tiene registrado el dominio 466453.com (prueba a escribir 'google' en tu teléfono móvil). Google tiene varios servicios wireless en desarrollo.
- Otro April Fool's Day, pero de 2000, Google lanzó el sistema de búsqueda MentalPlex (TM), que era capaz de leer tu mente, y encontrar los resultados a la búsqueda que estabas pensando.
- Google organizó en 2002 un concurso de programación, que ofrecía diez mil dólares y una visita a la sede central de la compañía.
- Existe un curioso 'mirror' (servidor 'espejo') de Google: elgooG.
- El Googlewhacking es un 'deporte' que consiste en encontrar una pareja de palabras (que estén incluidas dentro del diccionario de inglés) que aparezcan una sola vez juntas en alguna página indexada por Google. Es decir, que buscándolas, obtengamos 'Resultados 1 - 1'.
- El comportamiento de Google durante los atentados en USA el 11 de septiembre de 2001 fue elogiado por muchos. Realizó 'cachés' de varios medios de comunicación (que en aquel momento estaban colapsados), y condujo muchas de sus búsquedas hacia noticias de actualidad.
- Tras la adquisición del archivo de noticias de Usenet que tenía la empresa Deja News, Google publicó una lista con los 'posts' referentes a los hechos más relevantes de la historia de Internet durante estos últimos años. Hay referencias a acontecimientos como las primeras menciones a Google o Yahoo, el primer post anunciando los ataques a las torres gemelas el 11 de setiembre de 2001, las primeras menciones a Linux o Microsoft, la primera discusión sobre el SIDA, ...
- El algoritmo de 'PageRank' está patentado en Estados Unidos con el número de patente '6,285,999', y con el título 'Method for node ranking in a linked database'.
- Si miramos el 'Acerca de...' de la 'Google Toolbar', vemos que -además de la versión- aparece la frase en latín 'De parvis grandis acervus erit', que podría traducirse como 'De las cosas pequeñas se hacen las cosas más grandes'. Esta frase fue utilizada en el siglo XVI en un libro de poemas.
- Para que nadie piense mal, las páginas de la tienda de Google (Google Store) tienen PageRank cero.
- Chad Lester, un trabajador de Google, recorrió en bicicleta en el año 2001 las más de 3500 millas que separan California de Florida. Répiclas del jersey que llevaba se vendieron en la GoogleStore.
Volver al índice


The technology behind Google's great results
As a Google user, you're familiar with the speed and accuracy of a Google search. How exactly does Google manage to find the right results for every query as quickly as it does? The heart of Google's search technology is PigeonRank™, a system for ranking web pages developed by Google founders Larry Page and Sergey Brin at Stanford University.

Building upon the breakthrough work of B. F. Skinner, Page and Brin reasoned that low cost pigeon clusters (PCs) could be used to compute the relative value of web pages faster than human editors or machine-based algorithms. And while Google has dozens of engineers working to improve every aspect of our service on a daily basis, PigeonRank continues to provide the basis for all of our web search tools.
Why Google's patented PigeonRank™ works so well
PigeonRank's success relies primarily on the superior trainability of the domestic pigeon (Columba livia) and its unique capacity to recognize objects regardless of spatial orientation. The common gray pigeon can easily distinguish among items displaying only the minutest differences, an ability that enables it to select relevant web sites from among thousands of similar pages.
By collecting flocks of pigeons in dense clusters, Google is able to process search queries at speeds superior to traditional search engines, which typically rely on birds of prey, brooding hens or slow-moving waterfowl to do their relevance rankings.
When a search query is submitted to Google, it is routed to a data coop where monitors flash result pages at blazing speeds. When a relevant result is observed by one of the pigeons in the cluster, it strikes a rubber-coated steel bar with its beak, which assigns the page a PigeonRank value of one. For each peck, the PigeonRank increases. Those pages receiving the most pecks, are returned at the top of the user's results page with the other results displayed in pecking order.
Integrity
Google's pigeon-driven methods make tampering with our results extremely difficult. While some unscrupulous websites have tried to boost their ranking by including images on their pages of bread crumbs, bird seed and parrots posing seductively in resplendent plumage, Google's PigeonRank technology cannot be deceived by these techniques. A Google search is an easy, honest and objective way to find high-quality websites with information relevant to your search.


Data


PigeonRank Frequently Asked Questions
How was PigeonRank developed?
The ease of training pigeons was documented early in the annals of science and fully explored by noted psychologist B.F. Skinner, who demonstrated that with only minor incentives, pigeons could be trained to execute complex tasks such as playing ping pong, piloting bombs or revising the Abatements, Credits and Refunds section of the national tax code.
Brin and Page were the first to recognize that this adaptability could be harnessed through massively parallel pecking to solve complex problems, such as ordering large datasets or ordering pizza for large groups of engineers. Page and Brin experimented with numerous avian motivators before settling on a combination of linseed and flax (lin/ax) that not only offered superior performance, but could be gathered at no cost from nearby open space preserves. This open space lin/ax powers Google's operations to this day, and a visit to the data coop reveals pigeons happily pecking away at lin/ax kernels and seeds.
What are the challenges of operating so many pigeon clusters (PCs)?
Pigeons naturally operate in dense populations, as anyone holding a pack of peanuts in an urban plaza is aware. This compactability enables Google to pack enormous numbers of processors into small spaces, with rack after rack stacked up in our data coops. While this is optimal from the standpoint of space conservation and pigeon contentment, it does create issues during molting season, when large fans must be brought in to blow feathers out of the data coop. Removal of other pigeon byproducts was a greater challenge, until Page and Brin developed groundbreaking technology for converting poop to pixels, the tiny dots that make up a monitor's display. The clean white background of Google's home page is powered by this renewable process.
Aren't pigeons really stupid? How do they do this?
While no pigeon has actually been confirmed for a seat on the Supreme Court, pigeons are surprisingly adept at making instant judgments when confronted with difficult choices. This makes them suitable for any job requiring accurate and authoritative decision-making under pressure. Among the positions in which pigeons have served capably are replacement air traffic controllers, butterfly ballot counters and pro football referees during the "no-instant replay" years.


Where does Google get its pigeons? Some special breeding lab?
Google uses only low-cost, off-the-street pigeons for its clusters. Gathered from city parks and plazas by Google's pack of more than 50 Phds (Pigeon-harvesting dogs), the pigeons are given a quick orientation on web site relevance and assigned to an appropriate data coop.
Isn't it cruel to keep pigeons penned up in tiny data coops?
Google exceeds all international standards for the ethical treatment of its pigeon personnel. Not only are they given free range of the coop and its window ledges, special break rooms have been set up for their convenience. These rooms are stocked with an assortment of delectable seeds and grains and feature the finest in European statuary for roosting.
What's the future of pigeon computing?
Google continues to explore new applications for PigeonRank and affiliated technologies. One of the most promising projects in development involves harnessing millions of pigeons worldwide to work on complex scientific challenges.


This distraction crossed my desk, so I coined a richly meaningful name: Googlewhacking.

Your goal: find that elusive query (two words - no quote marks) with a single, solitary result!

You're welcome to see where the Googlewhack craze began... and how to whack yourself.

Or, follow new Googlewhacks (and often spicy political commentary) in The Whack Stack, always current!


2002-02-05 Enron ran a real runaround.

The search for 'The One' may also describe activities at Enron - find "The One" person to blame for many misdeeds! (Hmmm... would the scapegoat get an Enronwhack, or be an Enronwhack? :-)

Googlewhacking is about having fun with words and search, so political commentary can't be far behind! Here are a few recent pure whacks (exactly one result) along with our signature obvious question to enhance the pleasure. Thanks to every hack, who contributed a whack, so we could find the obvious FAQ. Enjoy!

Hack Whack FAQ
Steven Bliss ambidextrous scallywags What do you call Enron corporate officers who contributed money to Senators on both the left and the right?
Autumn Tyr-Salvia illuminatus ombudsman Who can you complain to about the worldwide coverup of the Enron conspiracy?
Joe Nilles squirreling dervishes How did an SEC spokesman privately describe Enron executives who had busily packed away their ill-gotten gains?
Aaron Kimball assonant octosyllable Enron ran a real runaround.
Enron ran a real raw end run.
No renowned nun ran near Enron.
...well, you get the picture.
Matthew Kerste fetishized armadillo What hangs over the mantle of the gold-plated fireplace at Enron's corporate retreat in Texas?
Doug Gray panfish interrogation What Congressional Task Force will, as one Senator put it, "scale, gut, and filet" Enron accountants during their formal testimony?
Karl Windle disenthralled nimrod How did Enron's press office describe an investment advisor who changed his recommendation from "Buy' to 'Sell'?
Emma Robertson anxiousness scheduler What special job title was reserved for the secretaries of Enron's corporate finance officers?
Manik Gupta bamboozle guzzler What was the most popular mixed drink at Enron's corporate Christmas parties?
John Birq megalomaniacal
dipsomaniac After the party, how did the club bartenders describe Enron's top corporate officials?
Jeff Custer inculcating skullduggery What priority item led every agenda at Enron's Board meetings?
Chaim Schuss parochial noctambulist What 'previous occupation' should Enron's financial officers list on their next job application?
Richard Milne insolvent pachyderms Among all the negative fallout from the Enron scandal, what single thing does the Texas Republican Party fear most?
Roy Whiddon demurrable insufficiencies "Plausible denial" hints of espionage, so what other term will Enron officials use to downplay creative accounting during their criminal trials?
Jon del Castillo unmerciless politician How does Enron describe public officials who've asked that Enron employees be reimbursed for lost investments?
Craig Tucker despotism fluidics What science describes Enron exerting pressure across a huge, immoral brotherhood to produce desired effects with no obvious cause?
Glenn Hall antiestablishmentarianism
psycho Among the many unpleasant names Enron pensioners may call an Enron executive, which epithet contains the longest word?
Doc Disk flibbertigibbet boogers Among the many unpleasant names Enron pensioners may call an Enron executive, which epithet is the most kind?

Site, Contents, Whacks, the Whole Shebang Copyright © 2001-2003 Gary Stock | Commercial use prohibited.
May be excerpted, mailed, posted, or linked only for non-commercial purposes.

Neither this site nor its contents are affiliated with the popular search engine Google - but 'Googlewhacking' sure is fun to say!
Volver al índice


Googlebot
Googlebot es el robot que utiliza Google para 'rastrear' los sitios de Internet. No solamente indexa páginas web (HTML), sino que también extrae información de ficheros PDF, PS, XLS, DOC y algunos otros más.
La frecuencia con la que Googlebot accede a un sitio web depende del PageRank de éste. Contra mayor sea este valor, el robot accederá más asiduamente a sus páginas.
Por ejemplo, podemos comprobar que los sitios con PR10 (el valor más alto), como yahoo.com o usatoday.com, han sido 'rastreados' por Googlebot ayer o incluso o hoy mismo, mientras que otros han sido accedidos hace varias semanas. Esto se puede comprobar accediendo al 'cache' de esta página.
Para comprobar si Googlebot ha accedido a nuestro sitio web, deberemos echar un vistazo a los logs de nuestro servidor. En ellos, deberemos observar si hay registros de accesos en los que aparezca 'googlebot'. Generalmente aparecerá el nombre del servidor, el cual podrá ser alguno de estos:
SERVIDOR DIRECCION IP
crawl1.googlebot.com 216.239.46.20
crawl2.googlebot.com 216.239.46.39
crawl3.googlebot.com 216.239.46.61
crawl4.googlebot.com 216.239.46.82
... ...
crawl9.googlebot.com 216.239.46.234
crawler1.googlebot.com 64.68.86.9
crawler2.googlebot.com 64.68.86.55
... ...
crawler14.googlebot.com 64.68.82.138
Googlebot intentará acceder, como hacen la mayoría de los robots de los motores de búsqueda, al fichero 'robots.txt'. En este archivo se deberán indicar las zonas de nuestro sitio web donde no queremos que entre ni Googlebot ni el resto de los buscadores. Para conocer más sobre 'robots.txt', existe un magnígico recurso: www.robotstxt.org.
Una vez que Googlebot haya 'rastreado' nuestra página, seguirá los enlaces que en ella encuentre (los HREF y los SRC).
Por lo tanto, si quieres que Googlebot indexe tu página web, solamente es necesario que algún otro sitio tenga un hiperenlace al tuyo. Si no es así, siempre puedes añadir directamente tu URL.
Además de este robot GoogleBot, existe otro, llamado FreshBot que 'rastrea' con mayor frecuencia los sitios webs con las noticias 'más frescas'.
Volver al índice


FreshBot
Aparte del robot GoogleBot (el que recorre apróximadamente cada mes las webs indexadas en Google), existe otro robot, llamado FreshBot.
Este último fue creado para solventar el problema que tenían muchos usuarios que, al buscar por temas de actualidad, veían que no había ninguna página web que hiciera referencia a ese suceso que había ocurrido hacía unas horas.
Esto se debía a que, si la noticia ocurría hoy mismo y un sitio web hacía referencia a ella, GoogleBot no iba a 'rastrearlo' hasta después de unas semanas, por lo que los resultados no estarían disponibles hasta esa fecha.
De esta manera, los ingenieros de Google decidieron crear un robot que 'rastrease' con más frecuencua los sitios web que consideraban que tenían las noticias 'más frescas'.
Así, sitios web como los de las mayores cadenas de noticias del mundo (CNN, Reuters, BBC), o páginas que Google considera que actualizan frecuentemente sus contenidos, son 'rastreados' por Freshbot cada cierto tiempo.
La frecuencia de Freshbot es variable, aunque generalmente suele realizar su 'rastreo' diariamente. Por ejemplo, se puede comprobar visitando la caché de los sitios web de CNN o del diario 'El Mundo', que este robot ha pasado hace uno o dos días.
Volver al índice


13. AdwordsTM. Publicidad en Google
Google no admite banners ni pop-ups en su web, pero sí inserta publicidad, en forma de 'AdwordsTM', también conocidos como 'enlaces patrocinados' o 'sponsored links'.
AdwordsTM utiliza el sistema de Coste Por Clic (CPC). Con este método, el anunciante solamente paga cuando un cliente haga click en el anuncio, independientemente del número de veces que éste aparezca en la web de Google.
Los anuncios de AdwordsTM se muestran junto a los resultados de las búsquedas de Google (a la derecha o bien arriba), y solamente aparecen para determinadas palabras que el anunciante elige. No se admiten imágenes en los anuncios, y éstos deben ocupar 4 líneas (25 caracteres en el título, 70 en el texto y 35 en la URL).

El anunciante también especifica el importe máximo que está dispuesto a pagar por cada click de una determinada palabra, ya que no todas las palabras tienen el mismo precio.
Google proporciona, además, una cuenta personal para que el anunciante haga un seguimiento de su campaña publicitaria, y pueda controlar y gestionar los gastos. Se puede crear una campaña de Adwords en Google desde 5 euros.
Existe más información en la web de Google Adwords.
Volver al índice


AdSenseTM. Ganar dinero con Google
:: ¿Qué es Adsense?: AdSense es un servicio de Google por el cual el webmaster de un sitio web inserta anuncios basados en texto, llamados AdWords, y recibe una cantidad de dinero por cada 'click' que el visitante haga sobre el anuncio.
:: ¿Cómo funciona Adsense?: El funcionamiento es muy simple. El webmaster inserta un código JavaScript, que llama a un servidor de Google. Este servidor analiza la página donde se inserta el código y, en función de los contenidos de ésta, genera un código que muestra una serie de anuncios de empresas que tienen relación con el tema de dicha página.
De esta manera, se consigue que el 'clickthrough rate' (el porcentaje de visitantes que pulsan el enlace) sea más elevado, ya que los lectores están más interesados por el tema. Así, los beneficios para el webmaster son mayores.
Además, los formatos de los anuncios son muy personalizables, tanto en colores como en tamaño. Incluso puedes evitar que anuncios de sitios web de tu competencia aparezcan anunciados en esta publicidad.
:: ¿Qué necesito para participar en el servicio Adsense?: Solamente necesitas ser el Administrador de un sitio web, y hacer una petición al equipo de Google. Eso sí, Google tiene unas normas muy claras con la calidad de los sitios web, y no permite insertar AdSense en páginas que posean 'pop-ups' o dialers, por ejemplo.
Una vez que tu sitio web ha sido aceptado, puedes empezar a insertar la publicidad en unos minutos. Sin embargo, puede ocurrir que los anuncios no sean visibles durante algunas horas, ya que el servidor de publicidad de Google tienen que rastrear tu sitio web.
:: ¿Cuánto dinero voy a ganar?: Google no asegura ninguna cantidad de dinero por cada 'click', varía en función de cada anunciante, y es Google la que decide esta cantidad. Sin embargo, en cada momento puedes ver cuánto dinero vas ganando.
Google envía un cheque a tu domicilio al final de cada mes, siempre que hayas ganado más de 100 dólares. De todas maneras, al final de cada año te envía un cheque sea cual sea la cantidad de dinero que te corresponda.
:: ¿Se puede insertar AdSense en páginas en español?: Por ahora, solamente podrían participar sitios web en inglés, aunque si se encuentran en francés, alemán, italiano o español también hay posibilidades de ser aceptado.

Volver al índice


Barra 'Google Toolbar'
La barra 'Google Toolbar' es una herramienta que se añade al navegador de Internet, para agilizar y facilitar las búsquedas a través de Google.

Se trata de una 'barrita' que se sitúa en la parte superior del navegador, y que dispone -entre otras cosas- de un recuadro para teclear la/s palabra/s de búsquedas, de un indicador del PageRank de la página web que estemos visitando, o de un 'resaltador' de las palabras que estamos buscando en una determinada página. De todas maneras, se pueden personalizar muchas de las opciones.
A su vez, las últimas versiones son capaces de bloquear los indeseables 'pop-ups' (ventanas emergentes, generalmente con publicidad) y resgringir las búsquedas a un país en concreto.
Hasta la fecha, solamente está disponible para el Sistema Operativo Microsoft Windows, y para el navegador Internet Explorer (versión 5.0 o superior).
La instalación es muy sencilla. Solamente se requiere ejecutar este pequeño programa (versión en español, .exe 440 kbytes).
Usuarios de Macintosh: Pueden utilizar el recuadro de búsqueda en Google que incluye el navegador Safari, aunque no disponga de la mayoría de las características de la 'Google Toolbar'. De todas maneras, existe una petición para que se incluya una barra completa para este Sistema Operativo.
Usuarios de Mozilla: Disponen de varias posibilidades (aunque ninguna de ellas se trata de la auténtica 'Google Toolbar'):
1.- Instalando una 'sidebar' (tal y como recomienda Google)
2.- Utilizando el recuadro de las URLs (se debe configurar en 'Editar -> Preferencias -> Navegador -> Búsquedas en Internet')
3.- Mediante la herramienta del proyecto 'Googlebar'.
4.- Instalando la aplicación http://nexgenmedia.net/google.xpi (es la más parecido a la 'Google Toolbar').
Existe mucha más información (problemas técnicos y consejos) en el espacio que Google ha dispuesto sobre preguntas frecuentes.
Volver al índice


GoogleSyndication
Tras la compra de Blogger por parte de Google, éste últimó comenzó lanzó su programa 'Content-Targeted AdWords' ('Publicidad segmentada por contenido', en español).
De esta manera, Google insertaría sus anuncios AdWords en los weblogs hospedados en Blogger. Existen miles de ellos, y los puedes distinguir porque tiene el dominio '*.blogspot.com'.
A finales de febrero de 2003, muchos de los usuarios de Blogger (como Michael) detectaron que se añadía unas líneas de script (código) en las páginas HTML de sus weblogs:

Analizando el código de
http://pagead.googlesyndication.com/ca/show_ads.js se puede observar que desde las páginas de blogspot.com se llama al servidor (creado por Google) pagead.googlesyndication.com.
Este servidor devuelve un código que genera una especie de banner -pero con anuncios de texto- como este (hemos insertado en esta página el script):
En función del sitio web donde se alberguen los AdWords, Google muestra un determinado tipo de publicidad u otra, ya que los visitantes estarán interesados en diferentes temas. De esta manera, segmentando la publicidad, Google pretende hacer ésta más efectiva.
Por ejemplo, en el weblog mediaTIC (dedicada a contarnos asuntos relacionados con la tecnología) aparecen AdWords de material electrónico. Podéis verlo en este enlace
Si os fijais en la URL del enlace, vais cambiando el último valor, y sustituis 'mediatic.blogspot.com' por otro weblog albergado en Blogger, veréis que -en función del tema del weblog- aparecerán una publicidad u otra. Ejemplos:
- deportes.blogspot.com (Material deportivo)
- seginfo.blogspot.com (Material de seguridad informática)
Y no solamente con sitios web de Blogger (*.blogspot.com), que serían los que a priori mostrarían la publicidad. Puedes insertar el nombre de tu web, para comprobar qué tipo de publicidad insertaría Google en su caso.
URL de tu web:
Tipo de 'banner':
Por defecto, si no se encuentran resultados, se remite a publicidad de organizaciones humanitarias (Cruz Roja, Caridad, Asociaciones contra el Cáncer, ...).
Además, si introduces una palabra, te devolverá los AdWords que Google muestra en sus resultados de búsqueda clásicos.
Volver al índice


¿Qué es la 'Google Dance'?
Una vez al mes (aproximadamente) Google recalcula el PageRank de cada página web y, por lo tanto, modifica los resultados de las búsquedas.
La 'Google Dance' es el periodo que transcurre entre el comienzo y el fin de esta actualización. Suele tardar unos 4 días, y durante ese tiempo se obtienen diferentes resultados en cada uno de los servidores de Google: www.google.com, www2.google.com, www3.google.com y www-fi.google.com.
El mejor momento para colocar páginas en un sitio web es durante la 'Google Dance'. Si se deja mucho tiempo entre el fin de esta actualización y la publicación de nuevos contenidos, se reduce la cantidad de páginas que serán incluidas en la próxima actualización.
Este acontecimiento suele ocurrir una vez al mes apróximadamente. Aquí tenéis una tabla con las fechas. Para ir observando durante esos días cómo va a variar la posición de vuestras páginas, disponéis además de esta útil herramienta.
Volver al índice


Fechas de la 'Google Dance'
Estas son las fechas de las últimas 'Google Dance'. La hora es la de la costa Oeste de Estados Unidos, donde está situado Google Inc.
MES DIA HORA
febrero 2003 jueves 6 (marzo) 7:40 AM
enero 2003 sábado 25 8:45 PM
diciembre 2002 miércoles 1 (enero) 6:46 AM
noviembre 2002 jueves 28 9:09 AM
octubre 2002 jueves 31 2:03 AM
septiembre 2002 jueves 26 4:30 AM
agosto 2002 miércoles 21 2:20 AM
julio 2002 jueves 25 10:35 PM
junio 2002 domingo 23 1:00 PM
mayo 2002 viernes 24 5:30 AM
abril 2002 jueves 25 7:52 PM
abril 2002 sábado 6 3:36 AM
febrero 2002 miércoles 20 2:39 PM
enero 2002 viernes 25 10:34 AM

Volver al índice


Herramienta 'Google Dance'
Durante el tiempo que dura la 'Google Dance' (mientras se actualiza el PageRank de cada página indexada por Google), se obtienen diferentes resultados en los servidores www.google.com, www2.google.com, www3.google.com y www-fi.google.com
Con esta herramienta, podremos saber cuál es el comportamiento del 'Google Dance' (dura unos 4 días), y cuál será la próxima posición las páginas después de esta actualización.
Introduce la/s palabra/s de las cuales quieres saber los resultados:
Palabra/s:
Número de resultados por página:
Forma de mostrar los resultados:




DICCIIONARIO
http://google.dirson.com/cgi-bin/diccionario.pl

Volver al índice

TouchGraph
Con esta herramienta, serás capaz de ver gráficamente los enlaces de los que una determinada página dispone, y que son tenidos en cuenta por Google. Son los mismos resultados que se obtienen si buscamos en Google:
link:http://www.undominio.com/unapagina.html
pero mostrados gráficamente, y con muchas más opciones.

[Ampliar imagen para enlaces a 'hp.com']
Introduce la URL de la página que quieres analizar:
URL (sin 'http'):
NOTAS:
- Este programa requiere Java JRE 1.3 o superior.
- www.touchgraph.com
- Instrucciones (en inglés)
Volver al índice


GoogleStats
GoogleStats es una aplicación libre (Código Abierto) realizada en PHP que analiza las visitas que realiza el GoogleBot (y otros robots) a tu sitio web. La idea es muy simple: solamente tienes que incluir un pequeño script PHP en tus páginas (puedes elegir cuáles de ellas quieres que sean analizadas). Cuando el GoogleBot (o cualquier otro robot) rastree una página, su visita es almacenada en una base de datos MySQL.
La segunda parte de la aplicación muestra las estadísticas de un periodo dado de tiempo. Puedes usar un calendario para seleccionar el día, semana o, incluso, el mes que quieras. Hay tres tipos de análisis:
Resultados:
- Número de visitas de cada robot
- Número de páginas diferentes visitadas por cada robot
- Promedio de visitas por día
- Listado con todos los robots detectados durante un periodo concreto
- Listado de todas las direcciones IP de cada robot detectado
Páginas:
- Listado con todas las páginas visitadas por cada robot dentro del periodo analizado, con URL, fecha, número de visitas, dirección IP y DNS. Puedes ordenas estas columnas pulsando en la cabecera de cada columna.
Gráfico:
- Muestra en un diagrama de barras las estadísticas de las visitas del robot seleccionado.

Más información, instrucciones y descargas (existe versión en español): GoogleStats.com
Volver al índice




Google API
- ¿Qué son unas APIs? : API son las siglas en inglés de Application Programming Interface. En otras palabras, son los métodos que el desarrollador de cualquier aplicación ofrece a otros desarrolladores para que puedan interactuar con su aplicación.
- ¿Qué son las APIs de Google? : Son los métodos que Google ofrece a los desarrolladores para que puedan hacer peticiones a Google desde sus propias aplicaciones.
- ¿Con qué lenguajes de programación puedo usar las APIs de Google? : Los desarrolladores pueden hacer peticiones a Google mediante el uso de Java, Perl o Visual Studio .NET.
- ¿Qué aplicaciones puedo hacer con las APIs de Google? : Se pueden desarrollar tanto aplicaciones en entorno web como dentro de un programa clásico. Por ejemplo, puedes incluir los resultados de Google dentro de tu sitio web o tratar estos resultados.
- ¿Cómo funcionan las APIs de Google? : Las aplicaciones que escriben los desarrolladores se conectan remotamente con el servicio Web API de Google. Esta comunicación se realiza mediante un protocolo llamado SOAP (Simple Object Access Protocol). Está basado en XML, y se usa para el intercambio de información entre aplicaciones. Sin embargo, no es necesario tener conocimientos ni de SOAP ni de XML para trabajar con las APIs de Google.
- ¿Qué necesito para poder desarrollar mis propias aplicaciones? :
::[1]:: Una plataforma de desarrollo que soporte Servicios Web. Puede que necesites instalar algo más (aparte del entorno de tu lenguaje). Echa un vistazo a: Java Web Services, Perl Soap::Lite, o el documento 'SOAP en Microsoft .NET Framework y Visual Studio.NET'.
::[2]:: Descargarte el 'kit' para desarrolladores que proporciona Google. Incluye algunos ejemplos en varios lenguajes de cómo hacer peticiones a Google, y el fichero WSDL que vas a necesitar. Este fichero describe en lenguaje XML los Servicios Web de Google.
::[3]:: Crear completamente gratis una clave para las Google APIs. Google solamente deja hacer 1000 peticiones por día a este servicio. Por ello, es necesario que tengas una clave que deberás insertar en el código de tus aplicaciones.


Volver al índice




The apparent terrorist attacks of September 11, 2001 changed the skyscape of New York City, and the political and emotional landscape of the United States. The attack may have also changed how the leading search engine, Google, thinks of itself. This article examines how people used the Internet in general, and Google in particular, to seek and to deliver desperately wanted information about the lives lost and damage inflicted by the attacks.
Contents
Introduction
What Users Expected from Google
Google on September 11: To Browse, or To Search?
Google Evolves After the Disaster
Ultimately, Google Acts Like a Portal
Google Use in Context
Google Responds
Where Does Google Go from Here?
Footnote: A Sadly Ironic Death

Introduction
The September 11 attacks on the United States caused millions of people to urgently seek information about what had happened, who had been killed, what damage had been inflicted, and what new developments were taking place. The public at large wanted to learn all they could about attacks on their homeland. A smaller group -- those who had friends, family, or colleagues who might have been in the World Trade Center, at the Pentagon, or in one of the hijacked airliners -- sought information with even greater urgency.
Google home page the morning of the attack.
Click on thumbnail to see full-size image.
When breaking news occurs, different people flock to different news sources. Many find a television and tune to CNN (or one of its growing rivals). Some turn to National Public Radio. Some open a Web browser and point it at a trusted newspaper site, such as nytimes.com or washingtonpost.com -- or the online version of a media outlet, such as cnn.com or msnbc.com.
Still others head to their favorite Web portal. Many will point browsers at Yahoo or AltaVista or Lycos or Excite. Most of these portals began their existence as robotic Web indexers. In the early days, these "search engines" in the classic sense of the term were poor places to find news of breaking events. Their crawling and indexing processes paid no special attention to news sources, and they had no mechanism to turn the spider's attention to relevant news sources. The day Princess Diana died, I spent several hours searching the then-popular search engines to see which one would first report her death. (The "winner" was Infoseek.)
Since that time, every popular search engine morphed into a portal. Human-edited content filled the screen. News links, product links, advertisements, and every manner of special service, from translation to image searches, cluttered each new portal's page. But the overwhelming dominance of human-edited Yahoo, and the inability of the search engines to effectively deliver instantaneous access to breaking news, fueled the transformation from pure engine to portal.
One search engine, relative newcomer Google, has resisted the temptation to become an all-encompassing, one-stop-shopping, complex portal. Before the September 11 attacks, Google only offered the sparest of home pages -- a simple logo, a single search box, and a handful of links to Google's own services. Not even a single banner ad appears on the Google home page. Google resisted the temptation to become yet another search engine-turned-portal. The only event-related content one ever noticed on Google was its amusing and tastefully crafted subtle changes to its logo, in order to honor holidays. (See http://www.google.com/holidaylogos.html.) Prior to September 11, Google devoted itself to a vision of "search is king." The user is tempted to do one thing: type a search phrase into the single form on screen, and hit Search. And the evidence is that millions of users did just that, beginning just moments after the attacks.

What Users Expected from Google
Google offers a window into what people are looking for week-by-week at http://www.google.com/press/zeitgeist.html. After the September 11 tragedy, Google offered a special page detailing changes in search patterns; see http://www.google.com/press/zeitgeist/9-11-search.html. The evolving patterns are fascinating. Note, for instance, Google's report of the top 10 search terms related to the tragedy used in searches the week after the tragedy:
Top 10 Google Queries Related to Terrorist Attacks - 9/11/01
1. cnn 2. world trade center 3. bbc 4. pentagon 5. msnbc 6. osama bin laden 7. nostradamus 8. american airlines 9. fbi 10. barbara olsonOverall, Google reports that on September 11 searching for news-related content increased by a factor of 60. For the most part, the entries are not surprising. One can imagine what various users sought:
" world trade center: People wanted to know more about the trade center complex: its size, location, height, architectural history, structural makeup, surroundings, occupants, etc.
" pentagon: People sought the same kind of information about the Pentagon, as well as perhaps any official U.S. government information about the building or the unfolding disaster.
" osama bin laden: Bin Laden was named a "prime suspect" soon after the hijackers were identified.
" nostradamus: Rumors quickly spread that Nostradamus had predicted the disaster. People no doubt sought his original words and any interpretation as to how they might have applied in this modern event.
" american airlines: Since two of the hijacked flights belonged to American Airlines, people sought information about the airline, and perhaps sought its official Web site (which is not obvious because its domain is "aa.com".)
" fbi: Obviously the Federal Bureau of Investigation plays a key role in the ongoing search for links to the hijackers.
" barbara olson: This notorious conservative commentator was on board American Airlines flight 77, which crashed into the Pentagon; she called her husband, U.S. Solicitor General Theodore Olson, during the hijacking to seek counsel.
The other items in the top 10 are somewhat surprising. Consider, at the top of the list, "cnn". Immediately after the attack, some 6000 users per minute used Google to find CNN. Ever since the Gulf War, millions of Americans turn to CNN instinctively in time of crisis or major breaking news. It is interesting to see that that instinct translates to online quests for breaking news. But why would a user point his or her Web browser at Google.com, and do a search engine lookup, in order to find the Web site of the Cable News Network? Why wouldn't the user simply enter "cnn" or "cnn.com" into the Address field of their Web browser?
In some cases, it's possible that the user did try to go to cnn.com, and, encountering a timeout due to server or link congestion, tried Google to find the "correct" address. It seems more likely that Google is so effective at delivering popular sites at the top of the hit list that users trust Google as the primary locator for highly-popular sites. Many users have Google as their default home page; it is easier and more effective to hit the "Home" button and type the name of the site you are looking for in the Google search box.
Savvy Web surfers might consider someone naive for using a search engine to locate CNN on the Web. But if we count keystrokes and mouse clicks, it may be that this behavior is not so naive after all. Suppose a user tries to type in the URL for CNN into the browser Address field. They may type www.cnn.com or the proper form of http://www.cnn.com. Assuming Google is the user's default home page, the user need only type cnn into the search box, hit Search, and CNN will be the first site on the hit list. Entering in the full address costs 12 to 18 keystrokes and a mouse click. The Google approach costs 3 keystrokes and 2 mouse clicks. This user's application of Google as a finding aid is not only not naive -- it is quite efficient. Indeed, even if the user has CNN bookmarked (and is sitting at the computer the houses his or her bookmarks) t
Volver arriba
Enlaces del Opus Dei