Por fin he terminado de leer The Search. How Google and Its Rivals Rewrote the Rules of Business and Transformed Our Culture de John Battelle.
Os recomiendo su lectura (como Pepe, thanks again, me lo recomendó a mí).
No os perdáis el capítulo que dedica a Bill Gross, los comentarios amargos de Louis Monier y las notas sueltas acerca de WebFountain y Archive.
Animado por la lectura tuve una idea y la idea a su vez de compartirla con Google y con John Battelle.
Battelle ya me ha respondido con un lacónico:
Thanks. I think Google Base is step one in this.
Ahora de nuevo la idea es compartirla con vosotros. Os pongo lo sustancial del correo que les he enviado. Aunque está en inglés creo que se entiende todo.
## Problem statement:
I find the process of building a map of the web really a hard one. The crawler, the index, the algorithms and so forth. It is even harder to put semantics on top of it. Mr. Battelle writes about IBM's WebFountain in his book.
Mr. Battelle even writes about how your mission statement is to organize world's information and the up to some probability fact that everything, including someone's luggage at some point, is to be indexed.
That would make the problem more difficult I guess.
## Hint I take from Mr. John Battelle's book:
The Power of Many.
I don't know if he puts the blogsphere in front of the Power of Many spear to help solving the perfect search problem. Apparently he does so.
From my point of view blogging only makes problems more complex. To search inside the blogosphere is quite a difficult task. Perhaps the best approach to it I know is the one represented by the Technorati Tags.
## The idea (very raw one):
Let Google give the people means to publish content in an already indexed form.
Let us say Google has an editor that allow users to create their documents (and give them a good editing experience and facilities as any other editor does, this is a plus) and easily tag them (and semantically tag them).
This tagging process, knowing the author clickstream already or with better software inference tools, perhaps can be done automatically without the author having to care much.
This process is done in the pc of the author.
The page goes directly (and correctly) into the index, no crawling for it, no more hidden web.
Either this is so (the page is in the index) cause the author already has its contents in Google physical support, or cause the the editor signals Google with author permision on the intents of the page.
Let us say Google offer some benefit to publishers to use this editor. Like social respect for being contributors to a better indexed web, or even some little money, or even money depending on the success (rank) of what is published.
I think it would be a great idea for the benefit of the perfect search project that the problem is tackled just at the begining of the process: publising.
Let Google be your 22nd century web correct publising aid.
In the end I think the solution of the problem passes through something on these lines.
Thanks for the attention given so far.
¿Qué os parece?
(Auguro 0 comments en este post también)



Google puede comenzar a producir una imagen desagradable, como quizá la produce Microsoft. ¿Porqué? Creo que la respuesta es sencilla en este caso: se trata de que Google ha conseguido desarrollar un enorme poder a partir de la utilización de un recurso libre: la información diseminada en la red. Este recurso público adquiere un valor económico extraordinario SÓLO PARA GOOGLE a partir del éxito y la posterior dominancia de su sistema de búsqueda. La red terminará viendo en esto un acto de despojo, la fundamental privatización de un bien público. Ponerse a la cola de este proceso, aunque nos den editores maravillosos y algunas migajas no será del gusto de la aristocracia de la red. De ser cierto lo que digo, más allá de los problemas con la privacidad que pueden excitar ese rechazo, aparecerán fuerzas innovativas dedicadas a sobrepasar el actual Google con artefactos nuevos de análisis de información. Estos movimientos, a condición de su relevancia técnica y funcional, serán fuertemente apoyados por esa aristocracia. En suma: un schumpeteriano proceso de destrucción creativa.
El argumento de Pepe es apenas refutable. Allá dónde alla una gran riqueza acumulada se producirá el fenómeno que Pepe describe.
Sin embargo quiero escribir algunas líneas al respecto.
Es cierto que MS ahora es uno de los malos de la película, aunque no menos cierto es que, con dinero o sin dinero, sigue siendo el rey.
Y es posible (Pepe dice "puede") que Google acabe concentrando las iras de la aristocracia (que en internet poco a poco creo que iremos siendo cada vez más todos).
Sin embargo me da la sensación de que los grandes (Google es el mejor ejemplo pero incluso MS puede acabar dándose cuenta de ello) van a cada vez más pasar parte de ese poder acumulado a los usuarios.
Creo que no les quedará más remedio ya que, el germen de mi idea es ese, técnicamente no les será posible domeñar una web cada vez más grande y compleja.
Lo del editor no es lo relevante. Puede ser un instrumento, como pudiera serlo también una evolución de Google Base como sugiere Battelle.
Lo importante es catalogar la información en origen. En el libro de Search se pone como ejemplo el etiquetado de una maleta para poder ser buscada a través de internet.
Pues bien, si la maleta tiene su etiqueta perfectamente puesta desde el principio declarando a qué búsqueda hace caso, es obvio que cualquier publicación en la red tiene que seguir el mismo proceso.
La forma de acabar con el problema del mapa de la red es estableciendo un sistema de calles y avenidas, unas etiquetas semánticas, algo que encauce la base de datos intencional que representa.
Quizás no sea tarea para Google solamente. Quizás sea bueno crear un consorcio internacional para esto, un estándar libre. Sería la tarea de este consorcio crear la especificación de la semántica que alberga la red. Y su evolución, estas cosas son dinámicas. Algo parecido a las famosas (¿alguien se acuerda de ellas?) ontologías.
Y luego potenciar el uso de estas reglas por parte de todos los ciudadanos de la Web 2.0. Ofreciendo pequeñas sumas a cada contribuyente. Compartiendo así la riqueza que ahora Google ostenta con todo el mundo.
La alternativas son el spam, la red oculta, los malos resultados en las búsquedas, y la descomposición final de la red de redes en microredes gestionadas por expertos en dominios específicos.
Casualmente, en la coctelera he descubierto gracias a infoman una visión parecida a la que Search me ha proporcionado.
Intentaré contarle todo esto al bueno de Enrique Dans a ver que le parece.
Un abrazo...
jima
El dominio de Google terminó con Altavista en menos de 5 meses. De la cima al abismo en menos de un año. Internet cambia muchos paradigmas y nadie es eterno. Quizás Microsoft sea lo más parecido a ello. Sin embargo, el 2006 va a ser un año muy movido.
Los grandes, Google, Yahoo, Amazon, eBay han decidido "no dejar crecer a los enanos" comprándoles antes de que crezcan. El caso Altavista lo tienen todos escrito en el rostro...:-)
Gracias por tu visita, Scifish
Me gusta saber que alguien en la cabeza de Google responde a mensajes de particulares, aunque sea con extrema brevedad.
Yo tengo otra visión sobre el tema planteado.
Puede pensarse que el que un buscador o cualquier otro servicio de Internet tenga éxito o no depende en buena medida de la tecnología que utiliza. Las cosas suelen caer por su propio peso. El oro acaba saliendo a la luz.
Esta creencia está en la mente de mi amigo SciFish, pero también en las de Pepe y Rodolfo.
Yo, por el contrario, creo que el éxito de un buscador o cualquier otro servicio de Internet depende en buena medida de cómo sea recibido por el público, del efecto red y de la masa crítica de usuarios que alcance.
Sería más parecido a las viejas historias del triunfo del VHS sobre Beta y 2000 en vídeo, el porqué del teclado QWERTY o el hecho de que para un territorio dado el líder en telefonía móvil suele mantener su cuota de líder por la sencilla razón de que lo es.
San Mateo decía que "los ricos serán cada vez más ricos y los pobres, cada vez más pobres".
En España sencillamente nos subimos al carro vencedor.
¿Por qué Google es el buscador más utilizado? ¿Tiene mejor tecnología que Altavista?
Yo creo que el "buzz marketing" es la clave. Captar a los usuarios dirigentes. El "two-step-flow-of-communication" de la teoría de las comunicaciones de masas.
El mundo de Internet (y los otros) es de los marketinianos que sepan gestionar eso.
Pero hay que crecer rápido.
Rodolfo tiene razón en eso de que los grandes fagocitan a los pequeños y medianos. Lo cual apuntala mi planteamiento.
Pero siempre se puede crecer brutalmente en poco tiempo y cambiar las reglas del juego. Profetizo que Skype se podrá comer a todas las telefónicas del mundo. Ahí queda eso.
Pero no porque su tecnología sea mejor que otras del mercado, sino porque están haciendo un marketing estupendo.