28 de nov. 2007

el arte de buscar por la red

Hoy estoy inspirada (2 posts en un día!) y voy a hacer una pequeña explicación de como buscar cosas por internet.

Seguro que mas de uno se ha pasado horas y horas buscando cosas por internet, antes cuando apenas los buscadores indexaban una mínima parte de internet la cosa estaba muy chunga, o conocías exactamente dónde encontrar la información o probabas suerte si uno de los múltiples buscadores existentes hasta entonces te ofrecía la respuesta.

Algunos de los que mas usé fueron www.altavista.es, www.yahoo.es, www.terra.es, www.webcrawler.com, astalavista.box.sk (para los cracks), etc. echar una ojeadita a la página que creé hace muchíiiiisimo tiempo -> http://usuarios.lycos.es/nusepas1/buscadores.htm

Pocos años mas tarde, con la fiebre de buscar por internet apareció google, el omnipresente google, con un buen puñado de maquinas de bajo coste y un navegador web en entorno de texto ha conseguido indexar casi o todas las paginas de internet (que se dejan indexar).

Pero ¿la gente usa bien los buscadores? mayoritariamente no les saca el mejor provecho. Si somos hábiles podremos hallar la respuesta incluso en páginas que no estén en nuestro idioma, sólo hace falta tener un poco de imaginación y un traductor de páginas web :)

Voy a centrar mi explicación en google, por ser el mas conocido y creo que el mas usado...

Pero primero de todo, ¿que son los buscadores?
Pues un robot que navega permanentemente por internet (que suerte que no tiene mamá! ni duerme...) con un navegador via texto como podría ser el links, este guarda en un banco de datos todo indexaditas todas las palabras de la pagina web, así cuando el usuario pide una palabra, esta es encontrada rápidamente, cuando mas rápida sea la búsqueda mejor; google gracias a su puñado de ordenadores es capaz de mostrarte miles de páginas en menos de un segundo!

Google trajo la revolución de los buscadores con el uso de los conocidos pageranks, estos sirven para saber la importancia de una pagina web, cuantas mas páginas vinculen a tu página mas pagerank tendrás y si estas páginas que te vinculan tienen un buen pagerank, más rápido va a subir tu pagerank; así que a crear una página web con buenos contenidos y a la que acceda mucha gente!

Una de las cosas que no gusta a los anti-google es que google guarda durante unos días las búsquedas que hacen los usuarios, las páginas las cuales pinchan, etc. con esto google puede saber si una página contiene realmente información interesante y válida (podría llegar a vender estos datos a empresas que se dedican a la publicidad, ¿sabes que hay empresas de publicidad que pagarían por tu basura?).

Al ser un robot, en principio te muestra todas las búsquedas por igual (siguiendo los parámetros del párrafo anterior), si buscas nazi te mostrará todas las páginas que hablen del nazismo, tanto si lo soportan como lo condenan, los buscadores (en teoría) no tienen ideales (nunca se sabe hacia dónde pueden avanzar y lo que pueden intervenir los gobiernos en las búsquedas de los usuarios, claro caso la censura china).

Tras esta "pequeña" explicación de qué son los buscadores y cómo funcionan vamos a ver como buscar y hacer que estas búsquedas nos acerquen al resultado deseado.

Mucha gente suele buscar 3 palabras para realizar sus búsquedas, pero se pueden llegar a buscar frases enteras!

Vamos a realizar un pequeño ejemplo, tengo un problema con mi ordenador que no tengo ni idea cómo solucionar. No me funciona correctamente la X100P, la fxo que usaré para realizar llamadas por internet.

Posibles búsquedas:
problema: 231.000.000 resultados (si, todos tenemos muchos problemas al largo del día, uno sería empezar a buscar tu problema por estos 231 millones de páginas!)

problema linux: 2.870.000 resultados (weno... la cosa mejora! pero aún no es suficiente!)

problema linux X100P: iuhu! sólo 503 resultados (quizás la solución ya la podemos tener en la primera página! pero vamos a ser mas específicos, pueden salir varios problemas al configurar una X100P).

meter el error tal cual me muestra la terminal, los /var/log/ o incluso el dmesg:
seguro que hay varios usuarios que se encuentran con este mismo problema, en mucha probabilidad tu solución está ante tus narices.

Google permite además hacer búsquedas específicas, en una página web, un tipo de fichero, etc. tenéis más información aquí:
es: http://www.google.es/intl/es/features.html
en: http://www.google.es/intl/en/features.html

Como ves puedes usar filetype:tipo para buscar sólo unos tipos de ficheros específicos o buscar contenidos en una pagina específica usando site:urlpaginaweb.

Añado una cosa que quizás no comenta aquí en estas dos páginas, no se si te has fijado pero google puede estar en varios idiomas (para cambiarlo sólo tienes que poner www.google.es/ca para tenerlo en catalán, por ejemplo), las búsquedas que aparecen en un idioma u otro suelen ser distintas, ya que google busca las páginas geográficamente cercanas a tí, ¡pruébalo!

¿Pero que pasa si aún sigo sin encontrar el problema? seguramente que estás intentando buscar la ayuda en castellano, pues aquí tengo que daros la mala noticia, debes saber algo de inglés (por lo menos es recomendable). Si eres un usuario nefasto por los idiomas siempre tendrás a mano varios traductores que te ayudaran en tu tarea diaria :)

el que mas me gusta es wordreference, que lo descubrí tras hacer la traducción del knowledgetree, 3000 líneas en inglés para traducir al catalán y al castellano, por fuerza aparecieron palabras que no sabía traducir o incluso no las había oído nunca!

http://www.wordreference.com/

no entro a explicar como funciona, creo que es bastante claro :) pones la palabra que quieres saber en inglés en el recuadro y pones la dirección de la traducción, puedes hacer lo mismo con otros idiomas (no sólo el inglés!), la traducción puede ir en la otra dirección por supuesto, si no sabes una palabra en inglés de una web que ni por contexto entiendes, puedes usar este traductor, aquí no hay ninguna señorita que no te deja usar chuletas, tu chuleta es internet! ojalá la hubiese tenido cuando estudiaba -o lo simulaba...-!!! (tener una pda cuando nadie aún supiese que existía esto, hubiera sido genial! arf!), gracias a esto he conseguido hallar alguna solución en páginas en ruso y todo! o por lo menos las búsquedas me han llevado ahí, gracias a los traductores y a una pequeña ayuda lingüística en el trabajo (gracias marina por traducirme aquel pedazo de texto lleno de palabras técnicas!).

También hay traductores que traducen páginas web enteras, pero la sintaxis no es muy cuidada, se basa en la traducción literal (el mundo de los traductores avanza y no niego que ya exista alguno que haga traducciones a partir de frases enteras). Google en la zona de idioma tiene un traductor de páginas web con un buen numero de posibilidades.

así que a la hora de buscar información que necesites que sea una barrera, es importante saber cuales son las palabras que sueles usar para tus búsquedas en otros idiomas (ya verás a la que aprenda las 4 palabras básicas en chino! -china es uno de los países que se usa mas gnu/linux que windows en sus ordenadores debido a sus pocos recursos económicos-).

pero vale, tenemos los buscadores, un campo de texto que nos lleva al mundo... ¿qué hay de otros proyectos como wikipedia? pues si, la wikipedia tiene interesantes artículos relacionados con lo que sea, gracias a la gran comunidad de usuarios wikipedistas es posible encontrar cualquier información (bibliográfica o no) en formato bibliográfico (es uno de los requisitos de la wikipedia).

la estructura para realizar este tipo de búsquedas es la siguiente:
http://idioma.wikipedia.org/wiki/palabra

en idioma ponemos el idioma el cual queremos buscar (es, ca, en, it, de, fr, etc.) hay un montón de idiomas a elegir.

y en palabra lo que queremos buscar, por ejemplo WTF, que seguro que muchas veces lo has visto en foros, chats, paginas web, etc.

http://en.wikipedia.org/wiki/WTF

wikipedia es un proyecto abierto, así que si tienes conocimientos específicos (y sólidos) sobre alguna materia y ves alguna página con un contenido pobre o nulo, puedes hacer modificaciones, después la comunidad de usuarios (administradores o propios usuarios como tu) harán una valoración de tu artículo y lo darán como válido o inválido (y lo borrarán o te avisaran para que lo mejores); en las páginas de la wikipedia siempre suelen haber referencias a otros artículos o páginas que hablan del tema.

Por ejemplo yo se algo de correfocs y todo lo técnico referente a este tipo de espectáculos, la información que mostraba esta página se refería a ball de diables, otro tipo de baile de tiempo medieval que se celebra en la parte sur de Cataluña, así que quité la redirección y puse toda la información que supe sobre los correfocs, lo que quedó fué mas o menos esto:

http://ca.wikipedia.org/wiki/Correfoc


Dejé la página preparada para que otros usuarios pudiesen añadir su información y al mismo tiempo crear páginas de información de sus grupos y el libre albedrío de mejorar y ampliar la información de la página. Cuantos mas usuarios intervengan en una página, mas probabilidades tiene esta de contener una información fiable.

La página está en catalán, así que como vamos a hacer la primera práctica, traducir esta página, pero antes buscar un traductor en catalán! así que adelante, quien lo consiga tiene mi admiración ;)

0 comentaris:

Publica un comentari a l'entrada