La verdad es que las clases de este cuatrimestre (”Matemática discreta” y “Grandes ideas de la computación”) no son muy emocionantes, ni dignas de mención, pero hoy hemos tenido una clase la mar de entretenida. La asignatura de “grandes ideas” consiste en que cada semana viene un profesor distinto de la facultad a hablarte sobre una “gran idea” de la informática. Hasta esta semana hemos tenido a profesores cuyas “grandes ideas” pues, sinceramente, no eran demasiado emocionantes (excepto la primera semana que nos hablaron de las máquinas de turing durante un par de días). Por ejemplo, hace un par de semana vino un profesor a largarnos un rollo macabeo muuuuy teorico sobre complejidad Kolmogorov (que ninguno de nosotros entendió) y la semana pasada un profesor vino a hablarnos sobre criptografía (pero intentó simplificar tanto, que al final fue un aburrimiento). En general, hasta ahora ha sido todo chapa teorica llena de teoremas, formulas, etc, etc.
Esta semana, en cambio, ha venido Ian Foster a hablarnos de Internet. Sí, sí, Ian Foster es el ‘padre de la Grid’, pero prefirió hablarnos de Internet porque es una idea aun más grande que la Grid. Los dos primeros días fueron bastante normales (origenes de Internet, un poco sobre conmutación de paquetes, etc.). Interesante, pero no tremendamente emocionante (aunque por lo menos no era chapa teorica-matemática). Lo realmente interesante ha sido hoy cuando nos ha hablado de las “power-law distributions” (¿alguien sabe cual es el término equivalente en castellano?).
Una distribución power-law viene a ser algo así como una generalización del Principio de Pareto. Recordemos brevemente el Principio de Pareto: cuando en un programa el 80% de los problemas provienen de un 20% de los bugs y el resto de los problemas (20%) proviene de un 80% de los bugs, entonces nos encontramos ante una distribución según el Principio de Pareto. Una distribución power-law es sencillamente cualquier distribución en el que una minoría de elementos acapara casi todas las relaciones, y el resto de los elementos (una mayoría) tiene muy pocas relaciones. Ian Foster nos ha estado citando mogollon de lugares y sistemas donde nos encontramos con esta distribución y, curiosamente, esa distribución no es por diseño. El estudio de por qué un sistema sigue una distribución power-law es, al parecer, un area de investigación bastante activa.
¿Y que tiene todo esto que ver con Internet? Pues resulta que los siguientes sistemas siguen una distribución power-law:
- Los routers de Internet. Hay una minoría de routers que se encargan de encaminar gran parte del tráfico de Internet, mientras que la mayoría de los routers se encargan de tareas de encaminamiento mucho más sencillas.
- La web. Unas pocas webs acaparan todos los enlaces ‘entrantes’, mientras que la mayoría de webs tienen muy poco enlaces ‘entrantes’.
- La blogosfera. Pues lo mismo que la web (unos pocos weblogs son la élite y son seguidos por casi todo el mundo, mientras que la mayoria de blogs solo tiene un puñado de fieles seguidores). Pero es interesante ver la blogosfera como un caso aparte porque es más facil establecer un paralelo con las social networks que si utilizamos la web como punto de partida (la web es demasiado extensa). Es aconsejable este artículo.
- Las redes de compartición de archivos. Muchos estudios han descubierto que en este tipo de redes (Gnutella, Kazaa, etc.) siempre se acaba formando una distribución power-law: unos pocos usuarios generan la mayoria del trafico, y casi todos los usuarios generan poco tráfico.
Lo realmente interesante es que seguir una distribución power-law es, en casi todos los casos, una vulnerabilidad. Por ejemplo, consideremos dos sistemas: el de carreteras y el de aeropuertos. El primero no sigue una distribución power-law, porque no podemos decir que haya ciertos nodos que acaparen casi todo el tráfico mientras que la mayoría tienen poco tráfico. En general, el tráfico está distribuido siguiendo una distribución normal (o de Poisson, ahora no me acuerdo). El sistema de aeropuertos sigue una distribución power-law. En EEUU, por ejemplo, los aeropuertos de Chicago, Nueva York, Atlanta, y Los Angeles acaparan casi todo el tráfico aereo, mientras que los otros tropecientos aeropuertos tienen un tráfico aereo bastante pequeño en comparación. Ahora bien, si un terrorista quisiese desmantelar el sistema de carreteras, le resultaría bastante dificil (podría cargarse una autopista, pero eso sólo afectaria a esa autopista en concreto y posiblemente a las ciudades más cercanas). Si un terrorista quisiese desmantelar el sistema de aeropuertos, con tan sólo cargarse el aeropuerto de Chicago (el aeropuerto O’Hare), ya dejaría el tráfico aereo patas arriba.
Un ejemplo interesante que ha citado Ian Foster es que, en el caso de las redes de compartición de archivos, el homólogo americano de la SGAE se centra en demandar legalmente a los usuarios que acaparan la mayoría del tráfico en Kazaa. Cómo la red se organiza siguiendo una distribución power-law, cuando se cargan a esos usuarios consiguen en efecto cargarse de golpe casi la mitad del tráfico.
De nuevo, no hay que olvidar que esta distribución no es fruto de una decisión de diseño. La gran pregunta que ha lanzado Ian (y que dice que tiene una dimensión social más que tecnológica) es: ¿Por qué las redes tienden a auto-organizarse siguiendo una distribución power-law? ¿No tiene más sentido que se organicen de otra manera para evitar que un fallo en un lugar crítico de la red la descojone por completo? Vamos, da un poco que pensar…
Y, finalmente, algo divertido que ha mencionado Ian Foster. Entre los múltiples ejemplos que ha citado, ha mencionado que muchas enfermedades se propagan siguiendo una distribución power-law, y que a veces con aislar a ciertos individuos clave consigues frenar la epidemia. Sin cortarse ni un pelo, ha dicho “por ejemplo, en el caso del SIDA, donde las relaciones sexuales siguen una distribución power-law”. Venga, pensadlo un par de segundos que a mi también me ha costado pillarlo. Ha sido muy divertido porque Ian Foster lo dijo, y no hemos empezado a reirnos hasta cinco segundos después cuando hemos entendido lo que ha dicho. Vamos, que resulta que en lo que se refiere a las relaciones sexuales, hay estudios que demuestran que un puñado de cabrones acaparan toda la acción, y casi todo el mundo tiene que conformarse con las migajas. Cuando Ian ha visto que empezabamos a reirnos, de nuevo sin cortarse un pelo ha dicho: “Si, bueno, por ejemplo, cuando empezó la epidemia del SIDA los investigadores descubrieron que una de las principales causas de que la enfermedad se extendiese tan rapidamente fue por culpa de un azafato canadiense que… ejem… estaba excepcionalmente bien conectado” xDDD
Últimos comentarios