Archive for Octubre, 2004

Power-law powah!

La verdad es que las clases de este cuatrimestre (”Matemática discreta” y “Grandes ideas de la computación”) no son muy emocionantes, ni dignas de mención, pero hoy hemos tenido una clase la mar de entretenida. La asignatura de “grandes ideas” consiste en que cada semana viene un profesor distinto de la facultad a hablarte sobre una “gran idea” de la informática. Hasta esta semana hemos tenido a profesores cuyas “grandes ideas” pues, sinceramente, no eran demasiado emocionantes (excepto la primera semana que nos hablaron de las máquinas de turing durante un par de días). Por ejemplo, hace un par de semana vino un profesor a largarnos un rollo macabeo muuuuy teorico sobre complejidad Kolmogorov (que ninguno de nosotros entendió) y la semana pasada un profesor vino a hablarnos sobre criptografía (pero intentó simplificar tanto, que al final fue un aburrimiento). En general, hasta ahora ha sido todo chapa teorica llena de teoremas, formulas, etc, etc.

Esta semana, en cambio, ha venido Ian Foster a hablarnos de Internet. Sí, sí, Ian Foster es el ‘padre de la Grid’, pero prefirió hablarnos de Internet porque es una idea aun más grande que la Grid. Los dos primeros días fueron bastante normales (origenes de Internet, un poco sobre conmutación de paquetes, etc.). Interesante, pero no tremendamente emocionante (aunque por lo menos no era chapa teorica-matemática). Lo realmente interesante ha sido hoy cuando nos ha hablado de las “power-law distributions” (¿alguien sabe cual es el término equivalente en castellano?).

Una distribución power-law viene a ser algo así como una generalización del Principio de Pareto. Recordemos brevemente el Principio de Pareto: cuando en un programa el 80% de los problemas provienen de un 20% de los bugs y el resto de los problemas (20%) proviene de un 80% de los bugs, entonces nos encontramos ante una distribución según el Principio de Pareto. Una distribución power-law es sencillamente cualquier distribución en el que una minoría de elementos acapara casi todas las relaciones, y el resto de los elementos (una mayoría) tiene muy pocas relaciones. Ian Foster nos ha estado citando mogollon de lugares y sistemas donde nos encontramos con esta distribución y, curiosamente, esa distribución no es por diseño. El estudio de por qué un sistema sigue una distribución power-law es, al parecer, un area de investigación bastante activa.

¿Y que tiene todo esto que ver con Internet? Pues resulta que los siguientes sistemas siguen una distribución power-law:

  • Los routers de Internet. Hay una minoría de routers que se encargan de encaminar gran parte del tráfico de Internet, mientras que la mayoría de los routers se encargan de tareas de encaminamiento mucho más sencillas.
  • La web. Unas pocas webs acaparan todos los enlaces ‘entrantes’, mientras que la mayoría de webs tienen muy poco enlaces ‘entrantes’.
  • La blogosfera. Pues lo mismo que la web (unos pocos weblogs son la élite y son seguidos por casi todo el mundo, mientras que la mayoria de blogs solo tiene un puñado de fieles seguidores). Pero es interesante ver la blogosfera como un caso aparte porque es más facil establecer un paralelo con las social networks que si utilizamos la web como punto de partida (la web es demasiado extensa). Es aconsejable este artículo.
  • Las redes de compartición de archivos. Muchos estudios han descubierto que en este tipo de redes (Gnutella, Kazaa, etc.) siempre se acaba formando una distribución power-law: unos pocos usuarios generan la mayoria del trafico, y casi todos los usuarios generan poco tráfico.

Lo realmente interesante es que seguir una distribución power-law es, en casi todos los casos, una vulnerabilidad. Por ejemplo, consideremos dos sistemas: el de carreteras y el de aeropuertos. El primero no sigue una distribución power-law, porque no podemos decir que haya ciertos nodos que acaparen casi todo el tráfico mientras que la mayoría tienen poco tráfico. En general, el tráfico está distribuido siguiendo una distribución normal (o de Poisson, ahora no me acuerdo). El sistema de aeropuertos sigue una distribución power-law. En EEUU, por ejemplo, los aeropuertos de Chicago, Nueva York, Atlanta, y Los Angeles acaparan casi todo el tráfico aereo, mientras que los otros tropecientos aeropuertos tienen un tráfico aereo bastante pequeño en comparación. Ahora bien, si un terrorista quisiese desmantelar el sistema de carreteras, le resultaría bastante dificil (podría cargarse una autopista, pero eso sólo afectaria a esa autopista en concreto y posiblemente a las ciudades más cercanas). Si un terrorista quisiese desmantelar el sistema de aeropuertos, con tan sólo cargarse el aeropuerto de Chicago (el aeropuerto O’Hare), ya dejaría el tráfico aereo patas arriba.

Un ejemplo interesante que ha citado Ian Foster es que, en el caso de las redes de compartición de archivos, el homólogo americano de la SGAE se centra en demandar legalmente a los usuarios que acaparan la mayoría del tráfico en Kazaa. Cómo la red se organiza siguiendo una distribución power-law, cuando se cargan a esos usuarios consiguen en efecto cargarse de golpe casi la mitad del tráfico.

De nuevo, no hay que olvidar que esta distribución no es fruto de una decisión de diseño. La gran pregunta que ha lanzado Ian (y que dice que tiene una dimensión social más que tecnológica) es: ¿Por qué las redes tienden a auto-organizarse siguiendo una distribución power-law? ¿No tiene más sentido que se organicen de otra manera para evitar que un fallo en un lugar crítico de la red la descojone por completo? Vamos, da un poco que pensar…

Y, finalmente, algo divertido que ha mencionado Ian Foster. Entre los múltiples ejemplos que ha citado, ha mencionado que muchas enfermedades se propagan siguiendo una distribución power-law, y que a veces con aislar a ciertos individuos clave consigues frenar la epidemia. Sin cortarse ni un pelo, ha dicho “por ejemplo, en el caso del SIDA, donde las relaciones sexuales siguen una distribución power-law”. Venga, pensadlo un par de segundos que a mi también me ha costado pillarlo. Ha sido muy divertido porque Ian Foster lo dijo, y no hemos empezado a reirnos hasta cinco segundos después cuando hemos entendido lo que ha dicho. Vamos, que resulta que en lo que se refiere a las relaciones sexuales, hay estudios que demuestran que un puñado de cabrones acaparan toda la acción, y casi todo el mundo tiene que conformarse con las migajas. Cuando Ian ha visto que empezabamos a reirnos, de nuevo sin cortarse un pelo ha dicho: “Si, bueno, por ejemplo, cuando empezó la epidemia del SIDA los investigadores descubrieron que una de las principales causas de que la enfermedad se extendiese tan rapidamente fue por culpa de un azafato canadiense que… ejem… estaba excepcionalmente bien conectado” xDDD

Primer examen…¡Superado!

Bueno, la profesora de Matemática Discreta ha corregido el examen a la velocidad de la luz y nos lo ha devuelto hoy mismo. No es plan de poner la nota aquí en el weblog, sobre todo porque con los campanazos de Gauss que pegan aquí incluso un cinco raspadito puede convertirse al final en un notable (lo que no significa que haya sacado un cinco raspado :-P ). Mi nota es exactamente igual a la nota media de la clase, lo que según la profesora significa que voy por el buen camino. Igual no en el camino de sacar un sobresaliente, pero sí en el camino de sacar la nota mínima requerida por el programa de doctorado (un notable alto). Pero, sinceramente, en una asignatura de matemáticas no tengo el más mínimo deseo de esforzarme aun más para poder sacar un sobresaliente. Así que estoy más que contento con la nota que he sacado.

Y no nos han mandado deberes para el fin de semana. A partir de esta tarde, tumbing y rasquing a la enésima potencia!!!

El primer examen en más de un año

No he hecho un examen desde el 6 de junio de 2003. Iluso de mi, por aquel entonces pensaba que no volvería a hacer un examen en toda mi vida. Ha sido curioso volver a sentir esa tensión pre-examen, estar mirando los apuntes hasta el último momento, la inevitable conversación post-examen en la que te das cuenta de que esa pregunta que estabas 100% seguro de tenerla bien resulta que la has hecho mal,… Pero bueno, en general me parece que me ha salido bien. Ni mal ni muy bien, simplemente bien. Me consuela el hecho de que la profesora nos dijo (antes del examen) “you are not expected to finish the exam”. Menos mal que nos aclaró eso, porque ninguno de nosotros fue capaz de terminar el examen (había algunas preguntas de órdago). Y, al parecer, aquí la corrección con campana de Gauss es la norma, con lo cual me parece que la nota que sacaremos todos será más que aceptable.

Pues eso, contento. Otra cosa que habia olvidado era el tremendo alivio que se siente después de un examen, y lo gratificante que resulta tener el resto de la semana libre para practicar un poco de rasquing y tumbing. Así que me parece que voy a dedicar el resto de la tarde a conseguir que las ondas de mi cerebro alcancen el encefalograma plano.

La tensión de los exámenes

Como ya he dicho en varias ocasiones, este miercoles tengo mi primer examen del doctorado (de la asignatura de Matemática Discreta). En realidad, ni siquiera es un examen hecho y derecho. Es un midterm que dura 50 minutos y sólo cuenta un 15% de la nota final. A priori, suena como algo casi trivial. Esto es sólo un “control”. Tampoco parece que afecte mucho a la nota final. Incluso sacando un aprobado raspadillo sólo pierdes unos 7 puntillos de la nota final. Menuda chorrada, ¿no? Si estuviese en una universidad española, seguramente estaría de acuerdo con esas afirmaciones, pero aquí esto es bastante distinto. Por un control de 15 puntos, estamos todos que nos subimos por las paredes. Entre los compañeros de doctorado se respira tensión. Dejadme que os explique por qué…

La nota de Matemática Discreta se divide en cuatro partes: 5 puntos por los deberes, 1,5 puntos por el primer control, 1,5 puntos por el segundo control, y 2 puntos por el examen final. De nuevo, en una universidad española esto sería un autentico chollazo porque con hacer los deberes un tanto bien y no cagarla en los examenes, ya has aprobado. Pero aquí hay que fijarse en los requisitos del doctorado. De entrada, los estudiantes de doctorado tenemos que mantener una nota media (entre todas las asignaturas) de 8,125. Bueno, esto realmente no es un requisito tan impresionante porque si has llegado a la Universidad de Chicago, se supone que eres capaz de mantener esa nota media. Lo jodido es lo siguiente: aquí las asignaturas no se aprueban con un 5, se aprueban con un notable alto. Así que no vale la jugarreta de “pues me paso las asignaturas de matemáticas por el arco del triunfo, y luego saco notas espectaculares en las asignaturas de programación” (que es basicamente lo que hice durante la carrera de ingeniería). Aquí, en cambio, con que pierdas más de dos puntos entre los exámenes y los deberes, tienes que repetir la asignatura…

Así que ya veis… hay tensión, hay tensión… :-D

¡Wiki wiki!

Es en días como estos en los que me alegro genuinamente de estar aquí. Hoy he tenido la oportunidad de conocer nada más y nada menos que a Jimmy Wales, fundador de Wikipedia y director de la Wikimedia Foundation. Wikipedia es uno de los proyectos que más admiro, no sólo por su tremenda utilidad, sino por ser un proyecto que ha demostrado que la GNU Free Documentation License y el copyleft no son una paja mental (como mucha gente suele pensar en cuanto les hablas sobre compartir libremente información) sino una herramienta con la que se puede construir una enciclopedia libre y gratuita mayor que la Britannica y que Encarta. También demuestra que un esfuerzo realizado por la comunidad para la comunidad le puede dar mil vueltas a un producto equivalente pero propietario (o “privativo” como dice Stallman en castellano). Si nunca habeis visitado Wikipedia, os animo a que lo hagais y seguro que flipais con lo completa y enorme que es. Para los no-angloparlantes, podeis visitar la Wikipedia en Español, aunque no tiene tantos artículos como la versión inglesa.

Le he conocido porque Jimmy Wales ha venido hoy a dar una pequeña charla a la Universidad de Chicago. No me pregunteis por qué han decidido ponerla un domingo… para raritos los americanos. Hemos estado sólo unas 15 personas, así que hemos estado totalmente en plan amiguetes (curiosamente, Jimmy Wales ha dicho que “15 personas” es todo un éxito para él… cuando organiza charlas o reuniones, al parecer no acude mucha gente). Nos ha hablado un poco sobre Wikipedia y todos los proyectos relacionados, haciendo hincapie en el futuro de Wikipedia y en los desafios que afronta. Pero lo más interesante ha sido el turno de preguntas (ha hablado como 40 minutos y le hemos abrasado a preguntas durante una hora), donde han surgido todo tipo de temas interesantes. Jimmy Wales ha estado muy elocuente, y la verdad es que es bastante majo. También es una persona con las ideas muy claras sobre la neutralidad de Wikipedia (el famoso NPOV, o Neutral Point of View) y también sobre Software Libre (echadle un vistazo, por ejemplo, a su artículo Free Knowledge requires Free Software and Free File Formats). Al final de la charla incluso tuve la oportunidad de hablar un poco con él. De hecho, nos invitó a todos a ir a comer con él después de la charla, pero desgraciadamente no pude ir porque tenía otro compromiso después de la charla :-( Y es una lástima, porque me habría encantado seguir hablando con él.

En definitiva, una charla muy muy interesante. Y, por supuesto, no ha faltado la fotito al final.

Por cierto, por fin he colgado varias fotos que tenía pendiente colgar. Para empezar, he colgado videos del piso (hay que ir a la segunda página) con los que me parece que se puede ver claramente el “antes” y el “despues” del piso (es decir, antes y despues de recibir todos mis trastos de España: posters, etc.). También he colgado un par de fotos de cuando fui a ver The Lord of the Rings Symphony.

En fin, algo interesante que contar entre tanto estudio. El miercoles ya tengo mi primer examen. A ver que tal…