Monthly Archive for Marzo, 2008

Sotomayor et al.

Mirando un artículo científico que quiero citar en el artículo que me aceptaron la semana pasada, me he encontrado con esto:

More closely related to our work, Sotomayor et. al proposed an accurate resource allocation method for virtual computing environments [12]. Job execution time accounting in typical batch job schedulers include the time for staging executables to compute nodes, since the staging cost is typically very small compared to its execution time. However, deploying a virtual cluster can take significantly longer, thus including its time in execution time accounting can be unfair for the user. Sotomayor et. al proposed a VM-aware resource accounting method by estimating the time to deploy virtual machines on a single cluster. Similar to us, their estimation uses the information of the size of the VM image and the number of VMs to deploy. Unlike us, they assume homogeneous performance of compute nodes. Thus, their estimation would not be as accurate as ours in the presence of significantly different speeds of disk I/O.

[12] B. Sotomayor, K. Keahey, and I. Foster. Overhead matters: A model for virtual resource management. In First International Workshop on Virtualization Technology in Distributed Computing (VTDC’06), Nov 2006.

Me parece que es la primera vez que veo un artículo mío citado en otro artículo científico (al menos, siendo yo el primer autor; si que me han citado artículos en los que yo no era primer autor, con lo cual la cita no era “Sotomayor et al.”). En los artículos científicos es sumamente importante citar otros artículos relacionados con tu trabajo. No hacerlo suele ser indicativo de ignorancia o malicia. Es decir, o bien eres ignorante de tu área de conocimiento, o eres un “mal científico” que no quiere citar un trabajo que está “demasiado relacionado” y le restaría novedad a tus resultados. Curiosamente, en casi todos los artículos científicos que he leído, la sección de artículos relacionados suele incluir un párrafo por cada artículo, con la siguiente estructura en cada parrafo:

  1. El artículo escrito por Fulanito et al. propone un modelo/técnica/algoritmo/etc. para resolver el problema X.
  2. El problema X es importante y está relacionado con nuestro trabajo por las razones A, B, y C.
  3. La solución propuesta por Fulanito et al. mola mazo, y por eso la citamos.
  4. Eso sí, con respecto al subproblema Y del problema X, la solución de Fulanito et al. es una mierda pinchada en un palo.
  5. Nosotros, en cambio, abordamos el subproblema Y del problema X de una manera admirable.
  6. (Implícito: ¡Hurra por nosotros!)

Como podéis veis, el mundo académico es emocionante que lo flipas ;-)

Para los curiosos, “et al.” es la abreviación de “et alia”, que es latín para “y los otros”. Cuando se cita un artículo escrito por múltiples autores, sería muy engorroso escribir “el artículo de Fulanito, Menganito, Juanito, Jaimito, y Jorgito”, y se deja simplemente con el apellido del primer autor seguido de “et al.”.

A good week

roosevelt.jpg

Esta ha sido una buena semana. El lunes, tal y como relaté en el blog, nos notificaron de que Globus fue seleccionada como organización mentora en el Google Summer of Code. A lo largo de la semana ya nos han escrito varios estudiantes interesados en trabajar con nosotros durante el verano. Mola :-)

El jueves, además, llegó una muy buena noticia: me notificaron que un artículo que envié en enero a la conferencia “ACM/IEEE International Symposium on High Performance Distributed Computing” (mejor conocida como HPDC 2008) fue aceptado. No olvidemos que en el mundillo académico es importante publicar artículos científicos con los resultados de tu trabajo, especialmente si eres un estudiante avanzando hacia tu doctorado :-) Ser aceptado en HPDC 2008 es una pasada, porque es una de las conferencias más importantes de mi área, y aceptan muy pocos artículos cada año. Eso sí, es un “conditional accept”, lo que significa que todavía tendremos que hacer unos cuantos cambios al artículo antes de que lo acepten por completo, pero tendríamos que ser muy patanes para no seguir las recomendaciones del comité seleccionador.

Para añadir la guindilla final a esta semana, resulta que este fin de semana me coinciden múltiples planes (preparados antes de que supiese las dos buenas noticias) con amigos Chicaguenses, incluidas un par de cenas. Vamos, una coincidencia fantástica. Ha sido una buena semana. Life is good :-)

P.D.- El de la foto es Theodore Roosevelt. Viene a expresar perfectamente como me siento :-)

Google Summer of Code 2008

Google ha anunciado hoy la lista de organizaciones mentoras para Google Summer of Code 2008. Este año hemos presentado a la Alianza Globus como organización mentora y… ¡nos han aceptado! Además, yo estoy listado como mentor para proyectos relacionados con gestión de recursos utilizando máquinas virtuales. Si a alguien le interesa ese tema, o la Computación Grid en general, que no dude en pegarme un toque, e igual acaba siendo mi Google-estudiante veraniego ;-) Participar en Google Summer of Code implica desarrollar código abierto, estar en contacto con mogollón de gente interesante (y no lo digo por mi, sino por todos mis co-trabajadores de Globus, y el resto de gente involucrada en GSoC), y además, recibir un sueldito de Google durante el verano.

Y si no os interesa la Computación Grid, no dejéis de echarle un vistazo a las 150+ organizaciones open source que este año han propuesto proyectos para el Google Summer of Code.

Free and Open Source Software FTW g0g0g0g0g0!

Venga a ver, venga a ver…

En la carrera hay muchas asignaturas que generaron en mi una frustración inconmesurable por su aparente futilidad. Estoy seguro que más de un estudiante de ingeniería de ESIDE se ha preguntado varias veces “¿Por qué tengo que estudiar esta asignatura si no tiene nada que ver con la informática?”. Muchos profesores nos aseguraban que ya nos resultarían útiles en el futuro y, en esa edad rebelde, pues no nos lo creíamos. Sin embargo, hay varias ocasiones en las que he tenido que admitir que algunas de esas asignaturas si me han venido bien.

Por ejemplo, en nuestro programa de doctorado hace falta un entrenamiento matemático no trivial, y las asignaturas de Álgebra y Matemática Discreta me proporcionaron esa base (aunque la hubiese olvidado casi por completo cuando llegué a EEUU). Cuando escribí mi libro tuve que escribir una propuesta de libro al editor, en la que me pedían realizar un análisis del mercado y de mi posible competencia. Reaparecieron, pues, en mi cabecita términos como “segmentación del mercado”, “grado de penetración del producto”, etc. y de repente las asignaturas de empresa que antaño me parecieron un tostón ahora resultaron estar plenamente justificadas.

Sin embargo, siempre me ha quedado una espina clavada: las míticas asignaturas de Estadistica I y Estadistica II en ESIDE. Dejando aparte el mal sabor de boca que me dejaron (Estadistica II es la única asignatura que suspendí en la carrera), nunca nunca les había encontrado un propósito práctico. Incluso cuando empecé a interesarme por los fundamentos teóricos de la informática, la estadística no pintaba nada. Era todo matemática discreta y, ocasionalmente, álgebra y análisis matemático.

Pues bien, hace poco por fin he tenido que usar la estadística de manera práctica y totalmente justificada. Actualmente estoy trabajando en un artículo que presenta unos resultados basados en simulaciones de planificación de recursos. He llegado a un punto en el que estoy produciendo una cantidad desorbitada de información, del tipo que ni se puede resumir fácilmente en una tabla ni se puede decir “Bueno, pues la media de todo esto es 5.6 y ya está!”. Y cuanto tienes mucha información y quieres (1) resumirla de tal manera que no se rían de ti cuando presentas los resultados en la conferencia y (2) te permita identificar patrones y comportamientos en la distribución de tus datos, pues la estadística es una herramienta indispensable. Esto no significa que me esté pasando el día haciendo cálculos con papel y lapiz y consultando tablas de distribuciones estadísticas (como hacíamos en esas asignaturas). Me lo estoy pasando como un enano trasteando con R, un paquete libre de estadística que incluye un lenguaje de programación propio y todos los paquetes extra que te puedas imaginar (vamos, es algo así como el LaTeX del análisis estadístico :-P), y mi ultimo vicio son las regresiones no-paramétricas. Antes de utilizar R y aplicar métodos estadísticos a mis datos, la información producida por mis experimentos no tenía ni pies ni cabeza. Y ahora, gracias a la estadística, lo veo todo claro. Quién me lo iba a decir…

P.D.- Para los que no seais de ESIDE, el título hace referencia a cierto profesor de ESIDE. La próxima vez que pregunte a ver si alguien le mecaniza la estadistica, le decís que el proyecto R ya lo ha hecho :-P

¡Cobardes!

ETA ha atentado de nuevo. Tan solo dos días antes de las Elecciones Generales, un sicario de la banda le ha disparado tres tiros en la nuca a Isaías Carrasco, un ex-concejal del PSOE sin escolta, en presencia de su mujer y su hija. Como todos los actos de la banda terrorista, este es un acto vil, cobarde, e injustificable.

De momento, me callo todo lo demás que quiero decir. Estoy demasiado cabreado, y no termino de explicarme como siguen pasando este tipo de cosas en el siglo XXI. ETA es un anacronismo que no tiene ningún sentido en una sociedad civilizada y democrática, y que no entiende que no se logra nada derramando sangre.

Bakea behar dugu!