A raiz de lo que expuse en el anterior artículo sobre la Cadenas de Markov, Mario sugirió que Markovizase mi blog para ver que pasaba. Para los que no quieran leerse el anterior artículo, os cuento lo esencial para que le veais la gracia a los textos Markovizados que os voy a enseñar. Yo puedo coger un texto cualquier y, analizar las frecuencias con las que una palabra aparece despues de otra palabra. Por ejemplo, en castellano es probable que después de la palabra “de” tengamos la palabra “la”, pero mucho menos probable tener la palabra “para” despues de “de” (de hecho, en ese caso la probabilidad debería ser cero :-P ). En base a esas probabilidades, puedo generar un modelo llamado una Cadena de Markov. Este modelo, en esencia, encapsula los patrones que se encuentran en el texto y, dado un cuerpo de estudio lo suficientemente grande, los patrones de un idioma concreto. Una vez tenemos el modelo, podemos simularlo y generar textos que se ajustan a los patrones del texto analizado. Vamos, en cierto sentido no es más que una manera que reordenar un texto, pero teniendo presente los patrones del texto original. Los resultados, en general, suelen ser bastante sorprendentes (teniendo en cuenta que es un proceso aleatorio) e incluso divertidos.
Pues bien, utilizando el programa que podeis encontrar en esta web, he generado una Cadena de Markov utilizando todos los artículos de BorjaNet (desde septiembre de 2002). He realizado varias simulaciones, y los resultados son bien curiosos. Antes de nada, os pongo la frase que más me ha calado en una de las simulaciones:
los hombres del renacimiento como Leonardo Da Vinci que estaban versados en las calles de caramelo
Os juro que esa es la frase tal cual me la ha soltado la simulación. Hay que ver los profundos pensamientos que subyacen a mis artículos…
Bueno, y aquí os van unas cuantas simulaciones un poco más completas. La primera está basada en una Cadena de Markov con granularidad de una palabra (es decir, el texto se ha analizado palabra por palabra). Puesto que es dificil extraer patrones utiles con una granularidad tan baja, el texto es bastante incoherente, aunque curiosamente el texto se deja leer (hay bastantes estructuras gramaticales correctas: “Lo que no me han dado”, “que podria haber visto muchos asuntos”, “De hecho, muchos nombres son asediados”)
Lo de textos, pues eso, que más artificial y de Web Services, razón es lo cuelguen en el vuelo tranquilito, bla, le molesta tanto. Eso sí, Alex, ¡no es basicamente en el mismisimo Stallman tiene 254 votos del renacimiento como el yang de doctorado para raritos los estudiantes o si quiera formar parte de horas al igual que dejé el correo (y honda, a la pantalla de mi vida. Lo que no me han dado la vida se cree por la plataforma del colegio. Sin embargo, el proceso de maravilla, y la cocina o 3 (concretamente, los negativos (de la absurda de la altura de mi cabeza, entonaron el botón “Warm” y la segunda página) con (por cierto, no encuentra dónde te restrasas en el Global Grid Computing, y he dicho, ya habia dado cuenta que relato sobre conmutación de esas afirmaciones, pero menos para celebrar mis fuerzas (que podría haber visto muchos asuntos. Pero lo grabó en algo así que terminen las tropas a los ideales propios habitantes. Me ha gustado, a la música a naftalina. Que bien. Yo venía en una parida. Pero es esto”. Yo ya mucho tiempo que tiene que se debe proteger su exito. El estudio pidió claramente una tienda esa. Pregunte a mi quiniela no hay junto al master generalmente no haya por fin han parecido genuinamente interesante ha habido el sistema de los ojos. De hecho, muchos nombres son asediados por supuesto, a uno o menos admitirian que me voy a la conferencia! ¡Yupi!
En la siguiente simulación, la granularidad es de dos palabras. Es decir, si parto del texto “Mi sastre es rico”, los estados de la cadena serían “Mi sastre”, “sastre es” y “es rico”. De esta manera es posible generar textos un poco más coherentes. Destaco en negrita unas cuantas frases curiosas…
Lo de la tesis. En España, cuando haces la defensa, me han traido varias cosas, incluido entrar a las encuestas la ventaja de 3 años al lado de casa. Así que al final no me rayaba mucho porque está en Swift Hall, muy cerca de mi weblog :-) Me enseñaron las partes más destacables de la siesta, una buena actualización al GT3 Programmer’s Tutorial. Un tio de IBM llegó a la vuelta, yo diria que el libro basta con enseñarle a la telefónica, y de las cosas en mi humilde opinión, es el pavo, y siempre dejan entrar un poco de carril de la defensa, me han dicho que está esperando puntualmente en la charla de orientación ha sido una gozada no tener nadie con quien charlar animadamente en lugar de un país’, y en navidades pienso comer toneladas de mierda hasta el final es tan traumatico como lo que me alegro de haber dormido profusamente, decidi dedicar el post a un nivel muy bueno y, si pudiesemos, las aceptaríamos todas. Es muy dificil establecer un orden entre ellas. Llegados a este punto, seguramente pensais lo mismo pero con ocasionales turbulencias leves. Eso no es fruto de una hora de escritura de este frenesí turistico y cinematográfico, ha llegado el router ADSL, un 2Wire HomePortal que parece que un lema más apropiado y menos riesgos se corren. De nuevo, entiendo y respeto que el diseño tal y como ahora se muera Knuth voy a escribir un laaargo día lleno de clusters, supercomputadores, y routers y switches.
En esta simulación en concreto generé bastantes más palabras, pero para no aburriros con la simulación entera, aquí van otras frase curiosas que aparecieron:
estoy dispuesto a tragarme mi orgullo y mis ideales si de paso les pueden colgar por los deberes
al final los informáticos solemos creernos los reyes magos!
POR FIN ha llegado una televisión defectuosa
Finalmente, aquí va el resultado de una simulación con granularidad de tres palabras. Como podeis ver, el texto parece ser más legible que los dos anteriores. Eso sí, parece ser que no me aclaro si estoy en Chicago o en Polonia…
Lo de la Iglesia o el gobierno de nuestro querido amigo Bush. Y, por supuesto, teniendo en cuenta que he llegado sano y salvo a Chicago despues de un viaje en avion sin ningun percance. No, esta vez no me tocó un operador surfero, pero (al igual que hice en Valladolid) nunca conseguiría alcohol para un menor. A lo que iba. ¡Ya estoy en Polonia! La verdad es que, como he dicho en múltiples ocasiones (tanto en el weblog, como a la ida) y no hubo mucha turbulencia en ninguno de los tramos. Y ahora, heme aquí, luchando contra el cambio de horario tras volver de Chicago, a comer (y malamente) a las 15:30 todos los días. Vamos, muy fuerte. Afortunadamente, a partir del lunes ya tengo un horario bastante más amigable…paso de tener 3- 4 horas de clase el profesor te cuenta cada tema un poco por encima y luego te dice “Para el lunes traigan leidas las páginas 107 a 403 de Silberschatz y Gavin”. Es decir, el temario te lo tienes que aprender tú por tu cuenta. En la sesión de orientación para todo. Incluso para el acoso sexual es un problema que es independiente de la afiliación política. Si hubiese ganado Gore, tendríamos el mismo problema (aunque no me cabe duda de que será todo tan interesante como lo poco que tiene…”, me solian decir. Y cuando me preguntaban si ya había estado en Valladolid y les respondía que lo más cerca fue Salamanca, me decían “Jo, pues es
Ya veis. Una chorradita. Pero una chorradita basada en principios matemáticos la mar de curiosos :-)

Últimos comentarios