MareNostrum y octopus

Para los que no lo conocen, MareNostrum es un supercomputador que está en Barcelona y que hasta hace poco estaba entre los 10 más rápidos del mundo (ahora ya bajó, la lista cambia muy rápido). Tiene 10240 procesadores PPC 970 (por si les suena, es el procesador del Mac G5) conectados por una red Myrinet.

Nuestro grupo tiene una colaboración con ellos con la idea de adaptar los códigos que usamos para que puedan correr eficientemente en cientos de procesadores; Octopus será el primer código con que trabajarán. Por esto estuve de visita en el Centro de Supercomputación de Barcelona, dueño de la máquina, para trabajar con ellos y empezar con el trabajo.

Las cosas fueron bastante bien y pudimos hacer escalar Octopus hasta 512 procesadores sin problemas, ellos ahora harán pruebas con más aún. Si todo sale bien quizás podamos hacer una corrida grande (4 mil procesadores o más).

Documentales online

Me gusta mucho ver documentales, pero si uno no está dispuesto a pagar por televisión por cable es bastante difícil tener acceso a ellos. Bueno, eso era hasta hace un tiempo. Gracias a las maravillas del streaming ahora es posible encontrar montón de documentales online gratis listos para ver (la mayoría en inglés, claro).

Hay varios servidores que tienen documentables (servidores que a diferencia de youtube, permiten almacenar videos largos). Probablemente el mejor es Google Video, pero hay otros más desconocidos como Surfthechannel, también está Veoh que para ver videos largos requiere un cliente especial que por supuesto no está para Linux (en otro post explicaré como hacerlo).

Ahora, como buscar videos por su contenido es un lío, lo mejor es usar algunos de los sitios que se dedican a indexar documentales (u otros videos de streaming). Los que uso yo son:

Wadleigh and Crawford

Hace un tiempo compré este libro titulado "Software optimization for high performance computing" por Kevin R. Wadleigh y Isom L. Crawford, editado por HP. Lo descubrí en base a una recomendación que alguien publicó en la lista de correo de Beowulf.

La primera impresión del libro fue bastante mala, literalmente. La calidad de la impresión de la tapa es bastante mala y ni hablar de la calidad del papel, las páginas parecen fotocopiadas y la calidad de las figuras es pésima. Si no fuera porque se le compró a Amazon pensaría que es un libro pirata.

Respecto al texto, es otra cosa. Si bien el contenido puede ser un poco básico y no entra a analizar en profundidad la optimización del algun código particular, se hace un análisis bastante exhaustivo de todo lo que hay que saber sobre optimización de software. Esto es un gran mérito considerando que es un libro del año 2000, lo que a nivel de hardware es muchísimo tiempo.

La parte más interesante del texto es en la que se analizan las rutinas más importantes de BLAS explicando cómo se optimizan cada una de ellas, y como un procesador actual, debido al limitado ancho de banda de memoria, solo puede obtener el rendimiento máximo usando las rutinas de nivel 3, en particular la multiplicación de matrices. También contiene un capítulo muy interesante sobre Fast Fourier Transforms y cómo implementarlas eficientemente.

Es un libro bastante recomendable, aunque es un poco caro, especialmente por lo que comentaba sobre la calidad de impresión.