Handling Large Datasets at Google: Current Systems and Future Directions | Yahoo! Research

En Handling Large Datasets at Google: Current Systems and Future Directions
(video) se pueden ver algunos detalles interesntes de como  Google procesa información en sus datacenters.

Para aquellos que no quieran ver el video, estan aca los slides.

Algunos detalles de las mismas:

En setiembre 2007 (realmente impresionante)

Machine years used   11,081
Input data read (TB)        403,152
Intermediate data (TB)      34,774
Output data written (TB) 14,018

También hablan del hardware que usan (pc bastantes comunes), el sistema operativo (linux + software propio), explican en forma simple el mapreduce y el concepto de tablets.

Me gustó mucho la afirmación:

– Speed of light has remained fixed in last 10 yrs :)

Comentarios

Entradas más populares de este blog

El Sordo

StackOverflow Documentation

Codigo simple