Handling Large Datasets at Google: Current Systems and Future Directions | Yahoo! Research
En Handling Large Datasets at Google: Current Systems and Future Directions (video) se pueden ver algunos detalles interesntes de como Google procesa información en sus datacenters. Para aquellos que no quieran ver el video, estan aca los slides . Algunos detalles de las mismas: En setiembre 2007 (realmente impresionante) Machine years used 11,081 Input data read (TB) 403,152 Intermediate data (TB) 34,774 Output data written (TB) 14,018 También hablan del hardware que usan (pc bastantes comunes), el sistema operativo (linux + software propio), explican en forma simple el mapreduce y el concepto de tablets. Me gustó mucho la afirmación: – Speed of light has remained fixed in last 10 yrs :)