Nvidia dice que sí es capaz de superar al «Tensor Processing Unit» de Google, alega imparcialidad
Nvidia se ha pronunciado oficialmente después de que Google dijera que su TPU, o Tensor Processing Unit, algo así como Unidad de Procesamiento de Tensores, no tenía rival. Esa unidad de procesamiento fue probada por la compañía, la cual mostraba en un benchmark como era capaz de superar a Nvidia, pero había trampa, Google estaba comparando su TPU con una gráfica antigua de la compañía verde, concretamente una doble GPU Tesla K80 basada en la ya antigua arquitectura Kepler, en vez de realizar una comparación de rendimiento real respecto a sus soluciones actuales basadas en la arquitectura Pascal.
Si bien Google alardeaba de que su TPU ofrece un rendimiento 13 veces superior respecto a la GPU K80, que realmente es cierto, la compañía omite un detalle importante, pues esa cifra de ser 13 veces superior se saca de la media geométrica de todas las diferentes cargas de trabajo combinadas.
A ello se le suma lo más gracioso, que hayan omitido a Pascal, y Nvidia indica el por qué, y es que Pascal tiene un ancho de banda de memoria mucho mayor junto a una mayor cantidad de recursos. Como resultado, su GPU Tesla P40 es 26 veces más potente respecto a la K80, lo que se traduce en que Google no tiene nada que hacer.
No está claro si la reclamación de Nvidia tiene en cuenta los límites de latencia de Google. Por otro lado, los datos de Google muestra una gran ventaja para el "Tensor Processing Unit" en lo que respecta al rendimiento por vatio consumido en comparación con las GPUs de Nvidia, sobre todo una vez que la potencia del servidor se resta de la ecuación. Básicamente, la GPU tiene un montón de componentes que un chip como el TPU de Google simplemente no necesita.
Tocará esperar y ver Google rebate los datos arrojados por Nvidia. Sin lugar a dudas, Google y Nvidia han entrado en una batalla para mostrar quién es capaz de ofrecer la mejor solución posible pensando únicamente en la Inteligencia Artificial y el Aprendizaje Profundo, un filón de oro aún por explotar.
"El TPU es programable como una CPU o GPU. No está diseñado para un solo modelo de red neuronal, sino que ejecuta instrucciones CISC en muchas redes (modelos convolucionales, LSTM y grandes modelos completamente conectados).
Así que sigue siendo programable, pero utiliza una matriz primitiva en lugar de un vector o scalar. Este procesador está más cerca del espíritu de una FPU que de una GPU.". Dijo Norman Jouppi, uno de los principales arquitectos de Google.