1) NVidia намеренно строги колпачки двойная точность (FP64) производительность "азартные игры" карты, так что они не уменьшают продажи Quadro и Tesla плат. Одинарной точности (FP32) является колпачков, двойной точности должна быть около 1/2 производительности одинарной точности (на Quadros и тесла). Тем не менее, Bitcoin использует целочисленную арифметику, а не с плавающей точкой.
Не в GK104. В каждом SMX есть 192 нормальных ядер CUDA и 8 ядер FP64 CUDA. В 8 специальных ядер работать на точность расчетов FP64 той же скоростью, как FP32, но подавляющее большинство ядер CUDA неспособны работать точность расчетов FP64 на любой скорости.
Из обзора AnandTech в
Другое изменение приходит от GF114 таинственной блок # 15, блок CUDA FP64. Для того, чтобы сохранить кубик пространства, одновременно предлагая возможности FP64 на GF114, NVIDIA только сделал один из трех основных блоков CUDA FP64 способен. В свою очередь, что блок ядер CUDA может выполнить инструкции FP64 при скорости ј производительности FP32, что дало СМ общую пропускную способность FP64 1/12-FP32. В GK104 ни один из обычных основных блоков CU не способны FP64; на его месте мы имеем то, что мы называем блок CUDA FP64.
Блок CUDA FP64 содержит 8 специальных ядер CUDA, которые не являются частью общего подсчета CUDA ядра и не являются ни в одной из диаграмм NVIDIA. Эти CUDA ядро может только делать и используется только для FP64 математики. Что еще, блок CUDA FP64 имеет очень специальный тариф исполнения: 1/1 FP32. Только с 8 ядрами CUDA в этом блоке он принимает NVIDIA 4 цикла для выполнения целого перекоса, но каждый квартал варп делается на полной скорости, в отличии от Ѕ, ј, или любой другой дробной скорости, что предыдущие архитектуры действовавшей в. В целом производительность FP64 GK104 является очень низкой только 1/24 FP32 (1/6 * ј), но само существование блока CUDA FP64 довольно интересно, потому что это первый раз, когда мы видели, скорость исполнения 1/1 FP32. Большой Кеплер не может закончиться напоминающей GK104, но если это произойдет, то это может быть чрезвычайно мощным процессором FP64, если он построен из блоков CUDA FP64.
Это не искусственный предел, GK104 на самом деле действительно не в состоянии сделать любую точность расчетов FP64 с разумной скоростью. Там, вероятно, не будет каких-либо карт Kepler Quadro или Tesla, пока GK110 не будет отпущена.