И это было видно, невозможно (по конструкции Algo) иметь СИС
который не использует много очень быстрой памяти (или я неправильно с этим, TheRealSteve? Мои графические процессоры
сделать интенсивное использование графической памяти в то время как добыча полезных ископаемых, я не верю, что он использует только 128kB там ..
Имейте в виду, что требования к памяти (по крайней мере, в контексте LiteCoin) является в хэш. Таким образом, в то время как ваша карта использует много памяти, это только потому, что он работает на нескольких хэш в то же время (с убывающей отдачей). В то же время, ГПУ, возможно, придется взаимодействовать с этой памяти за пределами пресс-формы (выход чипа, через выводы, через контроллер памяти, через большее количество выводов, в плате GDDR, часто через другой контроллер, на RAM, и назад, в то время как вы могли бы разработать ASIC с такой же памятью, как вы готовы отказаться от там очень близко к где вы на самом деле делать вычисления. там довольно впечатляющие результаты скорости, чтобы быть там было. Сравните это с различными уровнями кэш-памяти . на CPU против RAM L1 кэш 3 или 4 цикла (делят 1 второй по частоте ядра, умножить на 3 или 4, то, как долго это берет, чтобы ткнуть на него - говорят, хороший круглые часы 2.5GHz дает 0,4 наносекунды), RAM занимает много раз дольше (десятки наносекунд в лучшем случае - по-прежнему быстро, но, очевидно, совсем немного медленнее, чем кэш L1).
Графические процессоры также имеют немного локализованную памяти, просто не очень много. Я предполагаю, что это изменится в будущем - в 7970 уже использует блестящий 768kB кэш L2 (это не совсем соответствует уровням процессора, достаточно сказать, что это намного быстрее, чем GPU представляемого биты и обратно внешний ( на чип) на карте памяти).
Так что даже если есть меньше памяти и меньше параллельной обработки, сама обработка может быть сделано намного быстрее.
Имейте в виду, я говорю теоретический - все, что я знаю GridSeed нашел некоторые фактические оптимизации (а).