Я интересуюсь, насколько эффективно можно использовать АЛУ на карте и сделал некоторые расчеты:
Учитывая цикл SHA256 имеются следующие вещи там:
Операции:
1 нет, 5 и 7 XOR
6 вращения на 2, 13, 22 и 6, 11, 25
составляет 19
32-битных слов. (Регистр доступа)
5 А, 2 В, 5 Е, 1 М, 1, G
составляет 14
4 дополнения, 2 LUT получает доступ
8 Доступ к памяти, 2 дополнительных дополнений
составляет 16
---------
49 всего
работать в 64 раза
------
3136 cylces
5970 с 3200 АЛУ:
3200 * 725/3136 = 739,795918 Mhash
Является ли это вычисление правильно или есть более / менее сделано на GPU?
Поскольку в соответствии с этим использованием кода будет почти оптимальными, что делает претензии удивительных оптимизаций сомнительны, (запись ArtForz на вики для экс ...)