Я рассматриваю возможность сделать массив пользовательского ПЛИСА шахтеров, и из моего исследования, кажется, акцент делается на том, операцию (2xSHA2) в качестве несколько тактов. Как я вижу это, это торговля между числом логических блоков, используемых и тактовых циклов, чтобы сделать одну полную операцию, добавил к тому, что цена на чип, который имеет достаточно логических блоков, чтобы иметь полностью развернутую (и конвейерный) дизайн.
Я хотел бы кто-нибудь объяснить, почему это не так просто, как полезно НЕ раскатать и НЕ трубопровод он, вместо того, чтобы сделать наименьшую возможную версию (петельные версии только с одним ядром SHA2) и повторять его много много раз в FPGA, так что с массовым параллелизмом и не нужны более дорогие чипы, но вместо этого может быть сделано во многих более дешевых. как это не вопрос о том, сколько часов циклов это занимает больше, сколько операций может быть сделано в определенное время, например, если она занимает сотую часть времени в развернутом варианте, но это в 100 раз больше, то с 100 из они будут делать столько хэшей.
Вы можете подумать, что я глуп, но я понимаю.
Рассмотрим этот простой пример:
что вы сделать развернутое ядро SHA2, то ему необходимо будет дважды бежать, но это в два раза больше, поэтому 1x 2 разворачивают сердечники SHA2 присоединились, чтобы сделать это за один раз, равен 2x один развернутые SHA2 ядер делают их петельными.
в основном я рассматриваю сделать очень небольшие (логические блоки, используемых) блок, который может быть повторен много и много ПВМ могут быть сделаны в массивный массив, обработка многих хэш сразу, но медленнее.
объяснение того, что я Мессинг в моей математике \ понимание было бы хорошо