Вернуться   Биткоин Форум > Разработка и Техническое Обсуждение
15 августа 2010, 3:52:09 PM   # 1
 
 
Сообщения: 364
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Взлом Биткоин адресов.
500 Биткоинов взломаны в "мозговом кошельке" с паролем "bitcoin is awesome"
Адрес кошелька: 14NWDXkQwcGN1Pd9fboL8npVynD5SfyJAE
Приватный ключ: 5J64pq77XjeacCezwmAr2V1s7snvvJkuAz8sENxw7xCkikceV6e
подробнее...


Всем кто хочет заработать Биткоины без вложений - рекомендую сайт http://bitcoin-zarabotat.ru
0.3.10 имеет 4-полосную SSE2 tcatm в качестве переключателя опций.

С помощью переключателя "-4way" включить это. Без переключателя вы получаете Crypto ++ ASM SHA-256.

Я мог только получить эту работу с Linux.

Скачать:
Получить 0.3.10 от http://bitcointalk.org/index.php?topic=827.0

Пожалуйста, доложите ваш процессор и результаты! Я думаю, что это довольно ясно, что Core 2 и ниже, медленнее, i5 быстрее. Я не думаю, что мы уже слышали никаких результатов i7 пока. Мы должны знать о различных моделях AMD или других менее распространенных процессоров.
Satoshi сейчас офлайн Пожаловаться на Satoshi   Ответить с цитированием Мультицитирование сообщения от Satoshi Быстрый ответ на сообщение Satoshi


Как заработать Биткоины?
Без вложений. Не майнинг.


15 августа 2010, 5:02:16 PM   # 2
 
 
Сообщения: 322
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Получил 1806 Биткоинов
Реальная история.





Я сделал быстрый тест, доложит, когда я пытаюсь его на несколько машин.

Pentium E5300 Dual-Core 2,6 ГГц (кэш 2 Мб, FSB 800 МГц)
Информация Процессор: http://en.wikipedia.org/wiki/Wolfdale_%28microprocessor%29
Фото = 2261 хаш / s
4-полосная = 1103 Хаш / с (64 бит)

Pentium 4 - 3,0 ГГц (Hyper-Threading выключена) 1MB Cache, FSB 800MHz
Информация Процессор: http://en.wikipedia.org/wiki/NetBurst_%28microarchitecture%29
Сток = 1024 Хаш / с (32 бит)
4-полосная = 658 Хаш / с (32 бит)

Pentium 4 - 2,8 ГГц (Hyper-Threading выключена) 1MB Cache, FSB 800MHz
Информация Процессор: http://en.wikipedia.org/wiki/NetBurst_%28microarchitecture%29
Сток = 917 Хаш / с (64 бит)
4-полосная = 747 Хаш / с (64 бит)


Если бы я не знал лучше, я бы сказал, что ключ является размером кэша процессора. Кажется, все, что процессор работать медленнее, имеют 2 Мб или меньше на борту кэш, где, как Core i5 начинается с, по меньшей мере, 3 МБ встроенной кэш-памяти процессора.
knightmb сейчас офлайн Пожаловаться на knightmb   Ответить с цитированием Мультицитирование сообщения от knightmb Быстрый ответ на сообщение knightmb

15 августа 2010, 6:23:26 PM   # 3
 
 
Сообщения: 364
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Я надеюсь, что кто-то может испытать i5 или AMD, чтобы проверить, что я построил это право. У меня нет ни испытать с.

Я также интересно, если он выполняет гораздо хуже, на 32-битной Linux против 64-бит.
Satoshi сейчас офлайн Пожаловаться на Satoshi   Ответить с цитированием Мультицитирование сообщения от Satoshi Быстрый ответ на сообщение Satoshi

15 августа 2010, 6:26:40 PM   # 4
 
 
Сообщений: 61
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Где код для этого? Я на поле CentOS 5.5 и нужно построить его самостоятельно. После того, как я могу это сделать, я доложу с Linux 32-битным и кэшем 1 Мб Xeon.
sgtstein сейчас офлайн Пожаловаться на sgtstein   Ответить с цитированием Мультицитирование сообщения от sgtstein Быстрый ответ на сообщение sgtstein

15 августа 2010, 6:43:27 PM   # 5
 
 
Сообщения: 364
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Я только что загрузил быстро построить так тестеры можно проверить, если я построил это право. (У меня нет i5 или AMD) Если он проверяет, я вместе взятые полный пакет и сделать все вещи выпуска.
Satoshi сейчас офлайн Пожаловаться на Satoshi   Ответить с цитированием Мультицитирование сообщения от Satoshi Быстрый ответ на сообщение Satoshi

15 августа 2010, 6:46:25 PM   # 6
 
 
Сообщений: 61
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Хорошо, имеет смысл. У меня i7 930 Постараюсь и проверить слишком.
sgtstein сейчас офлайн Пожаловаться на sgtstein   Ответить с цитированием Мультицитирование сообщения от sgtstein Быстрый ответ на сообщение sgtstein

15 августа 2010, 9:50:41 PM   # 7
 
 
Сообщения: 337
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Если бы я не знал лучше, я бы сказал, что ключ является размером кэша процессора. Кажется, все, что процессор работать медленнее, имеют 2 Мб или меньше на борту кэш, где, как Core i5 начинается с, по меньшей мере, 3 МБ встроенной кэш-памяти процессора.

Это маловероятно. Цикл получает доступ к 432 байт данных. Это должно вписываться в большинстве кэшей.
tcatm сейчас офлайн Пожаловаться на tcatm   Ответить с цитированием Мультицитирование сообщения от tcatm Быстрый ответ на сообщение tcatm

15 августа 2010, 11:49:40 PM   # 8
 
 
Сообщения: 112
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

5911 хаш с -4way
11260 без
(Dual Xeon E5450, 64-бит, 8 потоков)
Контур заземления сейчас офлайн Пожаловаться Петля на Ground   Ответить с цитированием Мультицитирование сообщения от контура заземления Быстрый ответ на сообщение Ground Loop

16 августа 2010, 12:03:18 AM   # 9
 
 
Сообщения: 337
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

-4way: 12518 хаш / с
без: 6550 Хаш / с

Это немного медленнее, чем мой патч (~ 14000kash / с).

Редактирование: Я побежал бинарник на старой AMD Athlon (TM) 64 X2 Dual Core Processor 4200+ с тем же эффектом, мы видим на старых процессорах Intel:
-4way: 1120khash / с
без: 2012khash / s
tcatm сейчас офлайн Пожаловаться на tcatm   Ответить с цитированием Мультицитирование сообщения от tcatm Быстрый ответ на сообщение tcatm

16 августа 2010, 12:08:38 AM   # 10
 
 
Сообщения: 337
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Кто-нибудь проверить это, чтобы произвести правильные результаты на 32 битных хостов?
tcatm сейчас офлайн Пожаловаться на tcatm   Ответить с цитированием Мультицитирование сообщения от tcatm Быстрый ответ на сообщение tcatm

16 августа 2010, 12:32:57 AM   # 11
 
 
Сообщений: 16
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Запуск 32-разрядной Linux на AMD Athlon 64 X2, я получаю следующие результаты:

  нормальный: 2850 хаш / с
  с -4way: 1708 Хаш / с

Я не проверял, если хэши правильны, только скорость.
Геблер сейчас офлайн Пожаловаться на Геблер   Ответить с цитированием Мультицитирование сообщения от Геблер Быстрый ответ на сообщение Геблер

16 августа 2010, 12:37:54 AM   # 12
 
 
Сообщения: 132
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Я создал страницу вики, чтобы мы могли следить за результатами: http://www.bitcoin.org/wiki/doku.php?id=4-way_sse2
aceat64 сейчас офлайн Пожаловаться на aceat64   Ответить с цитированием Мультицитирование сообщения от aceat64 Быстрый ответ на сообщение aceat64

16 августа 2010, 12:43:39 AM   # 13
 
 
Сообщения: 337
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Я предлагаю составить sha256.cpp с -O3 -march = amdfamk10 (будет работать на 32-битной и 64-битной), как только процессоры с поддержкой этого набора команд (AMD Phenom, Intel i5 и выше) выгоды от -4way, и это будет улучшить производительность ~ 9%.
tcatm сейчас офлайн Пожаловаться на tcatm   Ответить с цитированием Мультицитирование сообщения от tcatm Быстрый ответ на сообщение tcatm

16 августа 2010, 12:47:23 AM   # 14
 
 
Сообщения: 2660
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Я предлагаю составить sha256.cpp с -O3 -march = amdfamk10 (будет работать на 32-битной и 64-битной), как только процессоры с поддержкой этого набора команд (AMD Phenom, Intel i5 и выше) выгоды от -4way, и это будет улучшить производительность ~ 9%.
Хорошо
Будет ли это работать на ОС Windows?
HostFat сейчас офлайн Пожаловаться на HostFat   Ответить с цитированием Мультицитирование сообщения от HostFat Быстрый ответ на сообщение HostFat

16 августа 2010, 12:50:04 AM   # 15
 
 
Сообщения: 337
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Я предлагаю составить sha256.cpp с -O3 -march = amdfamk10 (будет работать на 32-битной и 64-битной), как только процессоры с поддержкой этого набора команд (AMD Phenom, Intel i5 и выше) выгоды от -4way, и это будет улучшить производительность ~ 9%.
Хорошо
Будет ли это работать на ОС Windows?
Не пробовал, но CFLAGS не зависимые от ОС на всех, так что я думаю, что это будет работать.
tcatm сейчас офлайн Пожаловаться на tcatm   Ответить с цитированием Мультицитирование сообщения от tcatm Быстрый ответ на сообщение tcatm

16 августа 2010, 1:49:01 AM   # 16
 
 
Сообщения: 252
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Я создал страницу вики, чтобы мы могли следить за результатами: http://www.bitcoin.org/wiki/doku.php?id=4-way_sse2
Вы можете добавить столбцы, включен ли Hyper-Threading, количество физических ядер и сколько ядер Bitcoin используют. Без 4way, я получаю очень немного лучше результаты, когда у меня половина моего виртуального ядер хэширования. С 4way, я получаю значительно более высокую производительность, когда я позволил всем моим виртуальным ядра. Я думаю, что я получаю примерно такое же количество хэш, когда Hyper-Threading отключен или без 4way.
NewLibertyStandard сейчас офлайн Пожаловаться на NewLibertyStandard   Ответить с цитированием Мультицитирование сообщения от NewLibertyStandard Быстрый ответ на сообщение NewLibertyStandard

16 августа 2010, 2:13:28 AM   # 17
 
 
Сообщения: 132
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Я создал страницу вики, чтобы мы могли следить за результатами: http://www.bitcoin.org/wiki/doku.php?id=4-way_sse2
Вы можете добавить столбцы, включен ли Hyper-Threading, количество физических ядер и сколько ядер Bitcoin используют. Без 4way, я получаю очень немного лучше результаты, когда у меня половина моего виртуального ядер хэширования. С 4way, я получаю значительно более высокую производительность, когда я позволил всем моим виртуальным ядра. Я думаю, что я получаю примерно такое же количество хэш, когда Hyper-Threading отключен или без 4way.

Я обновил страницу с вашими предложениями, я также добавил сноски объяснить некоторые из полей.
aceat64 сейчас офлайн Пожаловаться на aceat64   Ответить с цитированием Мультицитирование сообщения от aceat64 Быстрый ответ на сообщение aceat64

16 августа 2010, 2:30:52 AM   # 18
 
 
Сообщения: 1484
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10


Мои -4way результаты: медленнее два старших коробки, быстрее для нового.


("название модели" происходит от системы Linux / Proc / CPUInfo, который подчиняется непосредственно от процессора)

1) Название модели Intel (R) Pentium (R) D CPU 3,00 ГГц

Всего ядер: 2
без -4way: 0,999 Mhash / сек
с -4way: 0,850 Mhash / сек

2) Название модели: Dual Core AMD Opteron (TM) Процессор 280

Всего ядер: 4
без -4way: 4.6 Mhash / сек
с -4way: 4,0 Mhash / сек

3) название модели: Подлинная Intel (R) CPU 000 @ 3.20GHz

Всего ядер: 4
без -4way: 5,7 Mhash / сек
с -4way: 7.0 Mhash / сек

jgarzik сейчас офлайн Пожаловаться на jgarzik   Ответить с цитированием Мультицитирование сообщения от jgarzik Быстрый ответ на сообщение jgarzik

16 августа 2010, 2:57:57 AM   # 19
 
 
Сообщения: 364
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Я предлагаю составить sha256.cpp с -O3 -march = amdfamk10 (будет работать на 32-битной и 64-битной), как только процессоры с поддержкой этого набора команд (AMD Phenom, Intel i5 и выше) выгоды от -4way, и это будет улучшить производительность ~ 9%.
GCC 4.3.3 не поддерживает -march = amdfamk10. Я получил:
sha256.cpp: 1: ошибка: плохое значение (amdfamk10) для -march = переключатель


С 4way, я получаю значительно более высокую производительность, когда я позволил всем моим виртуальным ядра. Я думаю, что я получаю примерно такое же количество хэш, когда Hyper-Threading отключен или без 4way.
Эй, вы можете быть на что-то!

гиперпотоковый не помог раньше, потому что вся работа была в арифметических и логических блоках, которые разделяют hyperthreads.

SSE2 код tcatm должен быть сочетание нормальных x86 инструкций и инструкций SSE2, поэтому в то время как один делает код x86, другой может сделать SSE2.

Сколько улучшения вы получаете с гиперпоточностью?

Некоторые номера? Что CPU это?
Satoshi сейчас офлайн Пожаловаться на Satoshi   Ответить с цитированием Мультицитирование сообщения от Satoshi Быстрый ответ на сообщение Satoshi

16 августа 2010, 3:10:34 AM   # 20
 
 
Сообщения: 196
Цитировать по имени
цитировать ответ
по умолчанию Re: 4-полосная tcatm в SSE2 для Linux 32/64-бит в 0.3.10

Название модели: AMD Phenom (TM) II X4 940 Процессор на 3,0 ГГц Linux, 64

с -4way     "hashespersec" : 11132770

без      "hashespersec" : 5877668

ЛЧМ сейчас офлайн Пожаловаться на ЛОМ   Ответить с цитированием Мультицитирование сообщения от ЛОГО Быстрый ответ на сообщение ЛЧМ



Как заработать Биткоины?

Bitcoin Wallet * Portefeuille Bitcoin * Monedero Bitcoin * Carteira Bitcoin * Portafoglio Bitcoin * Bitcoin Cüzdan * 比特币钱包

bitcoin-zarabotat.ru
Почта для связи: bitcoin-zarabotat.ru@yandex.ru

3HmAQ9FkRFk6HZGuwExYxL62y7C1B9MwPW