У меня есть компьютер с 2 ATI Radeon HD 5870. У меня есть вещи и работает, но OpenCL может видеть только один GPU, а не оба.
Я установил Ubuntu 11.04 Натти нарвала, и я установил драйвер fglrx (8.840) и SDK AMD APP (2.4), встроенный pyopencl и успешно работать poclbm на одном GPU, а также на процессоре (хотя cpuminer jgarzik игрового был намного быстрее на процессоре с использованием sse2_64).
Кто-нибудь есть какие-либо идеи, что мне нужно сделать, чтобы получить как минирование карты?
Утилита lspci показывает обе карты:
Код:
04: 00,0 VGA совместимый контроллер: ATI Technologies Inc Radeon HD 5870 (Cypress)
09: 00,0 VGA совместимый контроллер: ATI Technologies Inc Radeon HD 5870 (Cypress)
09: 00,0 VGA совместимый контроллер: ATI Technologies Inc Radeon HD 5870 (Cypress)
Я устанавливал обе карты в xorg.conf:
Код:
Раздел "устройство"
Идентификатор "radeon0"
Водитель "fglrx"
BusID "PCI: 9: 0: 0"
EndSection
Раздел "устройство"
Идентификатор "radeon1"
Водитель "fglrx"
BusID "PCI: 4: 0: 0"
EndSection
Идентификатор "radeon0"
Водитель "fglrx"
BusID "PCI: 9: 0: 0"
EndSection
Раздел "устройство"
Идентификатор "radeon1"
Водитель "fglrx"
BusID "PCI: 4: 0: 0"
EndSection
и X запускается нормально, но clinfo (в комплекте с AMD APP SDK) просто показывает GPU и CPU:
Код:
Количество платформ: 1
Платформа профиля: FULL_PROFILE
Версия платформы: OpenCL 1.1 AMD-APP-SDK-v2.4 (595,10)
Имя платформы: AMD Accelerated Parallel Processing
Платформа Производитель: Advanced Micro Devices, Inc.
Платформа расширения: cl_khr_icd cl_amd_event_callback cl_amd_offline_devices
Имя платформы: AMD Accelerated Parallel Processing
Количество устройств: 2
Тип устройства: CL_DEVICE_TYPE_GPU
Идентификатор устройства: 4098
Максимальное количество вычислительных блоков: 20
Макс рабочие элементы размеры: 3
Max элементы работы [0]: 256
Макс рабочие элементы [1]: 256
Макс рабочие элементы [2]: 256
Максимальный размер рабочей группы: 256
Предпочтительный вектор ширина символ: 16
Предпочтительный вектор ширина короче: 8
Предпочтительный вектор ширина INT: 4
Предпочтительный вектор ширин пор: 2
Предпочтительный вектор ширина поплавок: 4
Предпочтительный вектор ширин двойной: 0
Родной вектор ширина символ: 16
Native вектор ширина короче: 8
Native вектор ширина ИНТ: 4
Native вектор ширина долго: 2
Родной вектор ширина поплавка: 4
Native вектор удвоенная ширина: 0
Максимальная тактовая частота: 850MHz
Биты адреса: 32
Максимальное выделение памяти: 134217728
Поддержка изображения: да
Максимальное количество изображений чтения аргументов: 128
Максимальное количество изображений написать аргументы: 8
Max 2D-изображение ширина: 8192
Max 2D-изображение высота: 8192
Макс изображение 3D ширина: 2048
Max изображение 3D высота: 2048
Максимальная глубина изображения 3D: 2048
Max пробоотборники в ядре: 16
Максимальный размер аргумента ядра: 1024
Выравнивание (биты) базовый адрес: 32768
Минимальное выравнивание (в байтах) для любого типа данных: 128
Возможность с плавающей точкой одинарной точности
Denorms: нет
Тихие NaNs: да
Округление до ближайшего четного: да
Округление до нуля: да
Округление до + ве и бесконечность: да
IEEE754-2008 слиты умножения-сложения: да
Кэш-тип: Никто
Размер кэша строки: 0
Размер кэша: 0
Глобальный объем памяти: 536870912
Постоянный размер буфера: 65536
Максимальное количество постоянных аргументов: 8
Локальный тип памяти: блокнот
Локальный объем памяти: 32768
Ядро Предпочтительный размер рабочей группы несколько: 64
Поддержка коррекции ошибок: 0
Унифицированная памяти хоста и устройства: 0
Профилирование разрешения таймера: 1
Устройство порядок байтов: маленький
Доступный: да
Компилятор доступен: да
Возможности исполнения:
Выполнить OpenCL ядра: да
Execute родной функции: нет
Свойства очереди:
Вышел из строя: нет
Профилирование: да
Платформа ID: 0x7f1b34e26800
Имя: кипарис
Производитель: Advanced Micro Devices, Inc.
Версия драйвера: CAL 1.4.1353
Профиль: FULL_PROFILE
Версия: OpenCL 1.1 AMD-APP-SDK-v2.4 (595,10)
Расширения: cl_amd_fp64 cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_3d_image_writes cl_khr_byte_addressable_store cl_khr_gl_sharing cl_amd_device_attribute_query cl_amd_printf cl_amd_media_ops cl_amd_popcnt
Тип устройства: CL_DEVICE_TYPE_CPU
Идентификатор устройства: 4098
Максимальное количество вычислительных блоков: 6
Макс рабочие элементы размеры: 3
Max элементы работы [0]: 1024
Макс рабочие элементы [1]: 1024
Макс рабочие элементы [2]: 1024
Максимальный размер рабочей группы: 1024
Предпочтительный вектор ширина символ: 16
Предпочтительный вектор ширина короче: 8
Предпочтительный вектор ширина INT: 4
Предпочтительный вектор ширин пор: 2
Предпочтительный вектор ширина поплавок: 4
Предпочтительный вектор ширин двойной: 0
Родной вектор ширина символ: 16
Native вектор ширина короче: 8
Native вектор ширина ИНТ: 4
Native вектор ширина долго: 2
Родной вектор ширина поплавка: 4
Native вектор удвоенная ширина: 0
Максимальная тактовая частота: 800Mhz
Биты адреса: 64
Максимальное выделение памяти: 2147483648
Поддержка изображения: да
Максимальное количество изображений чтения аргументов: 128
Максимальное количество изображений написать аргументы: 8
Max 2D-изображение ширина: 8192
Max 2D-изображение высота: 8192
Макс изображение 3D ширина: 2048
Max изображение 3D высота: 2048
Максимальная глубина изображения 3D: 2048
Max пробоотборники в ядре: 16
Максимальный размер аргумента ядра: 4096
Выравнивание (биты) базовый адрес: 1024
Минимальное выравнивание (в байтах) для любого типа данных: 128
Возможность с плавающей точкой одинарной точности
Denorms: да
Тихие NaNs: да
Округление до ближайшего четного: да
Округление до нуля: да
Округление до + ве и бесконечность: да
IEEE754-2008 слиты умножения-сложения: нет
Кэш-тип: Читай пиши
Размер кэша строки: 64
Размер кэша: 65536
Глобальный объем памяти: 8388317184
Постоянный размер буфера: 65536
Максимальное количество постоянных аргументов: 8
Локальный тип памяти: Глобальный
Локальный объем памяти: 32768
Ядро Предпочтительный размер рабочей группы несколько: 1
Поддержка коррекции ошибок: 0
Унифицированная памяти хоста и устройства: 1
Профилирование разрешения таймера: 1
Устройство порядок байтов: маленький
Доступный: да
Компилятор доступен: да
Возможности исполнения:
Выполнить OpenCL ядра: да
Execute родной функции: да
Свойства очереди:
Вышел из строя: нет
Профилирование: да
Платформа ID: 0x7f1b34e26800
Имя: AMD Phenom (TM) II X6 1055T Processor
Производитель: AuthenticAMD
Версия драйвера: 2,0
Профиль: FULL_PROFILE
Версия: OpenCL 1.1 AMD-APP-SDK-v2.4 (595,10)
Расширения: cl_khr_fp64 cl_amd_fp64 cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_int64_base_atomics cl_khr_int64_extended_atomics cl_khr_byte_addressable_store cl_khr_gl_sharing cl_ext_device_fission cl_amd_device_attribute_query cl_amd_vec3 cl_amd_media_ops cl_amd_popcnt cl_amd_printf
Платформа профиля: FULL_PROFILE
Версия платформы: OpenCL 1.1 AMD-APP-SDK-v2.4 (595,10)
Имя платформы: AMD Accelerated Parallel Processing
Платформа Производитель: Advanced Micro Devices, Inc.
Платформа расширения: cl_khr_icd cl_amd_event_callback cl_amd_offline_devices
Имя платформы: AMD Accelerated Parallel Processing
Количество устройств: 2
Тип устройства: CL_DEVICE_TYPE_GPU
Идентификатор устройства: 4098
Максимальное количество вычислительных блоков: 20
Макс рабочие элементы размеры: 3
Max элементы работы [0]: 256
Макс рабочие элементы [1]: 256
Макс рабочие элементы [2]: 256
Максимальный размер рабочей группы: 256
Предпочтительный вектор ширина символ: 16
Предпочтительный вектор ширина короче: 8
Предпочтительный вектор ширина INT: 4
Предпочтительный вектор ширин пор: 2
Предпочтительный вектор ширина поплавок: 4
Предпочтительный вектор ширин двойной: 0
Родной вектор ширина символ: 16
Native вектор ширина короче: 8
Native вектор ширина ИНТ: 4
Native вектор ширина долго: 2
Родной вектор ширина поплавка: 4
Native вектор удвоенная ширина: 0
Максимальная тактовая частота: 850MHz
Биты адреса: 32
Максимальное выделение памяти: 134217728
Поддержка изображения: да
Максимальное количество изображений чтения аргументов: 128
Максимальное количество изображений написать аргументы: 8
Max 2D-изображение ширина: 8192
Max 2D-изображение высота: 8192
Макс изображение 3D ширина: 2048
Max изображение 3D высота: 2048
Максимальная глубина изображения 3D: 2048
Max пробоотборники в ядре: 16
Максимальный размер аргумента ядра: 1024
Выравнивание (биты) базовый адрес: 32768
Минимальное выравнивание (в байтах) для любого типа данных: 128
Возможность с плавающей точкой одинарной точности
Denorms: нет
Тихие NaNs: да
Округление до ближайшего четного: да
Округление до нуля: да
Округление до + ве и бесконечность: да
IEEE754-2008 слиты умножения-сложения: да
Кэш-тип: Никто
Размер кэша строки: 0
Размер кэша: 0
Глобальный объем памяти: 536870912
Постоянный размер буфера: 65536
Максимальное количество постоянных аргументов: 8
Локальный тип памяти: блокнот
Локальный объем памяти: 32768
Ядро Предпочтительный размер рабочей группы несколько: 64
Поддержка коррекции ошибок: 0
Унифицированная памяти хоста и устройства: 0
Профилирование разрешения таймера: 1
Устройство порядок байтов: маленький
Доступный: да
Компилятор доступен: да
Возможности исполнения:
Выполнить OpenCL ядра: да
Execute родной функции: нет
Свойства очереди:
Вышел из строя: нет
Профилирование: да
Платформа ID: 0x7f1b34e26800
Имя: кипарис
Производитель: Advanced Micro Devices, Inc.
Версия драйвера: CAL 1.4.1353
Профиль: FULL_PROFILE
Версия: OpenCL 1.1 AMD-APP-SDK-v2.4 (595,10)
Расширения: cl_amd_fp64 cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_3d_image_writes cl_khr_byte_addressable_store cl_khr_gl_sharing cl_amd_device_attribute_query cl_amd_printf cl_amd_media_ops cl_amd_popcnt
Тип устройства: CL_DEVICE_TYPE_CPU
Идентификатор устройства: 4098
Максимальное количество вычислительных блоков: 6
Макс рабочие элементы размеры: 3
Max элементы работы [0]: 1024
Макс рабочие элементы [1]: 1024
Макс рабочие элементы [2]: 1024
Максимальный размер рабочей группы: 1024
Предпочтительный вектор ширина символ: 16
Предпочтительный вектор ширина короче: 8
Предпочтительный вектор ширина INT: 4
Предпочтительный вектор ширин пор: 2
Предпочтительный вектор ширина поплавок: 4
Предпочтительный вектор ширин двойной: 0
Родной вектор ширина символ: 16
Native вектор ширина короче: 8
Native вектор ширина ИНТ: 4
Native вектор ширина долго: 2
Родной вектор ширина поплавка: 4
Native вектор удвоенная ширина: 0
Максимальная тактовая частота: 800Mhz
Биты адреса: 64
Максимальное выделение памяти: 2147483648
Поддержка изображения: да
Максимальное количество изображений чтения аргументов: 128
Максимальное количество изображений написать аргументы: 8
Max 2D-изображение ширина: 8192
Max 2D-изображение высота: 8192
Макс изображение 3D ширина: 2048
Max изображение 3D высота: 2048
Максимальная глубина изображения 3D: 2048
Max пробоотборники в ядре: 16
Максимальный размер аргумента ядра: 4096
Выравнивание (биты) базовый адрес: 1024
Минимальное выравнивание (в байтах) для любого типа данных: 128
Возможность с плавающей точкой одинарной точности
Denorms: да
Тихие NaNs: да
Округление до ближайшего четного: да
Округление до нуля: да
Округление до + ве и бесконечность: да
IEEE754-2008 слиты умножения-сложения: нет
Кэш-тип: Читай пиши
Размер кэша строки: 64
Размер кэша: 65536
Глобальный объем памяти: 8388317184
Постоянный размер буфера: 65536
Максимальное количество постоянных аргументов: 8
Локальный тип памяти: Глобальный
Локальный объем памяти: 32768
Ядро Предпочтительный размер рабочей группы несколько: 1
Поддержка коррекции ошибок: 0
Унифицированная памяти хоста и устройства: 1
Профилирование разрешения таймера: 1
Устройство порядок байтов: маленький
Доступный: да
Компилятор доступен: да
Возможности исполнения:
Выполнить OpenCL ядра: да
Execute родной функции: да
Свойства очереди:
Вышел из строя: нет
Профилирование: да
Платформа ID: 0x7f1b34e26800
Имя: AMD Phenom (TM) II X6 1055T Processor
Производитель: AuthenticAMD
Версия драйвера: 2,0
Профиль: FULL_PROFILE
Версия: OpenCL 1.1 AMD-APP-SDK-v2.4 (595,10)
Расширения: cl_khr_fp64 cl_amd_fp64 cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_int64_base_atomics cl_khr_int64_extended_atomics cl_khr_byte_addressable_store cl_khr_gl_sharing cl_ext_device_fission cl_amd_device_attribute_query cl_amd_vec3 cl_amd_media_ops cl_amd_popcnt cl_amd_printf