Российские распределенные вычисления на платформе BOINC
Форум участников распределённых вычислений.

Добро пожаловать, Гость! Чтобы использовать все возможности Вход или Регистрация.

Уведомление

Icon
Error

2 Страницы12>
Опции
К последнему сообщению К первому непрочитанному
Offline evatutin  
#1 Оставлено : 11 июля 2013 г. 22:35:41(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,642
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 1024 раз
Поблагодарили: 1827 раз в 886 постах
http://evatutin.narod.ru...in_GPU_bandwidth_test.7z

Программа измеряет пропускную способность памяти (и, скорее всего, интерфейса PCI-E) видеокарт с поддержкой CUDA. Если не сложно, погоняйте на своих машинах с постингом результатов сюда. Интересно посмотреть, насколько реальные цифры будут отличаться друг от друга.

Заранее спасибо Present

PS. На время тестирования (это порядка 10-20 секунд) желательно приостановить BOINC и другие интенсивно работающие приложения (например, uTorrent), т.к. они здорово занижают получающиеся цифры

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Offline sagip  
#2 Оставлено : 11 июля 2013 г. 22:54:35(UTC)
sagip


Статус: Я тут не впервой

Медали: Донор: За финансовую помощь сайту

Группы: Member, Russia Team Group
Зарегистрирован: 12.09.2010(UTC)
Сообщений: 31
Мужчина

Сказал «Спасибо»: 47 раз
Поблагодарили: 6 раз в 5 постах
CUDA memory bandwidth test (block size = 100 MB)
(c) Eduard I. Vatutin
WWW: http://evatutin.narod.ru
e-mail: evatutin@rambler.ru
ICQ: 203-229-391

1 CUDA device(s) found

GPU 0: GeForce GTX 570

RAM allocating... OK
GPU global RAM allocating... OK

Copying Host -> Device
Average bandwidth = 2.27208 GB/s

Copying Device -> Host
Average bandwidth = 2.37551 GB/s

RAM allocating... OK

Copying Host -> Host
Average bandwidth = 3.1596 GB/s

GPU global RAM allocating... OK

Copying Device -> Device
Average bandwidth = 39.3305 GB/s

Copying Host -> Device (using page-locked)
Average bandwidth = 3.35656 GB/s

Copying Device -> Host (using page-locked)
Average bandwidth = 3.68751 GB/s

Done
i7-920 3.0ГГц (шина 146МГц)

Отредактировано пользователем 12 июля 2013 г. 22:48:49(UTC)  | Причина: Не указана

thanks 1 пользователь поблагодарил sagip за этот пост.
evatutin оставлено 12.07.2013(UTC)
Offline slepojpju  
#3 Оставлено : 12 июля 2013 г. 0:10:51(UTC)
slepojpju


Статус: Старожил

Медали: Донор: За финансовую помощь сайту

Группы: Moderator "St.Petersburg", Member
Зарегистрирован: 23.10.2010(UTC)
Сообщений: 766
Мужчина
Откуда: Ленинград. Город герой.

Сказал «Спасибо»: 48 раз
Поблагодарили: 80 раз в 53 постах
CUDA memory bandwidth test (block size = 100 MB)
(c) Eduard I. Vatutin
WWW: http://evatutin.narod.ru
e-mail: evatutin@rambler.ru
ICQ: 203-229-391

1 CUDA device(s) found

GPU 0: GeForce GTX 250

RAM allocating... OK
GPU global RAM allocating... OK

Copying Host -> Device
Average bandwidth = 0.742203 GB/s

Copying Device -> Host
Average bandwidth = 0.731027 GB/s

RAM allocating... OK

Copying Host -> Host
Average bandwidth = 1.02263 GB/s

GPU global RAM allocating... OK

Copying Device -> Device
Average bandwidth = 9.44014 GB/s

Copying Host -> Device (using page-locked)
Average bandwidth = 1.11236 GB/s

Copying Device -> Host (using page-locked)
Average bandwidth = 1.10375 GB/s

Done

Кто людям помогает, тот тратит время зря.
ХА-ХА.
Хорошими делами, прославиться нельзя.
UserPostedImage
thanks 1 пользователь поблагодарил slepojpju за этот пост.
evatutin оставлено 12.07.2013(UTC)
Offline xpom  
#4 Оставлено : 12 июля 2013 г. 3:19:08(UTC)
xpom


Статус: Давно уж тут

Группы: Member
Зарегистрирован: 24.02.2012(UTC)
Сообщений: 313
Мужчина
Российская Федерация

Сказал «Спасибо»: 25 раз
Поблагодарили: 54 раз в 36 постах
CUDA memory bandwidth test (block size = 100 MB)
(c) Eduard I. Vatutin
WWW: http://evatutin.narod.ru
e-mail: evatutin@rambler.ru
ICQ: 203-229-391

1 CUDA device(s) found

GPU 0: GeForce GTX 560

RAM allocating... OK
GPU global RAM allocating... OK

Copying Host -> Device
Average bandwidth = 2.28972 GB/s

Copying Device -> Host
Average bandwidth = 2.32664 GB/s

RAM allocating... OK

Copying Host -> Host
Average bandwidth = 3.98409 GB/s

GPU global RAM allocating... OK

Copying Device -> Device
Average bandwidth = 26.8138 GB/s

Copying Host -> Device (using page-locked)
Average bandwidth = 3.24617 GB/s

Copying Device -> Host (using page-locked)
Average bandwidth = 3.29835 GB/s

Done

Неплохо бы вы прогу добавить вывод результатов в файл.
thanks 1 пользователь поблагодарил xpom за этот пост.
evatutin оставлено 12.07.2013(UTC)
Offline TechnoID  
#5 Оставлено : 12 июля 2013 г. 4:29:02(UTC)
TechnoID


Статус: Давно уж тут

Группы: Member, Crystal Dream Group
Зарегистрирован: 13.01.2011(UTC)
Сообщений: 491
Мужчина
Откуда: Хабаровский край

Сказал «Спасибо»: 44 раз
Поблагодарили: 127 раз в 76 постах
1 CUDA device(s) found

GPU 0: GeForce GTX 550 Ti

RAM allocating... OK
GPU global RAM allocating... OK

Copying Host -> Device
Average bandwidth = 1.94316 GB/s

Copying Device -> Host
Average bandwidth = 2.0475 GB/s

RAM allocating... OK

Copying Host -> Host
Average bandwidth = 2.8584 GB/s

GPU global RAM allocating... OK

Copying Device -> Device
Average bandwidth = 17.2191 GB/s

Copying Host -> Device (using page-locked)
Average bandwidth = 3.09265 GB/s

Copying Device -> Host (using page-locked)
Average bandwidth = 3.10362 GB/s

Done
UserPostedImage
thanks 1 пользователь поблагодарил TechnoID за этот пост.
evatutin оставлено 12.07.2013(UTC)
Offline Step  
#6 Оставлено : 12 июля 2013 г. 6:10:15(UTC)
Step


Статус: Старожил

Медали: Донор: За финансовую помощь сайту

Группы: Member
Зарегистрирован: 03.08.2010(UTC)
Сообщений: 916
Мужчина
Российская Федерация
Откуда: г. Кирово-Чепецк

Сказал «Спасибо»: 288 раз
Поблагодарили: 236 раз в 165 постах
CUDA нет, потестить не могу. sad
А принцип работы теста не расскажете? Что он там куда копирует? Какие другие части компа при этом задействуются? Как сильно влияют производительности CPU, RAM, HDD, SSD и т.п. на показания теста?
P.S. Под OpenCL будет такой же? Есть ли аналоги данного теста в сети? Если нет, то можете "замутить" маленькое приложение и получать небольшую денежку от оверклокеров и железячников за их удовольствие наблюдать "попугаи" на экране. smile
UserPostedImage UserPostedImage
Наука — лучший способ удовлетворения личного любопытства за государственный счёт.
Offline evatutin  
#7 Оставлено : 12 июля 2013 г. 9:41:35(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,642
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 1024 раз
Поблагодарили: 1827 раз в 886 постах
xpom
Решение на коленке — обернуть запуск в bat-ник с перенаправлением консольного вывода в файл (архив с программной обновил, при запуске не забыть лишний раз нажать Enter smile ). Вечером сделаю нормально, чтобы вывод дублировался и в файл, и на экран

Step
Программа простейшая: выделяется пара буферов фиксированного размера и измеряется время копирования между ними. Расположение буферов меняется (ОЗУ, глобальная память GPU, итого 4 сочетания). Последние два примера хитрее — там выделяемая в ОЗУ память помечается как page-locked, она не может упасть в swap и находится в оперативке по одним и тем же физическим адресам, за ней не так пристально следит драйвер nVidia, соответственно скорость копирования получается выше, что видно по результатам тестирования. На результаты, насколько я успел заметить, влияет наличие других интенсивно работающих приложений, про HDD/SSD не скажу, но скорее всего они влияют мало. Под OpenCL при желании можно сделать аналог, поисками аналогов теста не занимался, наверное они есть smile

PS. По моим наблюдениям копирование GPU -> GPU происходит асинхронно smile, чего в документации я не увидел

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Offline AlexA  
#8 Оставлено : 12 июля 2013 г. 12:51:16(UTC)
AlexA


Статус: Administration

Медали: Переводчику: За помощь в создании сайта

Группы: Editors, Member, Administration, Russia Team Group, Moderators
Зарегистрирован: 02.10.2007(UTC)
Сообщений: 6,140
Мужчина
Российская Федерация
Откуда: "Russia Team"

Сказал «Спасибо»: 1250 раз
Поблагодарили: 1516 раз в 838 постах
Вот, нашел древнюю карточку. Может и её результаты будут интересны:

CUDA memory bandwidth test (block size = 100 MB)
(c) Eduard I. Vatutin
WWW: http://evatutin.narod.ru
e-mail: evatutin@rambler.ru
ICQ: 203-229-391

1 CUDA device(s) found

GPU 0: GeForce 9800 GT

RAM allocating... OK
GPU global RAM allocating... OK

Copying Host -> Device
Average bandwidth = 1.76316 GB/s

Copying Device -> Host
Average bandwidth = 1.42892 GB/s

RAM allocating... OK

Copying Host -> Host
Average bandwidth = 1.23944 GB/s

GPU global RAM allocating... OK

Copying Device -> Device
Average bandwidth = 11.8445 GB/s

Copying Host -> Device (using page-locked)
Average bandwidth = 3.23576 GB/s

Copying Device -> Host (using page-locked)
Average bandwidth = 2.92414 GB/s

Done
thanks 1 пользователь поблагодарил AlexA за этот пост.
evatutin оставлено 12.07.2013(UTC)
Offline evatutin  
#9 Оставлено : 12 июля 2013 г. 17:49:38(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,642
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 1024 раз
Поблагодарили: 1827 раз в 886 постах
AlexA
Спасибо, конечно интересно! Тем более, что карточка неплохо проявляет себя при копировании GPU -> GPU и с использованием page-lock. Сегодня мне еще попалась 8800, но потестировать не удалось, т.к. там надо дрова обновить, а у меня времени не было. Попробую во вторник.

All
Зато видны первые тенденции smile.

1. Скорость копирования CPU->GPU и обратно не лимитируется видюхой, влияет что-то еще (проц, чипсет, шина). Поэтому, ставя новую видюху в старую машину (даже на первом поколении Core'ов), надо десять раз подумать, т.к. скорость копирования может отличаться в 2-3 раза, а это — довольно распространенная операция! Если не сложно, сообщите дополнительно хотя бы информацию о процессоре в машине, на которой проходили тесты, буду признателен Present
2. У меня есть карточки GTS 450 Eco, у них по документации медленная память, но я не думал, что настолько... У просто 450 копирование GPU->GPU проходит на 22,8 ГБ/с, а у Eco — 4,8 ГБ/c (в 4,75 раза медленее!). У меня на них считается Einstein, остальное они тянут плохо (работа юзера здорово тормозит, GPUGRID не укладывается в deadline). Так что если кто будет думать брать что-то подобное, советую основательно подумать
3. Давно мучавший меня вопрос (где-то здесь уже обсуждали): почему в одной из моих машин на одной из двух 660 Ti сильно проседает производительность? Все просто: все упирается в скорость обмена CPU<->GPU. Цифры:

GPU 0: 1,4 ГБ/с и 1 ГБ/c (мать старенькая, для первого поколения Core'ов)
GPU 1: 0,2 ГБ/c и 0,3 ГБ/с (т.е. в 3—7 раз меньше)

Так что в перспективе надо менять машину и ставить эти видюхи в нее, эффективность будет выше.

PS. Надеюсь, что скоро у меня в распоряжении появится GTX 770 + Haswell, интересно, как будет там smile

PPS. Жду еще результатов, по окончании общую табличку выложу, если не будет возражений по поводу конфиденциальности smile

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Offline AlexA  
#10 Оставлено : 12 июля 2013 г. 17:55:12(UTC)
AlexA


Статус: Administration

Медали: Переводчику: За помощь в создании сайта

Группы: Editors, Member, Administration, Russia Team Group, Moderators
Зарегистрирован: 02.10.2007(UTC)
Сообщений: 6,140
Мужчина
Российская Федерация
Откуда: "Russia Team"

Сказал «Спасибо»: 1250 раз
Поблагодарили: 1516 раз в 838 постах
У меня карточка 9800 стоит в
Цитата:
GenuineIntel
Intel(R) Core(TM)2 Quad CPU Q9500 @ 2.83GHz [Family 6 Model 23 Stepping 10]
(4 processors)

А, кстати я подумал, что это исследование вполне может потянут на статью на какой-то компьютерный ресурс, типа Оверов. а если сослаться - откуда данные, то будет и доп реклама и нашего ресурса и РВ smile
thanks 1 пользователь поблагодарил AlexA за этот пост.
evatutin оставлено 12.07.2013(UTC)
Offline evatutin  
#11 Оставлено : 12 июля 2013 г. 18:13:07(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,642
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 1024 раз
Поблагодарили: 1827 раз в 886 постах
AlexA
Кстати да, неплохая идея, т.к. можно посмотреть, как ПС коррелирует с временем расчета заданий в BOINC-проектах

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Offline slepojpju  
#12 Оставлено : 12 июля 2013 г. 18:44:54(UTC)
slepojpju


Статус: Старожил

Медали: Донор: За финансовую помощь сайту

Группы: Moderator "St.Petersburg", Member
Зарегистрирован: 23.10.2010(UTC)
Сообщений: 766
Мужчина
Откуда: Ленинград. Город герой.

Сказал «Спасибо»: 48 раз
Поблагодарили: 80 раз в 53 постах
Автор: slepojpju Перейти к цитате
CUDA memory bandwidth test (block size = 100 MB)
(c) Eduard I. Vatutin
WWW: http://evatutin.narod.ru
e-mail: evatutin@rambler.ru
ICQ: 203-229-391

1 CUDA device(s) found

GPU 0: GeForce GTX 250

RAM allocating... OK
GPU global RAM allocating... OK

Copying Host -> Device
Average bandwidth = 0.742203 GB/s

Copying Device -> Host
Average bandwidth = 0.731027 GB/s

RAM allocating... OK

Copying Host -> Host
Average bandwidth = 1.02263 GB/s

GPU global RAM allocating... OK

Copying Device -> Device
Average bandwidth = 9.44014 GB/s

Copying Host -> Device (using page-locked)
Average bandwidth = 1.11236 GB/s

Copying Device -> Host (using page-locked)
Average bandwidth = 1.10375 GB/s

Done



AMD Athlon(tm)64 X2 Dual Core Processor 4400+ 2.30GHz
Кто людям помогает, тот тратит время зря.
ХА-ХА.
Хорошими делами, прославиться нельзя.
UserPostedImage
thanks 1 пользователь поблагодарил slepojpju за этот пост.
evatutin оставлено 13.07.2013(UTC)
Offline Step  
#13 Оставлено : 12 июля 2013 г. 19:10:35(UTC)
Step


Статус: Старожил

Медали: Донор: За финансовую помощь сайту

Группы: Member
Зарегистрирован: 03.08.2010(UTC)
Сообщений: 916
Мужчина
Российская Федерация
Откуда: г. Кирово-Чепецк

Сказал «Спасибо»: 288 раз
Поблагодарили: 236 раз в 165 постах
Автор: evatutin Перейти к цитате
Если не сложно, сообщите дополнительно хотя бы информацию о процессоре в машине, на которой проходили тесты, буду признателен Present

Так простейшую инфу о проце и системе программка сама должна определять - тип GPU ведь она в лог пишет, так и проц также надо. 199
UserPostedImage UserPostedImage
Наука — лучший способ удовлетворения личного любопытства за государственный счёт.
Offline Disel  
#14 Оставлено : 12 июля 2013 г. 19:33:44(UTC)
Disel


Статус: Старожил

Медали: Первооткрывателю: Нахождение пар ОДЛК в RakeSearch! Донор: За финансовую помощь сайту

Группы: Member, Russia Team Group
Зарегистрирован: 08.07.2013(UTC)
Сообщений: 3,603
Мужчина
Российская Федерация

Сказал «Спасибо»: 520 раз
Поблагодарили: 427 раз в 327 постах
А интересно, нет ли таблички сводной по тестам производительности разных GPU? У меня простенькая моделька, Nvidia GT630, конечно не в лидерах, но глянуть ее примерный рейтинг было бы интересно.
Ubuntu Linux 18.04 LTS - 64 bit / Boinc 7.9.3(х64) / Core 2 DUO E6300 1.8 Ггц / GeForce GT-630
Offline krasbars  
#15 Оставлено : 12 июля 2013 г. 21:47:52(UTC)
krasbars


Статус: Старожил

Группы: Editors, Member, Administration, Russia Team Group, Moderators
Зарегистрирован: 14.01.2009(UTC)
Сообщений: 2,728
Мужчина
Российская Федерация
Откуда: Красноярск

Сказал «Спасибо»: 566 раз
Поблагодарили: 486 раз в 356 постах
Автор: AlexA Перейти к цитате
я подумал, что это исследование вполне может потянут на статью на какой-то компьютерный ресурс, типа Оверов. а если сослаться - откуда данные, то будет и доп реклама и нашего ресурса и РВ smile

Увы, но для более-менее вменяемой статьи нужно гораздо больше данных: полные характерстики "железа" (включая скрины CPU-Z и GPU-Z), данные о разгоне CPU (поскольку BOINC вообще не отображает реальную частоту) и ОЗУ, используемая ОСь (вплоть до сервис-паков) и т.д. и т.п.
Это так, "навскидку".
i7 2600K@4200MHz + GTX570 (870/1740/3800) + HD5870 (930/4800) + 16Gb DDR III @1600MHz на Win7 x64 SP1 и BOINC x64 7.0.28

Offline AlexA  
#16 Оставлено : 12 июля 2013 г. 21:56:58(UTC)
AlexA


Статус: Administration

Медали: Переводчику: За помощь в создании сайта

Группы: Editors, Member, Administration, Russia Team Group, Moderators
Зарегистрирован: 02.10.2007(UTC)
Сообщений: 6,140
Мужчина
Российская Федерация
Откуда: "Russia Team"

Сказал «Спасибо»: 1250 раз
Поблагодарили: 1516 раз в 838 постах
Автор: krasbars Перейти к цитате
Автор: AlexA Перейти к цитате
я подумал, что это исследование вполне может потянут на статью на какой-то компьютерный ресурс, типа Оверов. а если сослаться - откуда данные, то будет и доп реклама и нашего ресурса и РВ smile

Увы, но для более-менее вменяемой статьи нужно гораздо больше данных: полные характерстики "железа" (включая скрины CPU-Z и GPU-Z), данные о разгоне CPU (поскольку BOINC вообще не отображает реальную частоту) и ОЗУ, используемая ОСь (вплоть до сервис-паков) и т.д. и т.п.
Это так, "навскидку".

Дык тут главное идея. И чтоб инициатор ей проникнулся smile
Подкорректирует програмку, чтоб больше данный получить, кинем кличь и будет целая куча данных 199

Offline oleg25  
#17 Оставлено : 12 июля 2013 г. 23:00:10(UTC)
oleg25


Статус: Частенько заглядывает

Группы: Member
Зарегистрирован: 18.09.2011(UTC)
Сообщений: 106
Мужчина

Сказал «Спасибо»: 11 раз
Поблагодарили: 23 раз в 15 постах
Offline xpom  
#18 Оставлено : 13 июля 2013 г. 18:41:29(UTC)
xpom


Статус: Давно уж тут

Группы: Member
Зарегистрирован: 24.02.2012(UTC)
Сообщений: 313
Мужчина
Российская Федерация

Сказал «Спасибо»: 25 раз
Поблагодарили: 54 раз в 36 постах
Автор: oleg25 Перейти к цитате


Табличка, конечно, правильная, но устаревает не успевая заполниться.

To: evatutin
Комп - и3570к 3700МГц, 16Гиг 1866Мгц, ГТХ 560 830Мгц на шине PCI-E 3.0 х 16.

Обмен м-ду памятями сильно зависит от пропуска PCI-E. Производительность Энштейнов от этого тоже зависит.
thanks 1 пользователь поблагодарил xpom за этот пост.
evatutin оставлено 13.07.2013(UTC)
Offline xpom  
#19 Оставлено : 13 июля 2013 г. 18:55:02(UTC)
xpom


Статус: Давно уж тут

Группы: Member
Зарегистрирован: 24.02.2012(UTC)
Сообщений: 313
Мужчина
Российская Федерация

Сказал «Спасибо»: 25 раз
Поблагодарили: 54 раз в 36 постах
560 Поддерживает PCI-E 2.0, поэтому сорри Present
Offline evatutin  
#20 Оставлено : 13 июля 2013 г. 21:13:16(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,642
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 1024 раз
Поблагодарили: 1827 раз в 886 постах
Step
Можно сделать определение CPUID, я просто не думал, что будет такая сильная зависимость

krasbars
Чтобы проследить зависимость, по хорошему нужно одну и ту же видюху повтыкать в разные системники и сравнить результаты, а пока по присланным результатам такой возможности нет

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Пользователи, просматривающие эту тему
Guest
2 Страницы12>
Быстрый переход  
Вы не можете создавать новые темы в этом форуме.
Вы не можете отвечать в этом форуме.
Вы не можете удалять Ваши сообщения в этом форуме.
Вы не можете редактировать Ваши сообщения в этом форуме.
Вы не можете создавать опросы в этом форуме.
Вы не можете голосовать в этом форуме.

Boinc.ru theme. Boinc.ru
Форум YAF 2.1.1 | YAF © 2003-2018, Yet Another Forum.NET
Страница сгенерирована за 0.274 секунды.