Российские распределенные вычисления на платформе BOINC
Форум участников распределённых вычислений.

Добро пожаловать, Гость! Чтобы использовать все возможности Вход или Регистрация.

Уведомление

Icon
Error

38 Страницы«<35363738>
Опции
К последнему сообщению К первому непрочитанному
Offline Panda  
#721 Оставлено : 8 января 2017 г. 17:53:02(UTC)
Panda


Статус: Частенько заглядывает

Медали: Первооткрывателю: Нахождение пар ОДЛК в RakeSearch!

Группы: Member
Зарегистрирован: 19.06.2016(UTC)
Сообщений: 215
Мужчина
Российская Федерация
Откуда: St.Petersburg

Сказал «Спасибо»: 209 раз
Поблагодарили: 135 раз в 80 постах
Новое приложение для ГПУ дает значительное преимущество для видеокарт АМД перед NVIDIA за счет эффективной реализации OpenCl.
Offline Sid  
#722 Оставлено : 8 января 2017 г. 19:23:20(UTC)
Sid


Статус: Старожил

Группы: Member
Зарегистрирован: 26.09.2013(UTC)
Сообщений: 505

Сказал(а) «Спасибо»: 13 раз
Поблагодарили: 90 раз в 59 постах
Автор: Panda Перейти к цитате
Новое приложение для ГПУ дает значительное преимущество для видеокарт АМД перед NVIDIA за счет эффективной реализации OpenCl.


Самое интересное начинается, если задачи не влезают в память карточки, к примеру 3 Wu на 2Гб. Драйвер начинает буферизовать запросы в обычной памяти, все работает ну очень медленно.
В результате скорость выполнения на GPU приближается к скорости чисто процессорной задачи.

А если памяти хватает, то да, NVidia медленнее и требует одного ядра на 100%. Такое впечатление, что одно ядро просто циклит на прроверке - есть что от Gpu или нет.
Девелоперы собираются сделать вариант на CUDA, как было на BRP.

Должно быть лучше. Nvidia не любит OPenCLsmile
Offline Panda  
#723 Оставлено : 8 января 2017 г. 21:17:45(UTC)
Panda


Статус: Частенько заглядывает

Медали: Первооткрывателю: Нахождение пар ОДЛК в RakeSearch!

Группы: Member
Зарегистрирован: 19.06.2016(UTC)
Сообщений: 215
Мужчина
Российская Федерация
Откуда: St.Petersburg

Сказал «Спасибо»: 209 раз
Поблагодарили: 135 раз в 80 постах
Автор: Sid Перейти к цитате
Автор: Panda Перейти к цитате
Новое приложение для ГПУ дает значительное преимущество для видеокарт АМД перед NVIDIA за счет эффективной реализации OpenCl.


Самое интересное начинается, если задачи не влезают в память карточки, к примеру 3 Wu на 2Гб. Драйвер начинает буферизовать запросы в обычной памяти, все работает ну очень медленно.
В результате скорость выполнения на GPU приближается к скорости чисто процессорной задачи.

А если памяти хватает, то да, NVidia медленнее и требует одного ядра на 100%. Такое впечатление, что одно ядро просто циклит на прроверке - есть что от Gpu или нет.
Девелоперы собираются сделать вариант на CUDA, как было на BRP.

Должно быть лучше. Nvidia не любит OPenCLsmile


Одно ядро нужно для выполнения части задания в double-float и кода, который не удалось перенести на ГПУ sad
Offline Sid  
#724 Оставлено : 8 января 2017 г. 22:01:03(UTC)
Sid


Статус: Старожил

Группы: Member
Зарегистрирован: 26.09.2013(UTC)
Сообщений: 505

Сказал(а) «Спасибо»: 13 раз
Поблагодарили: 90 раз в 59 постах
Автор: Panda Перейти к цитате
Автор: Sid Перейти к цитате
Автор: Panda Перейти к цитате
Новое приложение для ГПУ дает значительное преимущество для видеокарт АМД перед NVIDIA за счет эффективной реализации OpenCl.


Самое интересное начинается, если задачи не влезают в память карточки, к примеру 3 Wu на 2Гб. Драйвер начинает буферизовать запросы в обычной памяти, все работает ну очень медленно.
В результате скорость выполнения на GPU приближается к скорости чисто процессорной задачи.

А если памяти хватает, то да, NVidia медленнее и требует одного ядра на 100%. Такое впечатление, что одно ядро просто циклит на прроверке - есть что от Gpu или нет.
Девелоперы собираются сделать вариант на CUDA, как было на BRP.

Должно быть лучше. Nvidia не любит OPenCLsmile


Одно ядро нужно для выполнения части задания в double-float и кода, который не удалось перенести на ГПУ sad


Вычисления с двойной точностью на CPU, как писали на сайте, нужны только, если карта их не поддерживает и только в конце вычислений.

Там же заметили, что хотя загрузка карты стала 100%, греется она градусов на 15-20 меньше, чем при поиске радиопульсаров. Похоже, что и загружена она меньше.


thanks 1 пользователь поблагодарил Sid за этот пост.
Panda оставлено 08.01.2017(UTC)
Offline Pavel Kirpichenko  
#725 Оставлено : 9 января 2017 г. 6:20:08(UTC)
Pavel Kirpichenko


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@home

Группы: Member
Зарегистрирован: 14.03.2014(UTC)
Сообщений: 680
Мужчина
Российская Федерация
Откуда: Новосибирская обл.

Сказал «Спасибо»: 296 раз
Поблагодарили: 115 раз в 72 постах
Автор: Panda Перейти к цитате


Одно ядро нужно для выполнения части задания в double-float и кода, который не удалось перенести на ГПУ sad

Должно быть именно поэтому у меня все задания вылетают с ошибкой - не освобождал ядро процессора. Все ядра были заняты другими заданиями...
http://boincstats.com/signature/-1/user/2499467/sig.png
Offline Alexone  
#726 Оставлено : 10 января 2017 г. 19:17:37(UTC)
Alexone


Статус: Старожил

Медали: Переводчику: За помощь в развитии сайтаПервооткрывателю: Результат в проекте SAT@home

Группы: Editors, Member, Moderator "We wanna HELP"
Зарегистрирован: 21.10.2010(UTC)
Сообщений: 559
Мужчина
Откуда: Самара

Сказал «Спасибо»: 245 раз
Поблагодарили: 173 раз в 105 постах
Если считаем что-то дельное, то приложение в принципе удачное вышло для AMD/ATI карт.

OpenCL: AMD/ATI GPU 1: AMD Radeon HD 8600/8700M (driver version 1800.8 (VM), device version OpenCL 1.2 AMD-APP (1800.8), 2048MB, 2048MB available, 502 GFLOPS peak)

Посыпает каждые 1,5-2 часа по 3,5 тысячи очков,и практически не требует ЦП. У декстопных видях(у которых уже за 10к GFLOPS) сейчас вообще наверняка сотнями тысяч валятся "камни", как когда-то было в милке.

UserPostedImage
Offline Panda  
#727 Оставлено : 10 января 2017 г. 19:43:53(UTC)
Panda


Статус: Частенько заглядывает

Медали: Первооткрывателю: Нахождение пар ОДЛК в RakeSearch!

Группы: Member
Зарегистрирован: 19.06.2016(UTC)
Сообщений: 215
Мужчина
Российская Федерация
Откуда: St.Petersburg

Сказал «Спасибо»: 209 раз
Поблагодарили: 135 раз в 80 постах
Автор: Alexone Перейти к цитате
Если считаем что-то дельное, то приложение в принципе удачное вышло для AMD/ATI карт.

OpenCL: AMD/ATI GPU 1: AMD Radeon HD 8600/8700M (driver version 1800.8 (VM), device version OpenCL 1.2 AMD-APP (1800.8), 2048MB, 2048MB available, 502 GFLOPS peak)

Посыпает каждые 1,5-2 часа по 3,5 тысячи очков,и практически не требует ЦП. У декстопных видях(у которых уже за 10к GFLOPS) сейчас вообще наверняка сотнями тысяч валятся "камни", как когда-то было в милке.


1) 2 rx 470 - 4 потока - 196 000/сут

2) однако: hd 6870 - 30 000 сут sad
Offline Alexone  
#728 Оставлено : 19 января 2017 г. 18:11:22(UTC)
Alexone


Статус: Старожил

Медали: Переводчику: За помощь в развитии сайтаПервооткрывателю: Результат в проекте SAT@home

Группы: Editors, Member, Moderator "We wanna HELP"
Зарегистрирован: 21.10.2010(UTC)
Сообщений: 559
Мужчина
Откуда: Самара

Сказал «Спасибо»: 245 раз
Поблагодарили: 173 раз в 105 постах
Выпустили еще более новую версию.
1.18 (FGRPopencl-ati)
1.18
Почему то, на сайте в приложениях не обновили информацию, хотя у меня уже около суток считается на ней.

По качеству: приложение стало еще быстрее, так на моей OpenCL: AMD/ATI GPU 1: AMD Radeon HD 8600/8700M время выполнение сократилось с 6200-6400 секунд до 3800-4000 секунд. То есть оно стало на ((6300/3900)-1)*100%=61% быстрее.

Теперь на ноутбучной карте выходит порядка 75000 камней в сутки.

UserPostedImage
thanks 2 пользователей поблагодарили Alexone за этот пост.
Panda оставлено 19.01.2017(UTC), Pavel Kirpichenko оставлено 20.01.2017(UTC)
Offline Panda  
#729 Оставлено : 19 января 2017 г. 20:30:44(UTC)
Panda


Статус: Частенько заглядывает

Медали: Первооткрывателю: Нахождение пар ОДЛК в RakeSearch!

Группы: Member
Зарегистрирован: 19.06.2016(UTC)
Сообщений: 215
Мужчина
Российская Федерация
Откуда: St.Petersburg

Сказал «Спасибо»: 209 раз
Поблагодарили: 135 раз в 80 постах
Rx 460 - 350 000 камней в сутки.
Offline Panda  
#730 Оставлено : 22 января 2017 г. 0:19:39(UTC)
Panda


Статус: Частенько заглядывает

Медали: Первооткрывателю: Нахождение пар ОДЛК в RakeSearch!

Группы: Member
Зарегистрирован: 19.06.2016(UTC)
Сообщений: 215
Мужчина
Российская Федерация
Откуда: St.Petersburg

Сказал «Спасибо»: 209 раз
Поблагодарили: 135 раз в 80 постах
Возникла проблема: больше 38 заданий для ГПУ на хост не приходит... В логах никаких ошибок не нашел, весь день искал причину, но так и но понял, что мешает получить больше заданий.
Offline SerVal  
#731 Оставлено : 22 января 2017 г. 7:05:00(UTC)
SerVal


Статус: Administration

Медали: Донор: За финансовую помощь сайту

Группы: Editors, Administration, Russia Team Group
Зарегистрирован: 28.09.2007(UTC)
Сообщений: 3,117
Мужчина
Откуда: Москва, Ясенево.

Сказал «Спасибо»: 314 раз
Поблагодарили: 539 раз в 374 постах
Panda написал:
Возникла проблема: больше 38 заданий для ГПУ на хост не приходит...

Скорее всего, потому что приложение для Радеонов - экспериментальное.
Сейчас, 2 задания на Радеоне Эйнштейн тоже не даёт запустить. sad
Загрузка Радеона на Колобке - 40-60%. На форуме у народа тоже самое.
thanks 2 пользователей поблагодарили SerVal за этот пост.
Panda оставлено 22.01.2017(UTC), Pavel Kirpichenko оставлено 22.01.2017(UTC)
Offline AlexA  
#732 Оставлено : 22 января 2017 г. 20:59:14(UTC)
AlexA


Статус: Administration

Медали: Переводчику: За помощь в создании сайта

Группы: Editors, Member, Administration, Russia Team Group, Moderators
Зарегистрирован: 02.10.2007(UTC)
Сообщений: 6,140
Мужчина
Российская Федерация
Откуда: "Russia Team"

Сказал «Спасибо»: 1250 раз
Поблагодарили: 1516 раз в 838 постах
Автор: SerVal Перейти к цитате
Panda написал:
Возникла проблема: больше 38 заданий для ГПУ на хост не приходит...

Скорее всего, потому что приложение для Радеонов - экспериментальное.
Сейчас, 2 задания на Радеоне Эйнштейн тоже не даёт запустить. sad
Загрузка Радеона на Колобке - 40-60%. На форуме у народа тоже самое.

Засчитало в 2 потока по 0.5AMD, но загрузка всё равно выше 60% не поднимается.

Offline Freddykrug  
#733 Оставлено : 24 января 2017 г. 19:25:10(UTC)
Freddykrug


Статус: Старожил

Группы: Member, Модератор Astronomy.Ru Forum
Зарегистрирован: 30.05.2010(UTC)
Сообщений: 2,874
Мужчина
Российская Федерация
Откуда: г. Томск

Сказал «Спасибо»: 740 раз
Поблагодарили: 494 раз в 313 постах
Автор: Alexone Перейти к цитате
Выпустили еще более новую версию.
1.18 (FGRPopencl-ati)
А у меня до сих пор 1.17. Может, потому что 1.18 - бета-версия?
Пока что на 7950, в 2 потока, считает примерно 2100 секунд, раздавая 3465 очков.

3 Gb Radeon 7950, i-5 2400, 16 Gb ОЗУ Astronomy.Ru Forum

Offline ReaDy  
#734 Оставлено : 24 января 2017 г. 19:45:31(UTC)
ReaDy


Статус: Старожил

Медали: Первооткрывателю: Нахождение пар ОДЛК в RakeSearch!

Группы: Member
Зарегистрирован: 03.08.2013(UTC)
Сообщений: 535
Российская Федерация

Сказал(а) «Спасибо»: 243 раз
Поблагодарили: 222 раз в 160 постах
Установите в настройках проекта получение тестовых приложений. Все же версия 1.18 получила хорошее ускорение.
6419*2^1351093+1 is prime!
Offline Pavel Kirpichenko  
#735 Оставлено : 11 февраля 2017 г. 11:45:39(UTC)
Pavel Kirpichenko


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@home

Группы: Member
Зарегистрирован: 14.03.2014(UTC)
Сообщений: 680
Мужчина
Российская Федерация
Откуда: Новосибирская обл.

Сказал «Спасибо»: 296 раз
Поблагодарили: 115 раз в 72 постах
Автор: Alexone Перейти к цитате
Выпустили еще более новую версию.
1.18 (FGRPopencl-ati)

Подтверждаю. Эта версия считается быстрее на моей GT 630, чем 1.17.
http://boincstats.com/signature/-1/user/2499467/sig.png
Offline Pavel Kirpichenko  
#736 Оставлено : 18 февраля 2017 г. 14:45:42(UTC)
Pavel Kirpichenko


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@home

Группы: Member
Зарегистрирован: 14.03.2014(UTC)
Сообщений: 680
Мужчина
Российская Федерация
Откуда: Новосибирская обл.

Сказал «Спасибо»: 296 раз
Поблагодарили: 115 раз в 72 постах
Уже версия 1.20 появилась.
http://boincstats.com/signature/-1/user/2499467/sig.png
thanks 1 пользователь поблагодарил Pavel Kirpichenko за этот пост.
Panda оставлено 18.02.2017(UTC)
Offline Panda  
#737 Оставлено : 18 февраля 2017 г. 17:01:52(UTC)
Panda


Статус: Частенько заглядывает

Медали: Первооткрывателю: Нахождение пар ОДЛК в RakeSearch!

Группы: Member
Зарегистрирован: 19.06.2016(UTC)
Сообщений: 215
Мужчина
Российская Федерация
Откуда: St.Petersburg

Сказал «Спасибо»: 209 раз
Поблагодарили: 135 раз в 80 постах
Автор: Pavel Kirpichenko Перейти к цитате
Уже версия 1.20 появилась.


Только она медленее 1.18 работает.

На форуме жалобы, что код остался прежним, нагрузка на цпу уменьшилась, а время расчетов увеличилось на 10-15%
Offline Sid  
#738 Оставлено : 18 февраля 2017 г. 17:26:02(UTC)
Sid


Статус: Старожил

Группы: Member
Зарегистрирован: 26.09.2013(UTC)
Сообщений: 505

Сказал(а) «Спасибо»: 13 раз
Поблагодарили: 90 раз в 59 постах
Автор: Panda Перейти к цитате
Автор: Pavel Kirpichenko Перейти к цитате
Уже версия 1.20 появилась.


Только она медленее 1.18 работает.

На форуме жалобы, что код остался прежним, нагрузка на цпу уменьшилась, а время расчетов увеличилось на 10-15%


Они пытаются исправить не свою ошибку.
Одно ядро просто циклит и опрашивает постоянно GPU. Смысл изменений в том, чтобы опрашивать не все время, а через какой то таймаут.
В этом случае ядро занято не на 100%, и может что то делать. Но иногда не попадает, когда уже можно брать результат. Вот и медленнее.
А вообще, это мировой заговор Nvidia против OpenCl.
thanks 3 пользователей поблагодарили Sid за этот пост.
Panda оставлено 18.02.2017(UTC), AlexA оставлено 18.02.2017(UTC), Denis_ оставлено 18.02.2017(UTC)
Offline Pavel Kirpichenko  
#739 Оставлено : 19 февраля 2017 г. 8:06:24(UTC)
Pavel Kirpichenko


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@home

Группы: Member
Зарегистрирован: 14.03.2014(UTC)
Сообщений: 680
Мужчина
Российская Федерация
Откуда: Новосибирская обл.

Сказал «Спасибо»: 296 раз
Поблагодарили: 115 раз в 72 постах
Автор: Panda Перейти к цитате


Только она медленее 1.18 работает.

Зато экран тормозит - будь здоров! Cuda-шные задания гораздо меньше экран тормозили...
http://boincstats.com/signature/-1/user/2499467/sig.png
Offline Panda  
#740 Оставлено : 19 февраля 2017 г. 11:43:29(UTC)
Panda


Статус: Частенько заглядывает

Медали: Первооткрывателю: Нахождение пар ОДЛК в RakeSearch!

Группы: Member
Зарегистрирован: 19.06.2016(UTC)
Сообщений: 215
Мужчина
Российская Федерация
Откуда: St.Petersburg

Сказал «Спасибо»: 209 раз
Поблагодарили: 135 раз в 80 постах
Автор: Pavel Kirpichenko Перейти к цитате
Автор: Panda Перейти к цитате


Только она медленее 1.18 работает.

Зато экран тормозит - будь здоров! Cuda-шные задания гораздо меньше экран тормозили...


Как вариант: можно перевести вывод изображения на встроенную графику, тогда особо замедляет экран.

Upd: Хотя на машинке с i5-3317u не получилось так сделать
thanks 1 пользователь поблагодарил Panda за этот пост.
Pavel Kirpichenko оставлено 19.02.2017(UTC)
Пользователи, просматривающие эту тему
Guest (2)
38 Страницы«<35363738>
Быстрый переход  
Вы не можете создавать новые темы в этом форуме.
Вы не можете отвечать в этом форуме.
Вы не можете удалять Ваши сообщения в этом форуме.
Вы не можете редактировать Ваши сообщения в этом форуме.
Вы не можете создавать опросы в этом форуме.
Вы не можете голосовать в этом форуме.

Boinc.ru theme. Boinc.ru
Форум YAF 2.1.1 | YAF © 2003-2018, Yet Another Forum.NET
Страница сгенерирована за 0.205 секунды.