Российские распределенные вычисления на платформе BOINC
Форум участников распределённых вычислений.

Добро пожаловать, Гость! Чтобы использовать все возможности Вход или Регистрация.

Уведомление

Icon
Error

4 Страницы<1234>
Опции
К последнему сообщению К первому непрочитанному
Offline Vlad  
#21 Оставлено : 21 ноября 2016 г. 1:13:40(UTC)
Vlad


Статус: Я тут не впервой

Группы: Member
Зарегистрирован: 20.11.2016(UTC)
Сообщений: 27
Российская Федерация

Сказал(а) «Спасибо»: 2 раз
Поблагодарили: 51 раз в 14 постах
Автор: dimych Перейти к цитате
ухватил три ВУшки для ЦПУ. оказались мультитридовыми. т.е. одно задания сразу на всех 6 ядрах (НТ выключен). ВУшки считались по 25-27 сек, пичалька. может с ошибками.
упд, не, без ошибок прошли, первые очки в проекте есть. но заданьица совсем уж крохотные, как по мне. на ГПУ их вовсе нет смысла считать.

Вам повезло, попались маленькие задания.
Offline Vlad  
#22 Оставлено : 21 ноября 2016 г. 1:17:07(UTC)
Vlad


Статус: Я тут не впервой

Группы: Member
Зарегистрирован: 20.11.2016(UTC)
Сообщений: 27
Российская Федерация

Сказал(а) «Спасибо»: 2 раз
Поблагодарили: 51 раз в 14 постах
Автор: Pushok Перейти к цитате
Поддержки х86 не будет?

Можно будет сделать только для Windows, если имеет смысл. Там 12 версий приложений, уже сейчас достаточно долго патчить и подписывать.
Offline dimych  
#23 Оставлено : 21 ноября 2016 г. 1:29:46(UTC)
dimych


Статус: Старожил

Группы: Member, Crystal Dream Group
Зарегистрирован: 08.02.2011(UTC)
Сообщений: 1,830
Мужчина
Российская Федерация
Откуда: Смоленск

Сказал «Спасибо»: 445 раз
Поблагодарили: 210 раз в 169 постах
Автор: Vlad Перейти к цитате

Вам повезло, попались маленькие задания.


я думаю мне просто повезло, что вообще хоть что-то попалось. поставил пиналку, пинает проект каждые 20 сек и ничего не попадается. хотя у америкоса комп аж по 30 тыщ в день выдает. походу фидер ему все отгружает сразу.
ASUS P9X79 WS/I7-3930K@3.2 GHz/32 GB DDR3-1600 MHz/MSI R7950 Twin Frozr 3GD5 V2/OC 3 Gb (880/5000 MHz)
Offline Pushok  
#24 Оставлено : 21 ноября 2016 г. 20:20:22(UTC)
Pushok


Статус: Частенько заглядывает

Группы: Member, Russia Team Group
Зарегистрирован: 10.05.2012(UTC)
Сообщений: 160
Мужчина
Российская Федерация
Откуда: Астрахань

Сказал «Спасибо»: 69 раз
Поблагодарили: 16 раз в 13 постах
Автор: Vlad Перейти к цитате
Автор: Pushok Перейти к цитате
Поддержки х86 не будет?

Можно будет сделать только для Windows, если имеет смысл. Там 12 версий приложений, уже сейчас достаточно долго патчить и подписывать.


Тут как Вам виднее, если геморойно под х86, то ладно. Это мне пора на х64 переходить smile
Online evatutin  
#25 Оставлено : 22 ноября 2016 г. 11:28:44(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,286
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 899 раз
Поблагодарили: 1448 раз в 706 постах
Vlad
А для CPU SSE/AVX расширения используются компилятором или явно вами, не смотрели?

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Offline Zabaikalec2010  
#26 Оставлено : 22 ноября 2016 г. 14:33:04(UTC)
Zabaikalec2010


Статус: Частенько заглядывает

Группы: Member, Russia Team Group
Зарегистрирован: 11.11.2013(UTC)
Сообщений: 299
Мужчина
Российская Федерация
Откуда: Калуга

Сказал «Спасибо»: 200 раз
Поблагодарили: 65 раз в 52 постах
Только что в менеджере появилось уведомление:

XANSONS for COD: Notice from BOINC
This project is using an old URL. When convenient, remove the project, then add http://xansons4cod.com/xansons4cod/

blink2 Впервые закачалось задание, кушает все 12 потоков.
Offline Vlad  
#27 Оставлено : 22 ноября 2016 г. 14:53:05(UTC)
Vlad


Статус: Я тут не впервой

Группы: Member
Зарегистрирован: 20.11.2016(UTC)
Сообщений: 27
Российская Федерация

Сказал(а) «Спасибо»: 2 раз
Поблагодарили: 51 раз в 14 постах
Автор: evatutin Перейти к цитате
Vlad
А для CPU SSE/AVX расширения используются компилятором или явно вами, не смотрели?

Я не использовал SSE/AVX для CPU. Специальных опций компилятора тоже не ставил. Изначально CPU версия нужна была для проверки, она считает с двойной точностью. Я думаю, что в первой части задачи - расчете гистограммы межатомных расстояний - инструкции SSE выигрыша не дадут, а вот вторую часть - вычисление дифрактограммы по гистограмме - действительно могут ускорить.
Offline Vlad  
#28 Оставлено : 22 ноября 2016 г. 14:56:35(UTC)
Vlad


Статус: Я тут не впервой

Группы: Member
Зарегистрирован: 20.11.2016(UTC)
Сообщений: 27
Российская Федерация

Сказал(а) «Спасибо»: 2 раз
Поблагодарили: 51 раз в 14 постах
Автор: Zabaikalec2010 Перейти к цитате
Только что в менеджере появилось уведомление:

XANSONS for COD: Notice from BOINC
This project is using an old URL. When convenient, remove the project, then add http://xansons4cod.com/xansons4cod/

Да, у меня в master_url в config.xml стоял IP вместо доменного имени, из-за этого после авторизации на сайте пользователей перекидывало с xansons4cod.com на 52.55... Это надо было поменять.
Online evatutin  
#29 Оставлено : 22 ноября 2016 г. 15:34:26(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,286
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 899 раз
Поблагодарили: 1448 раз в 706 постах
Автор: Vlad Перейти к цитате
Я думаю, что в первой части задачи - расчете гистограммы межатомных расстояний - инструкции SSE выигрыша не дадут, а вот вторую часть - вычисление дифрактограммы по гистограмме - действительно могут ускорить.


В общем если у вас там не тонны кода и будет желание попробовать, то чуть попожжа можно будет попробовать... 199

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Offline Vlad  
#30 Оставлено : 23 ноября 2016 г. 1:37:39(UTC)
Vlad


Статус: Я тут не впервой

Группы: Member
Зарегистрирован: 20.11.2016(UTC)
Сообщений: 27
Российская Федерация

Сказал(а) «Спасибо»: 2 раз
Поблагодарили: 51 раз в 14 постах
Автор: evatutin Перейти к цитате

В общем если у вас там не тонны кода и будет желание попробовать, то чуть попожжа можно будет попробовать... 199

Спасибо!
Те функции, где "сидят" все вычисления, совсем короткие. Я попробую сам разобраться с SSE (фактически, это те же SIMD, что и на GPU, ну разве что варп всего из 4х нитей), но, если у меня возникнут вопросы, буду иметь в виду Ваше предложение.
Offline ReaDy  
#31 Оставлено : 23 ноября 2016 г. 12:39:55(UTC)
ReaDy


Статус: Старожил

Группы: Member
Зарегистрирован: 03.08.2013(UTC)
Сообщений: 509
Российская Федерация

Сказал(а) «Спасибо»: 185 раз
Поблагодарили: 202 раз в 149 постах
С обновлённой версией XaNSoNS BOINC v1.05 (cuda65_windows) на видеокарте gtx750ti практически все задания не проходят валидацию. Предыдущие версии приложения работали без ошибок.
6419*2^1351093+1 is prime!
Offline Vlad  
#32 Оставлено : 23 ноября 2016 г. 16:42:40(UTC)
Vlad


Статус: Я тут не впервой

Группы: Member
Зарегистрирован: 20.11.2016(UTC)
Сообщений: 27
Российская Федерация

Сказал(а) «Спасибо»: 2 раз
Поблагодарили: 51 раз в 14 постах
Автор: ReaDy Перейти к цитате
С обновлённой версией XaNSoNS BOINC v1.05 (cuda65_windows) на видеокарте gtx750ti практически все задания не проходят валидацию. Предыдущие версии приложения работали без ошибок.

Да, прошу прощения. Я пытался исправить вот эту проблему (точнее, там было 2 не связанных между собой проблемы) и в версиях 1.04 и 1.05 сделал только хуже. В версии 1.06 похоже удалось все исправить.
thanks 1 пользователь поблагодарил Vlad за этот пост.
ReaDy оставлено 23.11.2016(UTC)
Offline dimych  
#33 Оставлено : 24 ноября 2016 г. 1:58:28(UTC)
dimych


Статус: Старожил

Группы: Member, Crystal Dream Group
Зарегистрирован: 08.02.2011(UTC)
Сообщений: 1,830
Мужчина
Российская Федерация
Откуда: Смоленск

Сказал «Спасибо»: 445 раз
Поблагодарили: 210 раз в 169 постах
а я думаю, что, раз координатор проекта упомянул про то, что работы в проекте максимум месяца на два при текущих мощностях, то не надо заниматься ерундой и оптимизацией, нужно сервер проекта помощнее сделать и наваливать побольше заданий. и потерпеть 2 месяца. что называется, овчинка выделки не стоит, вся эта оптимизация и улучшайзинг. задания и так максимум одноминутные, и тех кот наплакал. может быть бы на Герасим закинули бы всю эту работу, там вроде сервер шустрый.
ASUS P9X79 WS/I7-3930K@3.2 GHz/32 GB DDR3-1600 MHz/MSI R7950 Twin Frozr 3GD5 V2/OC 3 Gb (880/5000 MHz)
Offline Vlad  
#34 Оставлено : 24 ноября 2016 г. 11:57:49(UTC)
Vlad


Статус: Я тут не впервой

Группы: Member
Зарегистрирован: 20.11.2016(UTC)
Сообщений: 27
Российская Федерация

Сказал(а) «Спасибо»: 2 раз
Поблагодарили: 51 раз в 14 постах
Автор: dimych Перейти к цитате
а я думаю, что, раз координатор проекта упомянул про то, что работы в проекте максимум месяца на два при текущих мощностях, то не надо заниматься ерундой и оптимизацией, нужно сервер проекта помощнее сделать и наваливать побольше заданий. и потерпеть 2 месяца. что называется, овчинка выделки не стоит, вся эта оптимизация и улучшайзинг. задания и так максимум одноминутные, и тех кот наплакал. может быть бы на Герасим закинули бы всю эту работу, там вроде сервер шустрый.

Я буду апргейдить сервер в эту субботу (скорее всего). По идее, это делается в несколько кликов, но кто знает, что может пойти не так. После этого число заданий будет увеличено раз в 10. В таком режиме проект проработает дня 2-3, а потом будет остановлен на несколько месяцев для доработки. Такой длительный срок связан с тем, что основная работа у меня немного в другой области (связана с одной из диагностик ИТЭР), и ее тоже надо когда-то делать).

Из того плана, что я написал, можно опустить без ущерба для основной цели проекта только пункт 5 – создание нативных приложений. Но я хотел бы научиться использовать BOINC API. Приложение все равно надо доработать, иначе придется отрезать малоугловую часть дифрактограмм. Базу данных и веб-интерфейс к ней на отдельном сервере все равно надо сделать. Кроме того, я должен буду изучить, что там насчиталось и, как минимум, оптимизировать размеры кристаллитов, для которых считаются дифрактограммы. Да и надо быть полностью уверенным, что в конечной БД не будет ошибок.
Конечно, можно забить на какие-то проблемы, например, на интегрированную графику AMD, но интересно же разобраться, в чем дело.

Так что накидать побольше заданий сейчас и закончить через 2 месяца точно не получится, а вот после перезапуска – да, за 2-3 месяца все закончим, надеюсь.

SSE и оптимизацией кода для CPU я буду заниматься потом, когда-нибудь, а не в рамках этого BOINC проекта.

Update: Прошу прощения, не совсем ясно выразился. Когда я пишу "закончим", это значит закончим обрабатывать те записи, которые есть в базе COD на настоящий момент. Дальше в вялом режиме будут обрабатываться новые записи. База пополняется постоянно, но медленно.

Отредактировано пользователем 24 ноября 2016 г. 14:24:23(UTC)  | Причина: Не указана

thanks 1 пользователь поблагодарил Vlad за этот пост.
dimych оставлено 24.11.2016(UTC)
Offline ReaDy  
#35 Оставлено : 24 ноября 2016 г. 14:25:12(UTC)
ReaDy


Статус: Старожил

Группы: Member
Зарегистрирован: 03.08.2013(UTC)
Сообщений: 509
Российская Федерация

Сказал(а) «Спасибо»: 185 раз
Поблагодарили: 202 раз в 149 постах
Автор: Vlad Перейти к цитате
Конечно, можно забить на какие-то проблемы, например, на интегрированную графику AMD, но интересно же разобраться, в чем дело.



Потестировал на ноутбуке со встроенной графикой.

Цитата:
24.11.2016 14:14:46 | | OpenCL: AMD/ATI GPU 0: Spectre (driver version 2117.13 (VM), device version OpenCL 2.0 AMD-APP (2117.13), 1459MB, 1459MB available, 164 GFLOPS peak)
24.11.2016 14:14:46 | | OpenCL CPU: AMD A8-7100 Radeon R5, 8 Compute Cores 4C+4G (OpenCL driver vendor: Advanced Micro Devices, Inc., driver version 2117.13 (sse2,avx,fma4), device version OpenCL 1.2 AMD-APP (2117.13))

6419*2^1351093+1 is prime!
thanks 1 пользователь поблагодарил ReaDy за этот пост.
Vlad оставлено 24.11.2016(UTC)
Offline Vlad  
#36 Оставлено : 24 ноября 2016 г. 16:20:47(UTC)
Vlad


Статус: Я тут не впервой

Группы: Member
Зарегистрирован: 20.11.2016(UTC)
Сообщений: 27
Российская Федерация

Сказал(а) «Спасибо»: 2 раз
Поблагодарили: 51 раз в 14 постах
Автор: ReaDy Перейти к цитате

Потестировал на ноутбуке со встроенной графикой.

О, спасибо! Времена выполнения кёрнелов нормальные, но результаты неправильные. Значит, дело не в этом.
В коде используется оптимизация памяти для интегрированных GPU: вместо копирования из RAM в память GPU, участок памяти RAM делается доступным для GPU. На Intel это работает, но на AMD я не проверял. Может быть дело в этом. Вот в этом экзешнике оптимизация памяти насильно отключена. Вы сможете скопировать его в папку с тестовыми данными и запустить:
XaNSoNS_OCL_noUM.exe start.xml > stdout
?
Мне будет нужен только новый TestJob_neut_1D.txt.

Спасибо!
Offline dimych  
#37 Оставлено : 24 ноября 2016 г. 19:04:29(UTC)
dimych


Статус: Старожил

Группы: Member, Crystal Dream Group
Зарегистрирован: 08.02.2011(UTC)
Сообщений: 1,830
Мужчина
Российская Федерация
Откуда: Смоленск

Сказал «Спасибо»: 445 раз
Поблагодарили: 210 раз в 169 постах
задание для видяшек очень короткие, для Атишки в среднем по 2-3 сек, кто еще сччитает этот проект, запилите апп_инфо для Нвидий и Атишек. я вчера скок ни пробовал, нифига не вышло. а в промежутке между окончанием одной ВУшки и началом другой ГПУ простаивает, а учитывая их продолжительность в пару сек, простои выходят более 50% машинного времени. и вентиль моск выносит и производительности нема.
ASUS P9X79 WS/I7-3930K@3.2 GHz/32 GB DDR3-1600 MHz/MSI R7950 Twin Frozr 3GD5 V2/OC 3 Gb (880/5000 MHz)
Offline Vlad  
#38 Оставлено : 24 ноября 2016 г. 21:53:36(UTC)
Vlad


Статус: Я тут не впервой

Группы: Member
Зарегистрирован: 20.11.2016(UTC)
Сообщений: 27
Российская Федерация

Сказал(а) «Спасибо»: 2 раз
Поблагодарили: 51 раз в 14 постах
Автор: dimych Перейти к цитате
задание для видяшек очень короткие, для Атишки в среднем по 2-3 сек, кто еще сччитает этот проект, запилите апп_инфо для Нвидий и Атишек. я вчера скок ни пробовал, нифига не вышло. а в промежутке между окончанием одной ВУшки и началом другой ГПУ простаивает, а учитывая их продолжительность в пару сек, простои выходят более 50% машинного времени. и вентиль моск выносит и производительности нема.

Я добавлю кристаллиты большего размера (до 30 нм) после перезапуска в 2017. Среднее время выполнения заданий возрастет где-то в 9 раз. Мелкие задания правда никуда не денутся. По идее уже сейчас планировщик должен посылать их только на слабые CPU, но нормально это заработает только когда заданий будет много. Если не заработает, то альтернатива - это выделить приложение для CPU как отдельное приложение (сейчас это просто версия приложения) и мелкие задания генерить только для него.
Сейчас GPU задачи резервируют CPU ядро, так как без этого у некоторых волонтеров были проблемы. Потом я это уберу и выложу app_info.xml с настройками для резервации ядра.
thanks 2 пользователей поблагодарили Vlad за этот пост.
AlexA оставлено 24.11.2016(UTC), dimych оставлено 24.11.2016(UTC)
Offline dimych  
#39 Оставлено : 25 ноября 2016 г. 0:06:09(UTC)
dimych


Статус: Старожил

Группы: Member, Crystal Dream Group
Зарегистрирован: 08.02.2011(UTC)
Сообщений: 1,830
Мужчина
Российская Федерация
Откуда: Смоленск

Сказал «Спасибо»: 445 раз
Поблагодарили: 210 раз в 169 постах
интересует не столько настройка резервирования ядра в апп_инфо, сколько организация многопоточности ГПУ расчетов. неплохо бы, чтобы это тоже настраивалось.
ASUS P9X79 WS/I7-3930K@3.2 GHz/32 GB DDR3-1600 MHz/MSI R7950 Twin Frozr 3GD5 V2/OC 3 Gb (880/5000 MHz)
Offline Vlad  
#40 Оставлено : 25 ноября 2016 г. 0:43:47(UTC)
Vlad


Статус: Я тут не впервой

Группы: Member
Зарегистрирован: 20.11.2016(UTC)
Сообщений: 27
Российская Федерация

Сказал(а) «Спасибо»: 2 раз
Поблагодарили: 51 раз в 14 постах
Автор: dimych Перейти к цитате
интересует не столько настройка резервирования ядра в апп_инфо, сколько организация многопоточности ГПУ расчетов. неплохо бы, чтобы это тоже настраивалось.

Не совсем понял, Вы хотите, чтобы несколько заданий выполнялись на одном GPU одновременно? Если да, то попробуйте выставить параметр <ngpus>0.49</ngpus> или меньше в app_config.xml. Вот такие настройки plan classes стоят сейчас на сервере. Но только это достаточно рискованно, время выполнения функции-ядра будет сложно спрогнозировать, и если оно превысит лимит драйвера (примерно 1 сек, если GPU основная), драйвер "упадет".
thanks 1 пользователь поблагодарил Vlad за этот пост.
dimych оставлено 25.11.2016(UTC)
Пользователи, просматривающие эту тему
Guest (3)
4 Страницы<1234>
Быстрый переход  
Вы не можете создавать новые темы в этом форуме.
Вы не можете отвечать в этом форуме.
Вы не можете удалять Ваши сообщения в этом форуме.
Вы не можете редактировать Ваши сообщения в этом форуме.
Вы не можете создавать опросы в этом форуме.
Вы не можете голосовать в этом форуме.

Boinc.ru theme. Boinc.ru
Форум YAF 2.1.1 | YAF © 2003-2017, Yet Another Forum.NET
Страница сгенерирована за 0.210 секунды.