Российские распределенные вычисления на платформе BOINC
Форум участников распределённых вычислений.

Добро пожаловать, Гость! Чтобы использовать все возможности Вход или Регистрация.

Уведомление

Icon
Error

Опции
К последнему сообщению К первому непрочитанному
Offline rudolfus314  
#1 Оставлено : 12 июня 2015 г. 13:56:20(UTC)
rudolfus314


Статус: Новичок

Группы: Member
Зарегистрирован: 17.02.2015(UTC)
Сообщений: 2
Российская Федерация

Поблагодарили: 3 раз в 1 постах
Не было заботы – купил порося…
Считаю SETI@Home и Einstein@home.
Win7x64, ASUS Maximus VI Hero, i7-4770K разогнан до 4200, 8GB PC-24000, GTX770 2GB, HD7970 3GB. Вторую видеокарту (HD7970) прикупил б/у по случаю по дешевке из жадности. Чтобы вторая карта работала в boinc, подключил ее ко второму входу дисплея. Два PCIE слота работают в режиме х8.
Раньше считалось в 8 потоков на CPU и в 1 поток на GPU. Загрузка CPU – 100%, 24/7. Считалось – и ладно. Когда притормаживало видео или инет – на время останавливал boinc. Однако две видеокарты – это уже ферма, пусть и с одним поросенком, зато не последних кровей. Взялся оптимизировать.
Для контроля поместил на экран гаджет от Аиды. Показалось мало – добавил для контроля загрузки видеокарт гаджет GPU Monitor. Странно, но оказалось, что английская версия этого гаджета правильно отображает график загрузки GTX770, а русифицированная – HD7970, но не наоборот.
После многочисленных экспериментов определил, что максимальная загрузка обоих видеокарт имеет место при двух потоках на каждой видеокарте при условии, что расчетным модулям присвоен высокий приоритет. Боинк-менеджер не может самостоятельно присваивать расчетам высокий приоритет, только, в зависимости от настроек – средний или низкий. Пришлось установить прогу Process Lasso Pro v.7.0.0.0. В ее настройках исключил расчетные модули видеокарт из «Сдерживания ProBalans», установил для них приоритет «всегда высокий». Приоритет повышается для нового задания с задержкой 10-20 сек.
Оказалось, что турбина HD7970 шумит значительно громче, чем у GTX770, причем вращается быстрее, чем необходимо. Снижение оборотов на 10-12% существенно понижает шум, при этом температура повышается незначительно - на 2-3 градуса. Для соответствующего регулирования оборотов турбины установил прогу MSI Afterburner, позволяющую, в том числе, произвольный график зависимости оборотов турбины от температуры. Примечательно, что это можно сделать только если рабочий стол в настройках системы расширен на вторую видеокарту, если же нет, то эта регулировка не активна. Боинк вторую видеокарту видит в обоих случаях.
Выбрал загрузку боинком для процессора: 3 ядра 6 потоков (80% процессоров в боинк-менеджере) . 1 свободное ядро (2 виртуальных) вполне обеспечило комфортную работу в не тяжелых приложениях, коме того, эта свободная расчетная мощность непрерывно считает и четыре потока для видеокарт с загрузкой процессора ~9%, а также раздает кучу торрентов. Процессор работает в режиме гипертрейдинга, при необходимости система вместе с Process Lasso (сдерживания ProBalans) вполне исправно притормаживают 6 потоков процессорных расчетов, имеющих приоритет «низкий (минимальный)» в Process Lasso, и освобождают расчетную мощность. Офис, видео, инет, фотошоп в простецком использовании не тормозят. Более того, не тормозит такая игрушка, как Сталкер на максимальных настройках – расчеты боинка эффективно притормаживаются, хотя иногда появляются артефакты при загрузке нового задания в видеокарту. Работает GTX770. HD7970 используется только боинком.
В процессоре есть видеоядро HD Graphics 4600. Подключил его к третьему входу дисплея – пусть трудится, пока хозяин спит. Однако расчет на этом видеоядре тормозит расчеты других модулей с общим проигрышем в производительности. Полагаю, это связано с тем, что у этого видеоядра очень малая собственная память, оно весьма активно использует системную, в результате пропускной способности памяти не хватает для обеспечения максимальной скорости расчетов в потоках для процессора и видеокарт. Графическое ядро процессора отключил.
У меня считается: SETI@Home – 4 потока для процессора и по 2 потока на GTX770 и HD7970; Einstein@home – 2 потока для процессора. Для Einstein@home использую его родное приложение einstein_S6BucketFU2UB_1.01_windows_intelx86__SSE2.exe, для SETI@Home оптимизированное Лунатиками из пакета Lunatics_Win64_v0.43a:
- для процессора - AKv8c_r2549_winx86-64_AVXxjfs.exe
- для GTX770 - Lunatics_x41zc_win32_cuda50.exe
- для HD7970 - MB7_win_x86_SSE_OpenCL_ATi_HD5_r2489.exe
GTX770 проверял на cuda42 и cuda50 – преимущество по производительности 2-3% имеет cuda50. HD7970 проверял на HD5 и OpenCL – преимущество 10-15% имеет HD5.
В результате всех этих операций имею в «спокойном режиме» (работают системные утилиты, браузер, экранные гаджеты, u-Torrent раздает ~2500 раздач из которых 10-20 активных с общей скоростью ~120кВ\с) :
94-99% Загрузка GTX770
64-69% Загрузка GTX770 MC (не вполне понимаю, что это значит)
99-100% Загрузка HD7970
85-92% Загрузка CPU, 45% - загрузка памяти (всего 8G).
Измерил производительность процессора LinX 0.6.5.0 AVX – 194GF.
Измерил боинком производительность:
скорость вычислений с плавающей запятой 4780.38 млн. операций/с
скорость целочисленных вычислений 17707.44 млн. операций/с
GTX770 3411 GFLOPS peak, HD7970 4710 GFLOPS peak
Боинк сам периодически запускает тест производительности с интервалом ~1,5 месяца. Если в этот момент крутится какая-нибудь прога, боинк дает производительность ниже на ~10%. Пришлось внести запись в напоминалку о периодической проверке измеренной производительности на сайте вычислений, чтобы при необходимости остановить максимум фоновых программ и запустить тест боинка, правильный результат которого зафиксируется. Затем вернуть компьютер в исходное состояние перезагрузкой. Такая нечастая необременительная операция полезна для получения максимума очков, напрямую зависящего от результатов теста.
После всех этих приготовлений я завел таблицу, куда с интервалом в несколько дней заносил данные о производительности приложений с сайта SETI@Home. Einstein@home таких данных не дает, только среднее количество очков за день. За три месяца эти данные пришли в более-менее равновесное состояние. Вот что получилось для SETI:
~42000 average credit
809 - суммарная полная средняя производительность
34,0 - средняя производительность одного потока на процессоре
136 - производительность процессора при 4-х потоках, просто умножил на 4.
184 - средняя производительность одного потока на GTX770 (при этом она основная в системе)
368 - производительность GTX770, просто умножил на 2
153 - средняя производительность одного потока на HD7970 (занята только расчетами)
305- производительность HD7970, просто умножил на 2
Таким образом, имеется следующий вклад в производительность:
17% - процессор
45% - GTX770 (вкладом процессора пренебрегу, один поток занимает примерно 1,9% процессора)
38% - HD7970 (вкладом процессора пренебрегу, один поток занимает примерно 2,5% процессора)
Если считать только на процессоре в 8 потоков и сравнить относительную производительность со счетом только на видеокартах:
1,00 - процессор
1,40 - GTX770
1,16 - HD7970
Как все это соотносится с тестами производительности для меня осталось загадкой.
Я ожидал более значительного вклада видеокарт. По-видимому, столь большая доля процессора объясняется оптимизацией Лунатиками расчетных приложений под команды AVX, ну и разгон.
Поскольку разгон процессора (не скальпирован, воздушное охлаждение) ограничивается тепловыделением, приведу температуры в корпусе CoolerMaster HAF-Х:
При температуре в помещении вблизи пола около системного блока (стоит на полу) 26С:
72-73 температура ЦП
83-85 CPU Package
83-85 CPU IA Cores
77-85 CPU ядра 1-4
79-80 диод GTX770, вентилятор ~2350prm 63%
82-83 диод HD7970, вентилятор ~3090prm 79%
39 Системная плата
40 Рабочий винчестер
55 Память
thanks 3 пользователей поблагодарили rudolfus314 за этот пост.
hoarfrost оставлено 12.06.2015(UTC), ReaDy оставлено 12.06.2015(UTC), AlexA оставлено 12.06.2015(UTC)
Offline hoarfrost  
#2 Оставлено : 12 июня 2015 г. 16:26:43(UTC)
hoarfrost


Статус: Старожил

Медали: Переводчику: За помощь в создании сайтаРазработчику: За разработку приложения CluBORunДонор: За финансовую помощь сайту

Группы: Editors, Member, Administration, Moderator Crystal Dream, Moderators, Crystal Dream Group
Зарегистрирован: 05.10.2007(UTC)
Сообщений: 8,431
Мужчина
Откуда: Crystal Dream

Сказал «Спасибо»: 1259 раз
Поблагодарили: 1704 раз в 1083 постах
Хороший отчёт!

При использовании GPU-приложений лучше высвобождать один поток или даже одно ядро от прочих вычислений (настраивается в BOINC Manager).
"Реальная" производительность 4770K/3770K/2600K на номинальных частотах - около 50-60 GFLOPS в double. AVX-инструкции, как я понимаю, действительно могут значительно повысить результат в бенчмарковых вычислениях, но вот насколько они могут быть использованы в реальных вычислениях - мне сложно сказать.
UserPostedImage
Offline evatutin  
#3 Оставлено : 12 июня 2015 г. 17:44:39(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,646
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 1025 раз
Поблагодарили: 1833 раз в 888 постах
Автор: hoarfrost Перейти к цитате
AVX-инструкции, как я понимаю, действительно могут значительно повысить результат в бенчмарковых вычислениях, но вот насколько они могут быть использованы в реальных вычислениях - мне сложно сказать.


Там, где можно SSE, можно и AVX, но таковых вряд ли действительно много...

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Offline ReaDy  
#4 Оставлено : 12 июня 2015 г. 18:48:57(UTC)
ReaDy


Статус: Старожил

Медали: Первооткрывателю: Нахождение пар ОДЛК в RakeSearch!

Группы: Member
Зарегистрирован: 03.08.2013(UTC)
Сообщений: 535
Российская Федерация

Сказал(а) «Спасибо»: 245 раз
Поблагодарили: 222 раз в 160 постах
ИМХО
Отключить расчет Einstein@home на процессоре. Один из освободившихся потоков привязать к вычислениям на Intel HD4600(тот же Einstein или SETI), а второй оставить свободным. Вполне возможно что общая скорость вычислений увеличится.
6419*2^1351093+1 is prime!
Offline rudolfus314  
#5 Оставлено : 13 июня 2015 г. 16:18:58(UTC)
rudolfus314


Статус: Новичок

Группы: Member
Зарегистрирован: 17.02.2015(UTC)
Сообщений: 2
Российская Федерация

Поблагодарили: 3 раз в 1 постах
При любом варианте включения HD4600 общая производительность по сравнению с выбранной конфигурацией падает.
Можно производительность увеличить, заставив комп считать еще 1-2 потока на процессоре, когда пользователь не активен. Для этого подходит прога xStarter 1.9.3.84 - для нее можно написать простые скрипты и CMD, изменяющие конфигурацию boink с 80% до 100% используемых процессоров (global_prefs_override.xml) в зависимости от наличия запущенного процесса заставки. Это, однако, приведет к дополнительному нагреву. Добавлю это дело зимой, когда в помещении не будет так тепло.
Offline dimych  
#6 Оставлено : 14 июня 2015 г. 11:39:57(UTC)
dimych


Статус: Старожил

Группы: Member, Crystal Dream Group
Зарегистрирован: 08.02.2011(UTC)
Сообщений: 1,835
Мужчина
Российская Федерация
Откуда: Смоленск

Сказал «Спасибо»: 445 раз
Поблагодарили: 211 раз в 170 постах
ну перегрев хорошо лечится частичным уменьшением разгона. вон у меня обычная частота на камне 4,5 ГГц, на герасиме темпа по ядрам обычно 72-78 градусов. а тут наступили теплые деньки и стала до 85 на самом горячем ядре подыматься. убрал всего лишь 100 МГц (до 4,4 ГГц) и темпа упала аж на 10 градусов.
ASUS P9X79 WS/I7-3930K@3.2 GHz/32 GB DDR3-1600 MHz/MSI R7950 Twin Frozr 3GD5 V2/OC 3 Gb (880/5000 MHz)
Offline PinkFloyd  
#7 Оставлено : 14 июня 2015 г. 15:14:21(UTC)
PinkFloyd


Статус: Давно уж тут

Группы: Member, Russia Team Group
Зарегистрирован: 24.03.2015(UTC)
Сообщений: 435
Мужчина
Российская Федерация
Откуда: Оренбург

Сказал «Спасибо»: 152 раз
Поблагодарили: 53 раз в 43 постах
Автор: dimych Перейти к цитате
ну перегрев хорошо лечится частичным уменьшением разгона. вон у меня обычная частота на камне 4,5 ГГц, на герасиме темпа по ядрам обычно 72-78 градусов. а тут наступили теплые деньки и стала до 85 на самом горячем ядре подыматься.


Жесть. smile
У меня сейчас проц (не разогнанный) тоже Герасима считает. При стопроцентной загрузке температура по ядрам 42-43 градуса. И это FX-8350, о "горячести" которого народ очень любит рассуждать в инете. Перегрев хорошо лечится отсутствием разгона. smile
Offline dimych  
#8 Оставлено : 15 июня 2015 г. 0:22:51(UTC)
dimych


Статус: Старожил

Группы: Member, Crystal Dream Group
Зарегистрирован: 08.02.2011(UTC)
Сообщений: 1,835
Мужчина
Российская Федерация
Откуда: Смоленск

Сказал «Спасибо»: 445 раз
Поблагодарили: 211 раз в 170 постах
Автор: PinkFloyd Перейти к цитате


Жесть. smile
У меня сейчас проц (не разогнанный) тоже Герасима считает. При стопроцентной загрузке температура по ядрам 42-43 градуса. И это FX-8350, о "горячести" которого народ очень любит рассуждать в инете. Перегрев хорошо лечится отсутствием разгона. smile


таки да, но я говорил про перегрев. а не про нормальный режим работы. а у вашего камешка типичный ТДП всего лишь 125 Вт. т.е. такую мощность вполне даже боксовый кулер отведет. а у моего камешка выделение (если калкулятор опять же не врет, если нужно могу поискать) в разгонге под 250 Вт. чтобы отвести такую мощность, нужен или серьезный воздушный кулер или СВО. моя нинзя теоретически отводит 200-220 Вт, а нужно 250. поэтому и такие темпы. на работе И5-4440 с кулером за 500 руб китай ноунейм со 100мм вертушкой под герасимом больше 35-38 на самом горячем ядре не греется. да и тепловыделенгие там вроде 80 Вт, там и греться то нечему. однако или там 4 потока по 3,1 ГГЦ, или тут 12 потоков 4,5 ГГц. небо и земля.
ASUS P9X79 WS/I7-3930K@3.2 GHz/32 GB DDR3-1600 MHz/MSI R7950 Twin Frozr 3GD5 V2/OC 3 Gb (880/5000 MHz)
Пользователи, просматривающие эту тему
Guest
Быстрый переход  
Вы не можете создавать новые темы в этом форуме.
Вы не можете отвечать в этом форуме.
Вы не можете удалять Ваши сообщения в этом форуме.
Вы не можете редактировать Ваши сообщения в этом форуме.
Вы не можете создавать опросы в этом форуме.
Вы не можете голосовать в этом форуме.

AlexA theme. Created by AlexA
Форум YAF 2.1.1 | YAF © 2003-2018, Yet Another Forum.NET
Страница сгенерирована за 0.220 секунды.