Российские распределенные вычисления на платформе BOINC
Форум участников распределённых вычислений.

Добро пожаловать, Гость! Чтобы использовать все возможности Вход или Регистрация.

Уведомление

Icon
Error

3 Страницы<123>
Опции
К последнему сообщению К первому непрочитанному
Offline astronom  
#21 Оставлено : 20 октября 2012 г. 23:28:02(UTC)
astronom


Статус: Старожил

Группы: Member, Russia Team Group
Зарегистрирован: 27.07.2008(UTC)
Сообщений: 2,192
Откуда: РФ, Подольск

Сказал(а) «Спасибо»: 133 раз
Поблагодарили: 176 раз в 152 постах
Автор: Шмяка Перейти к цитате
тут гдето ктото писал что делал в "лишней" памяти виртуальный диск для подкачки и при этом чтото сильно убыстрялось

создавать виртуальный диск в оперативной памяти для подкачки - это вообще ахинея какая-то mrgreen

Цитата:
Проблема общения CPU с RAM в том, что при доступе к произвольной ячейке памяти, выборка данных из неё идёт десятки наносекунд. А это сотни циклов. При выборке последовательного набора данных - суммарная скорость будет конечно больше.

ну какбе это самое ...
программа в оперативке хранится одним куском, разбитым на сегменты.
Весьма вероятно, что, если программа целиком влезает на одну планку, на одной планке она и будет храниться.
Насчет произвольных данных: если программа нуждается в каких-то произвольных файлах, она, скорее всего, не будет загружать их все в оперативу. Т.е.. если программа считывает десяток файлов в разное время, она будет обращаться к ним по мере необходимости.
Offline hoarfrost  
#22 Оставлено : 21 октября 2012 г. 1:03:21(UTC)
hoarfrost


Статус: Старожил

Медали: Переводчику: За помощь в создании сайтаРазработчику: За разработку приложения CluBORunДонор: За финансовую помощь сайту

Группы: Editors, Member, Administration, Moderator Crystal Dream, Moderators, Crystal Dream Group
Зарегистрирован: 05.10.2007(UTC)
Сообщений: 8,376
Мужчина
Откуда: Crystal Dream

Сказал «Спасибо»: 1235 раз
Поблагодарили: 1690 раз в 1072 постах
Автор: astronom Перейти к цитате
Автор: Шмяка Перейти к цитате
тут гдето ктото писал что делал в "лишней" памяти виртуальный диск для подкачки и при этом чтото сильно убыстрялось

создавать виртуальный диск в оперативной памяти для подкачки - это вообще ахинея какая-то mrgreen

Цитата:
Проблема общения CPU с RAM в том, что при доступе к произвольной ячейке памяти, выборка данных из неё идёт десятки наносекунд. А это сотни циклов. При выборке последовательного набора данных - суммарная скорость будет конечно больше.

ну какбе это самое ...
программа в оперативке хранится одним куском, разбитым на сегменты.
Весьма вероятно, что, если программа целиком влезает на одну планку, на одной планке она и будет храниться.

А должна ли планка брать на себя последовательные адреса? А не чётные или нечётные например? Или одна страница - в одной планке, а другая - в другой?
Как должны работать планки в режиме Ganged? Unganged?
Как с ними будет работать CPU с несколькими каналами доступа к памяти?

Цитата:
Насчет произвольных данных: если программа нуждается в каких-то произвольных файлах, она, скорее всего, не будет загружать их все в оперативу. Т.е.. если программа считывает десяток файлов в разное время, она будет обращаться к ним по мере необходимости.

Речь не о файлах. Если программа будет постоянно читать файлы, то к RAM претензий не будет из-за того, что диск затормозит всё ещё в ~1000 раз.
Речь о том, что данные программы, например, могут занимать в занимать в памяти например, 200 МБайт и обращение к ним может быть как упорядоченным и последовательным, так и совершенно беспорядочным. А поскольку кэш процессора намного меньше, то придётся в обязательном порядке обращаться к RAM.
А теперь представьте, что у нас на {1|2|4|6|8} планок на самом деле не одна, а несколько программ (ну вот сейчас у меня SAT@home считается сразу на 6 ядрах). В таком случае даже если каждый из потоков будет обращаться к данным последовательно, итоговый поток обращений к RAM будет беспорядочным.
UserPostedImage
Offline astronom  
#23 Оставлено : 21 октября 2012 г. 1:26:42(UTC)
astronom


Статус: Старожил

Группы: Member, Russia Team Group
Зарегистрирован: 27.07.2008(UTC)
Сообщений: 2,192
Откуда: РФ, Подольск

Сказал(а) «Спасибо»: 133 раз
Поблагодарили: 176 раз в 152 постах
Цитата:
Как должны работать планки в режиме Ganged? Unganged?

насколько я помню, Ganged - это когда обращение идет к двум каналам, будто это один толстый 128-битный канал. Очевидно, прирост производительности он даст в том случае, если данные передаются словом в 128 бит.
Не уверен в том, что это напрямую зависит или определяет распределение объема памяти по планкам. Т.е., что две планки по 8 Гб будут работать быстрее, чем одна на 16.

Цитата:
(ну вот сейчас у меня SAT@home считается сразу на 6 ядрах). В таком случае даже если каждый из потоков будет обращаться к данным последовательно, итоговый поток обращений к RAM будет беспорядочным.

разве отдельное ядро процессора может обращаться к памяти параллельно с другими ядрами? Не получается
Offline krasbars  
#24 Оставлено : 21 октября 2012 г. 7:51:24(UTC)
krasbars


Статус: Старожил

Группы: Editors, Member, Administration, Russia Team Group, Moderators
Зарегистрирован: 14.01.2009(UTC)
Сообщений: 2,728
Мужчина
Российская Федерация
Откуда: Красноярск

Сказал «Спасибо»: 566 раз
Поблагодарили: 486 раз в 356 постах
hoarfrost, ты куда-то уже совсем в дебри полез. Речь идёт о простом бытовом вопросе - есть ли смысл наращивать оперативку, если её и так хватает. И ответ тоже очень прост - нет (прирост скорости можно будет заметить только с помощью специфических тестов, но никак не воочию). Тем более, что у человека озвучены проблемы с 4-мя планками (да и тайминг тогда придётся в 2Т выставить). Ты таки хочешь, чтоб он ещё раз по граблям прогулялся? Не получается
i7 2600K@4200MHz + GTX570 (870/1740/3800) + HD5870 (930/4800) + 16Gb DDR III @1600MHz на Win7 x64 SP1 и BOINC x64 7.0.28

Offline ЧАТланин Баг  
#25 Оставлено : 21 октября 2012 г. 10:17:19(UTC)
ЧАТланин Баг


Статус: Старожил

Группы: Member, Russia Team Group
Зарегистрирован: 02.07.2008(UTC)
Сообщений: 1,403
Мужчина
Российская Федерация
Откуда: Мос. область

Сказал «Спасибо»: 189 раз
Поблагодарили: 155 раз в 122 постах
Автор: astronom Перейти к цитате
Автор: Шмяка Перейти к цитате
тут гдето ктото писал что делал в "лишней" памяти виртуальный диск для подкачки и при этом чтото сильно убыстрялось

создавать виртуальный диск в оперативной памяти для подкачки - это вообще ахинея какая-то mrgreen


Если "из 16 Гбайт система может задействовать 12" то не такая уж и ахинея. Не пропадать же четырем гектарам.
Ку! UserPostedImage
Таблица видюх -- http://b23.ru/c8xx
Offline hoarfrost  
#26 Оставлено : 21 октября 2012 г. 10:50:46(UTC)
hoarfrost


Статус: Старожил

Медали: Переводчику: За помощь в создании сайтаРазработчику: За разработку приложения CluBORunДонор: За финансовую помощь сайту

Группы: Editors, Member, Administration, Moderator Crystal Dream, Moderators, Crystal Dream Group
Зарегистрирован: 05.10.2007(UTC)
Сообщений: 8,376
Мужчина
Откуда: Crystal Dream

Сказал «Спасибо»: 1235 раз
Поблагодарили: 1690 раз в 1072 постах
Автор: astronom Перейти к цитате
разве отдельное ядро процессора может обращаться к памяти параллельно с другими ядрами? Не получается

Насколько я понимаю, для этого и нужен режим Unganged.

Автор: krasbars Перейти к цитате
hoarfrost, ты куда-то уже совсем в дебри полез.

Это я в качестве ответа на вопрос о том почему может быть так:

Автор: Freddykrug Перейти к цитате
Дело в том, что лет 10 назад, листая одну книгу про администрирование, запомнился случай: автор рассказывал, как увеличил скорость расчетов в научной лаборатории. Модернизировать компьютер не было возможности - поменялись платформы и более мощных комплектующих просто не выпускали... Что-то он там потестил, и порекомендовал набить оперативной памяти до предела. И это помогло.
П.С. Вот эта книга - Windows 2000: проблемы и решения.. Почему так запомнилась - непонятно... Не получается
UserPostedImage
Offline Freddykrug  
#27 Оставлено : 21 октября 2012 г. 14:03:46(UTC)
Freddykrug


Статус: Старожил

Группы: Member, Модератор Astronomy.Ru Forum
Зарегистрирован: 30.05.2010(UTC)
Сообщений: 2,874
Мужчина
Российская Федерация
Откуда: г. Томск

Сказал «Спасибо»: 740 раз
Поблагодарили: 494 раз в 313 постах
Автор: astronom Перейти к цитате
Автор: Шмяка Перейти к цитате
тут гдето ктото писал что делал в "лишней" памяти виртуальный диск для подкачки и при этом чтото сильно убыстрялось

создавать виртуальный диск в оперативной памяти для подкачки - это вообще ахинея какая-то mrgreen
Ахинея или нет, но программы для этого есть. Одну из них и ставил - на 32-битную ХР - вначале всё шло неплохо, но потом едва вернул управление ОС - комп всё время перезагружался. После чего сия хрень была беспощадно удалена.

Цитата:
Если "из 16 Гбайт система может задействовать 12" то не такая уж и ахинея. Не пропадать же четырем гектарам.
А есть ли смысл ставить эту программу для виртуального диска, когда и так, по идее, все данные должны сидеть в оперативке, которая намного быстрее жесткого диска? Или я чего-то не "понимяу"? ((с) Шмяка)

3 Gb Radeon 7950, i-5 2400, 16 Gb ОЗУ Astronomy.Ru Forum

Offline ЧАТланин Баг  
#28 Оставлено : 21 октября 2012 г. 14:17:57(UTC)
ЧАТланин Баг


Статус: Старожил

Группы: Member, Russia Team Group
Зарегистрирован: 02.07.2008(UTC)
Сообщений: 1,403
Мужчина
Российская Федерация
Откуда: Мос. область

Сказал «Спасибо»: 189 раз
Поблагодарили: 155 раз в 122 постах
Чтобы пропадающее не пропадало - то тут смысл есть. А то, что оно улаживается лишь такими кривыми путями лишь - то тут оно да, тут его нет.
Ку! UserPostedImage
Таблица видюх -- http://b23.ru/c8xx
Offline Шмяка  
#29 Оставлено : 21 октября 2012 г. 14:21:29(UTC)
Шмяка


Статус: Старожил

Медали: Роза: Девчатам от доброго сердца

Группы: Member, Crystal Dream Group
Зарегистрирован: 08.02.2012(UTC)
Сообщений: 1,862
Женщина
Российская Федерация
Откуда: Везде, куда ни занесет

Сказала «Спасибо»: 841 раз
Поблагодарили: 438 раз в 238 постах
Автор: ЧАТланин Баг Перейти к цитате
тут оно да, тут его нет.
запишу себе в блокнотик.

◕‿‿◕ Мяяяяяу!!! ◕‿‿◕ godville.net/gods/Шмяка ◕‿‿◕ MIUKA.mybrute.com ◕‿‿◕

UserPostedImage

Offline Freddykrug  
#30 Оставлено : 21 октября 2012 г. 14:52:05(UTC)
Freddykrug


Статус: Старожил

Группы: Member, Модератор Astronomy.Ru Forum
Зарегистрирован: 30.05.2010(UTC)
Сообщений: 2,874
Мужчина
Российская Федерация
Откуда: г. Томск

Сказал «Спасибо»: 740 раз
Поблагодарили: 494 раз в 313 постах
Ничего себе Чатланин загнул.... замешательство Если такими фразами будут изъясняться наши прапорщики и офицеры - нас, может быть, и завоюют, но не победят...
3 Gb Radeon 7950, i-5 2400, 16 Gb ОЗУ Astronomy.Ru Forum

Offline AlexA  
#31 Оставлено : 21 октября 2012 г. 15:14:33(UTC)
AlexA


Статус: Administration

Медали: Переводчику: За помощь в создании сайта

Группы: Editors, Member, Administration, Russia Team Group, Moderators
Зарегистрирован: 02.10.2007(UTC)
Сообщений: 6,139
Мужчина
Российская Федерация
Откуда: "Russia Team"

Сказал «Спасибо»: 1249 раз
Поблагодарили: 1515 раз в 837 постах
Автор: Freddykrug Перейти к цитате
Ничего себе Чатланин загнул.... замешательство Если такими фразами будут изъясняться наши прапорщики и офицеры - нас, может быть, и завоюют, но не победят...

Если вспомнить армейские анекдоты, так они меменно так и изъясняются smile
Да и в реале порой нехило загибают.
Я лейтенантом еще был, строевой смотр в части проходил. Зам.по опер. - подполковник ходил с линейкой вымерял правильно ли звездочки-значки прикручены. Ну и выдал потом: " В Латинской Америке в вашем возрасте офицеры перевороты делают, а вы значки правильно прикрутить не можете" smile

thanks 1 пользователь поблагодарил AlexA за этот пост.
skull100 оставлено 22.01.2013(UTC)
Offline astronom  
#32 Оставлено : 21 октября 2012 г. 15:19:19(UTC)
astronom


Статус: Старожил

Группы: Member, Russia Team Group
Зарегистрирован: 27.07.2008(UTC)
Сообщений: 2,192
Откуда: РФ, Подольск

Сказал(а) «Спасибо»: 133 раз
Поблагодарили: 176 раз в 152 постах
Автор: ЧАТланин Баг Перейти к цитате

Если "из 16 Гбайт система может задействовать 12" то не такая уж и ахинея. Не пропадать же четырем гектарам.

ну просто, какбе, смысл файла подкачки в том, что туда сбрасывается информация из оперативки. Сбрасывать инфу из оперативки в оперативку - это таки странно. buba
Конечно, если программа написана так, что ей НУЖНО использовать файл подкачки (хотя, не холопское это дело, решать, нужен тебе файл подкачки или нет), тогда да, будет прирост в производительности. Благо, такой индусокод встречается редко.

Цитата:
Насколько я понимаю, для этого и нужен режим Unganged.

Этот режим позволяет работать двум контроллерам памяти независимо друг от друга и не более того.
Не стоит забывать, что в обычном ПК одна системная шина, по которой передаются данные. Поэтому, даже если бы ядра процессора имели независимый доступ к памяти, все уперлось бы в шину, которая за один раз может выдавать данные только кому-то одному.

Отредактировано пользователем 21 октября 2012 г. 15:37:48(UTC)  | Причина: Не указана

Offline hoarfrost  
#33 Оставлено : 21 октября 2012 г. 19:18:30(UTC)
hoarfrost


Статус: Старожил

Медали: Переводчику: За помощь в создании сайтаРазработчику: За разработку приложения CluBORunДонор: За финансовую помощь сайту

Группы: Editors, Member, Administration, Moderator Crystal Dream, Moderators, Crystal Dream Group
Зарегистрирован: 05.10.2007(UTC)
Сообщений: 8,376
Мужчина
Откуда: Crystal Dream

Сказал «Спасибо»: 1235 раз
Поблагодарили: 1690 раз в 1072 постах
Автор: astronom Перейти к цитате
Не стоит забывать, что в обычном ПК одна системная шина, по которой передаются данные. Поэтому, даже если бы ядра процессора имели независимый доступ к памяти, все уперлось бы в шину, которая за один раз может выдавать данные только кому-то одному.

А какова, кстати, пропускная способность шины, контроллера памяти и как это соотносится со временем отклика RAM?

UserPostedImage
Offline Freddykrug  
#34 Оставлено : 21 октября 2012 г. 20:40:14(UTC)
Freddykrug


Статус: Старожил

Группы: Member, Модератор Astronomy.Ru Forum
Зарегистрирован: 30.05.2010(UTC)
Сообщений: 2,874
Мужчина
Российская Федерация
Откуда: г. Томск

Сказал «Спасибо»: 740 раз
Поблагодарили: 494 раз в 313 постах
Не могу удержаться от офф-топа...
Армейская лапидарность присуща, кстати, всем военным мира, ИМХО. Вспомнить хотя бы приказ Наполеона, отданный им во время похода в Египет, перед битвой: "Ослов и ученых на середину!"
Пояснения:
а) во время похода к военным были прикомандированы несколько ученых. Именно со времени египетского похода принято считать начало науки египтологии. До этого "неверным" появляться в Египте можно было только в качестве рабов;
б) военный строй был тогда в виде колонны - эдакого четырехугольника, в середину которого помещалось самое ценное;
в) почему-то французы в Египте использовали ослов, а не верблюдов. Как транспортное средство ослы были действительно ценны.
Так что приказ Бонапарта свидетельствует, по крайней мере, о его уважении к научным кадрам. Хотя получилось черт-те что...
3 Gb Radeon 7950, i-5 2400, 16 Gb ОЗУ Astronomy.Ru Forum

Offline astronom  
#35 Оставлено : 21 октября 2012 г. 20:48:27(UTC)
astronom


Статус: Старожил

Группы: Member, Russia Team Group
Зарегистрирован: 27.07.2008(UTC)
Сообщений: 2,192
Откуда: РФ, Подольск

Сказал(а) «Спасибо»: 133 раз
Поблагодарили: 176 раз в 152 постах
для Phenom II X6
Цитата:
Up to 17.1GB/s memory bandwidth for DDR2 and up to 21GB/s memory bandwidth for DDR3

Вероятно, в маркетинговой спеке говорят все же о гигабитах, а не о гигабайтах.

DDR2 работает где-то на 50 Гбит/с
Offline hoarfrost  
#36 Оставлено : 21 октября 2012 г. 21:51:26(UTC)
hoarfrost


Статус: Старожил

Медали: Переводчику: За помощь в создании сайтаРазработчику: За разработку приложения CluBORunДонор: За финансовую помощь сайту

Группы: Editors, Member, Administration, Moderator Crystal Dream, Moderators, Crystal Dream Group
Зарегистрирован: 05.10.2007(UTC)
Сообщений: 8,376
Мужчина
Откуда: Crystal Dream

Сказал «Спасибо»: 1235 раз
Поблагодарили: 1690 раз в 1072 постах
Автор: astronom Перейти к цитате
DDR2 работает где-то на 50 Гбит/с

Вроде бы как всё-таки для DDR3. Но это - максимальная пропускная способность достигаемая при последовательной выборки из памяти. При случайной - скорость должна упасть в разы.
UserPostedImage
Offline astronom  
#37 Оставлено : 21 октября 2012 г. 22:13:19(UTC)
astronom


Статус: Старожил

Группы: Member, Russia Team Group
Зарегистрирован: 27.07.2008(UTC)
Сообщений: 2,192
Откуда: РФ, Подольск

Сказал(а) «Спасибо»: 133 раз
Поблагодарили: 176 раз в 152 постах
ну хз. В любом случае, память работает быстрее шины и медленнее процессора mrgreen

Т.к., память - штука полупроводниковая, а не механическая, то я не как-то не вижу причин, чтобы при случайном доступе была большая потеря производительности. Падение производительности возможно при случайном чтении из-за непопадания в кэш. Но это не сильно связано с самой оперативкой.
Offline barsuk666  
#38 Оставлено : 21 октября 2012 г. 23:02:20(UTC)
barsuk666


Статус: Давно уж тут

Группы: Member
Зарегистрирован: 08.06.2011(UTC)
Сообщений: 474
Откуда: Москва

Сказал(а) «Спасибо»: 32 раз
Поблагодарили: 75 раз в 51 постах
Автор: astronom Перейти к цитате
Т.к., память - штука полупроводниковая, а не механическая, то я не как-то не вижу причин, чтобы при случайном доступе была большая потеря производительности. Падение производительности возможно при случайном чтении из-за непопадания в кэш. Но это не сильно связано с самой оперативкой.

При чтении из памяти сначала надо активировать строку банка, потом - прочитать значение в столбце. Задержки тут связаны с механизмами адресации и регенерации.
3-4-4-8
3 - тактов между подачей команды на чтение и началом передачи данных (при открытой строке)
4 - тактов на открытие строки
4 - тактов на закрытие строки (нужно перед тем как открыть следующую)
8 - минимальное время открытия строки, меньше держать ее открытой не выйдет
То есть при последовательном чтении из одной строки вы имеете 3 такта задержку вместо 4+4+8, если вы ее только что открыли и собираетесь закрывать чтобы открыть другую. Но тут я не копенгаген ни фига, так что-то слышал, что-то читал, потом все забыл...

Если есть свободные слоты, то за счет возможности открывать банки в разных модулях, теоретически скорость может увеличиться. Можно ли этот эффект разглядеть без микроскопа - лично я без понятия, никогда не экспериментировал :о(
Offline hoarfrost  
#39 Оставлено : 21 октября 2012 г. 23:21:55(UTC)
hoarfrost


Статус: Старожил

Медали: Переводчику: За помощь в создании сайтаРазработчику: За разработку приложения CluBORunДонор: За финансовую помощь сайту

Группы: Editors, Member, Administration, Moderator Crystal Dream, Moderators, Crystal Dream Group
Зарегистрирован: 05.10.2007(UTC)
Сообщений: 8,376
Мужчина
Откуда: Crystal Dream

Сказал «Спасибо»: 1235 раз
Поблагодарили: 1690 раз в 1072 постах
Автор: astronom Перейти к цитате
ну хз. В любом случае, память работает быстрее шины и медленнее процессора mrgreen

Т.к., память - штука полупроводниковая, а не механическая, то я не как-то не вижу причин, чтобы при случайном доступе была большая потеря производительности. Падение производительности возможно при случайном чтении из-за непопадания в кэш. Но это не сильно связано с самой оперативкой.

И тем не менее, это так, если я правильно помню - RAM latency. Чтобы получить доступ к произвольной ячейке памяти необходимо сначала выбрать строку (задержка tRСD), после чего подождать некоторое время - tRAS), а потом указывать, из какого "столбца" строки мы хотим читать данные. Если далее мы читаем данные из той же "строки", то просто имеем задержку в tCAS (у меня 9 циклов частоты памяти), но генерировать команды можно чаще (просто самы первый ответ не придёт раньше чем tCAS циклов). Если же мы хотим обратиться к адресу в другой строке то сталкиваемся со следующими задержками (беру свои тайминги):
1. RAS# to CAS# delay - 11 clocks;
2. CAS latency - 9 clocks;
3. tRP - 9 clocks;

Но это в самом грубом приближении. Вообще алгоритм работы RAM интересная штука.
UserPostedImage
Offline astronom  
#40 Оставлено : 21 октября 2012 г. 23:39:45(UTC)
astronom


Статус: Старожил

Группы: Member, Russia Team Group
Зарегистрирован: 27.07.2008(UTC)
Сообщений: 2,192
Откуда: РФ, Подольск

Сказал(а) «Спасибо»: 133 раз
Поблагодарили: 176 раз в 152 постах
хм, ну предположим:
нужно считать порцию данных, равную ширине шины. Ну пусть будет 128 байт. Т.е., нужно прочитать 128 ячеек.
Разве контроллер будет разом читать все ячейки, даже если они расположены друг за другом?
Пользователи, просматривающие эту тему
Guest
3 Страницы<123>
Быстрый переход  
Вы не можете создавать новые темы в этом форуме.
Вы не можете отвечать в этом форуме.
Вы не можете удалять Ваши сообщения в этом форуме.
Вы не можете редактировать Ваши сообщения в этом форуме.
Вы не можете создавать опросы в этом форуме.
Вы не можете голосовать в этом форуме.

Boinc.ru theme. Boinc.ru
Форум YAF 2.1.1 | YAF © 2003-2018, Yet Another Forum.NET
Страница сгенерирована за 0.303 секунды.