Российские распределенные вычисления на платформе BOINC
Форум участников распределённых вычислений.

Добро пожаловать, Гость! Чтобы использовать все возможности Вход или Регистрация.

Уведомление

Icon
Error

2 Страницы12>
Опции
К последнему сообщению К первому непрочитанному
Offline m7400  
#1 Оставлено : 26 мая 2014 г. 12:56:38(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
сегодня занялся разработкой процессора для вычислений в проектеCollatz Conjecture без обвязки загрузки выгрузки данных (само ядро) занимает чуть меньше 4500 логических элементов для 384 битных чисел (можно будет спокойно проверять 115-значные числа (в десятичной системе) в данный момент приходят задания для 22 значных чисел и в ближайшие лет 5 навряд ли дойдет до 115 значных ) вопрос в том ускорятся ли вычисления на fpga(понятно что производительность на ватт будет гораздо выше но хватит ли ее чтобы добраться до производительности хотя бы CPU не говоря уже о GPU хотя если на самой fpga места много то можно несколько блоков впихнуть) и возможно ли где-то заказать чипы по своей схеме?
Offline evatutin  
#2 Оставлено : 26 мая 2014 г. 14:52:31(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,640
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 1023 раз
Поблагодарили: 1827 раз в 886 постах
А что из себя представляет соответствующий процессор? О каких логических элементах идет речь (ЭВ, LUT'ы, SLICE'ы)? Оценку времени обработки в суммарном времени задержки логических элементов выполняли? Теоретически можно попробовать сделать на ПЛИС, понимая все плюсы и минусы данного решения...

PS. Если не секрет, зачем вам оно? smile

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Offline m7400  
#3 Оставлено : 26 мая 2014 г. 16:15:27(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
Цитата:
зачем вам оно? smile

надоел шум и низкая производительность) ведь если народ подтянется можно чипы заказать на заводе наверное
Цитата:
А что из себя представляет соответствующий процессор?

пока только зацикленный делитель да умножитель с подсчетом шагов (но деления на 2 как такового нету просто на выход сразу подаю смешенные вправо биты а 3x+1 тоже
оптимизировал подачей на сумматор одновременно самого числа и смещенного влево ну а потом прибавляем 1 просто блок на полусумматорах если в блоке находится 1 то можно выгружать счетчик шагов и загружать следующее число а сейчас думаю над раздатчиком чисел для таких блоков думаю на 1 раздатчик нужно блоков этак 16 ну и можно поиграться с количеством блоков когда fpga приедет из китая (раньше работал только с микроконтроллерами и логикой ) а и раздатчик вычисляет среднее число шагов для к примеру 16 блоков и запоминает максимальное число шагов и само число )
Цитата:
Теоретически можно попробовать сделать на ПЛИС, понимая все плюсы и минусы данного решения...

в любом случае для подбора оптимального числа блоков для раздатчика, задержек и экспериментов нужна платка с фпгашкой (чтоб я делал без китайцев redface )
Offline evatutin  
#4 Оставлено : 26 мая 2014 г. 16:25:50(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,640
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 1023 раз
Поблагодарили: 1827 раз в 886 постах
А теоретически вы прикидывали, будет ли выигрыш по сравнению с GPU? У меня, например, есть аспирант, который планирует сделать в железе транзитивное замыкание, сводимое к булеву умножению матриц — сейчас у него в черновиках есть наброски схем и оценка времени обработки, выигрыш по сравнению с GPU в теории намечается, соответственно овчинка вроде бы стоит выделки

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Offline m7400  
#5 Оставлено : 26 мая 2014 г. 16:32:39(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
GPU 720m (ноутбучная) около 57 миллионов чисел в секунду (22 значных)
а для 22 значных чисел получается около миллиона чисел для блока и нужно всего то 60 блоков для обеспечения производительности простенькой видеокарты (это при постоянно выполнении 3х+1 на деле операция х/2 выполняется гораздо чаще и выполняется в 3500 раз быстрее чем 3х+1 в итоге для 1 блока производительность может оказаться сравнимой с простеньким GPU)
P.S. по идее на 1 реальный чип можно впиндюрить около 1000 таких блоков и задержка на 1 элементе может быть гораздо ниже в итоге для 1 чипа с пассивным охлаждением вполне доступна производительность GTX Titan

Отредактировано пользователем 26 мая 2014 г. 18:10:30(UTC)  | Причина: ошибка в расчетах

Offline m7400  
#6 Оставлено : 26 мая 2014 г. 17:59:33(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
а если не секрет каким образом аспирант будет реализовывать чип? и сколько примерно это стоит?
Offline evatutin  
#7 Оставлено : 26 мая 2014 г. 19:44:05(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,640
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 1023 раз
Поблагодарили: 1827 раз в 886 постах
Аспирант обучается в аспирантуре, его цель — разработать структурно-функциональную организацию устройства и доказать ее новизну (запатентовать). Рабочая железка — это бонус, но не обязательный атрибут, у нас часто ограничиваются программными моделями

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Offline m7400  
#8 Оставлено : 26 мая 2014 г. 22:42:50(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
нашел фирму хоть 130нм не ахти всяко лучше плиса посмотрим сколько заломят за изготовление
Offline m7400  
#9 Оставлено : 27 мая 2014 г. 21:51:29(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
китайцы наконец выслали fpgaшку и да кстати пересчитал скорость работы в общем по 130нм технологии фирма обещает задержку 20 пс и при примерной прикидке количества "длинных"
операций 3х+1 (операция деления на 2 выполняется без задержки (хотя задержка будет на нескольких элементах для генерации сигнала конца операции)) получаем для среднего количества шагов 504 длинных операций будет примерно 194 получим пиковую производительность 17.2 млн 115 значных либо 72 млн для 22 значных тобиж производительность 1 блока для решаемых на сегодня задач гораздо выше простенькой GPU а таких блоков на кристалле можно больше 1000 впихнуть
P.S. фирма пока ничего не ответила конечна найти бы 22нм тогда и производительность будет выше да и больше блоков впихнуть можно будет
Offline m7400  
#10 Оставлено : 27 мая 2014 г. 21:57:05(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
а вообще на форуме 1 человек сидит что-ли rolleyes
может поднять тему на форуме колатза хотя хотелось бы поднять трошки русскоговорящие команды в топ redface
Offline evatutin  
#11 Оставлено : 27 мая 2014 г. 22:23:08(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,640
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 1023 раз
Поблагодарили: 1827 раз в 886 постах
Цитата:
фирма пока ничего не ответила конечна найти бы 22нм тогда и производительность будет выше да и больше блоков впихнуть можно будет


Вы имеете хотя бы примерное представление о стоимости заказного изготовления микросхем (хотя бы порядок цифры)?

Цитата:
а вообще на форуме 1 человек сидит что-ли


Человек может и не один, но тема у вас весьма специфическая... Вы многоразрядное сложение кстати как реализовывать планируете? Какие-то наброски схем возможно имеются?

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Offline m7400  
#12 Оставлено : 27 мая 2014 г. 23:12:32(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
Цитата:
Вы имеете хотя бы примерное представление о стоимости заказного изготовления микросхем (хотя бы порядок цифры)?

пока фирма молчит)) китайцы печатки жеж под заказ клепают может и 100 микросхем согласятся ?) да и по процессу самому убогому может вы и правы купить хороший плис с огромым числом вентилей да и все а прошивку распространять только по нашим командам smile хорошо что али стал принимать вебмани )

Цитата:
Вы многоразрядное сложение кстати как реализовывать планируете?

довольно просто к примеру у нас этак 1024 вычисляющих блока у каждого блока есть 2 флага (первый при установке в 1 означает что мы дошли до единицы и можно выгружать счетчик и загружать следующее число второй флаг для внутренних вычислений мол если 1 загрузить в регистр результат и отправить снова на вычисление) вот а этими блоками управляет раздатчик (уж не знаю как по научному просто раздает числа на блоки ) ну и если первый флаг какого то блока устанавливается на 1 загружаем число в блок считываем счетчик блока и суммируем шаги (над поиском числа у которого максимальное количество шагов сейчас думаю точнее думаю над оптимизацией слишком много элементов там для такой функции) ну и прибавляем 1 к числу которое загрузим в следующий блок (у которого установлен первый флаг в 1) и опять все по новой пока не дойдем до нужного числа (и опять тут легко параллелится если у нас к примеру 2 раздатчика то на первый подаем начальное значение и необходимое количество шагов /2 на 2 подаем начальное значение + необходимое количество шагов /2 и необходимое количество шагов /2)
Offline m7400  
#13 Оставлено : 27 мая 2014 г. 23:14:45(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
Цитата:
Какие-то наброски схем возможно имеются?

пока все на черновиках после переноса в среду разработки для плис покажу так сказать в живую)
thanks 1 пользователь поблагодарил m7400 за этот пост.
ReaDy оставлено 28.05.2014(UTC)
Offline evatutin  
#14 Оставлено : 28 мая 2014 г. 8:31:25(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,640
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 1023 раз
Поблагодарили: 1827 раз в 886 постах
Про сложение: операцию вы планируете реализовать в виде комбинационной схемы или конвейерно? Над синхронизацией думали? Длины логических цепочек считали? Сумматоры ведь разные есть (с последовательным переносом, с параллельным, с групповым и пр.) — вы какие планируете использовать?

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Offline m7400  
#15 Оставлено : 28 мая 2014 г. 13:03:38(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
используется 1 сумматор с последовательным переносом на который сразу подается число и число смещенное влево (умножение на 3 со скорости становится равным сумматору даже быстрее ведь много элементов можно сократить) а сложение с 1 на полусумматорах конечно можно это все дело еще ускорить но тогда может пропасть читаемый вид схемы (в финальной версии понятно что нужна будет максимальная скорость и на читаемый вид схемы можно положить но при разработке нужно сначала нарисовать всю схему а уже потом искать узкие места и оптимизировать)
да для синхронизации используются флаги которые раздатчик постоянно проверяет и выдает новое число для блока (ну и еще несколько операций выше писал подробнее)
на днях думаю в обычный эмулятор впихнуть глянуть правильно ли продумана логика
Offline m7400  
#16 Оставлено : 28 мая 2014 г. 14:58:45(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
UserPostedImage
Offline evatutin  
#17 Оставлено : 28 мая 2014 г. 15:00:33(UTC)
evatutin


Статус: Старожил

Медали: Первооткрывателю: Результат в проекте SAT@homeРазработчику: За организацию проекта Gerasim@home

Группы: Editors, Member
Зарегистрирован: 08.06.2010(UTC)
Сообщений: 3,640
Откуда: Russia, Kursk

Сказал(а) «Спасибо»: 1023 раз
Поблагодарили: 1827 раз в 886 постах
Сложение можно сделать и простейшим сумматором с последовательным переносом, но конвейерно 199
В общем думайте, как определитесь окончательно, схему можно будет посмотреть

kvt.kurskstu team founder
Gerasim@home scientist
My numbers are 5056994653507584 and 1835082219864832081920. Why not? smile
Offline m7400  
#18 Оставлено : 28 мая 2014 г. 15:03:49(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
3х+1 работает только с нечетными числами а с другими нам и не нужно))
скорее всего не лучший вариант но все же )
схему в любом случае нужно мелкими частями тестировать
Offline m7400  
#19 Оставлено : 28 мая 2014 г. 15:09:56(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
кстати заметил что если нечетное число умножить на 3 и прибавить 1 то оно становится четным тобиж можно после 3х+1 дальше работать с сдвинутым числом а то и вообще сдвигать его пока оно не станет нечетным (не знаю как отразится на скорости)
Offline m7400  
#20 Оставлено : 28 мая 2014 г. 20:23:25(UTC)
m7400


Статус: Интересующийся

Группы: Member
Зарегистрирован: 26.05.2014(UTC)
Сообщений: 66
Беларусь

Сказал(а) «Спасибо»: 57 раз
Поблагодарили: 6 раз в 5 постах
UserPostedImage
5 битный делитель на 2 на 4 на 8 либо на 16 (после 3х+1 число четное так что 1 бит просто выкидываем) на 32 и так далее не имеет смысла ставить т.к. только замедлит работу да и вообще операций деления на 2 всего в 1.7 раз больше чем 3х+1 так что вероятность того что число будет еще раз делиться на 2 резко уменьшается
этот делитель планирую прикрутить сразу после 3х+1 а если все таки будет делится еще на 2^n не беда просто результат будет браться с другой шины на которой всегда находится число деленное на 2 потом это все дело загружается в регистр а из регистра опять подается на вход
Пользователи, просматривающие эту тему
Guest
2 Страницы12>
Быстрый переход  
Вы не можете создавать новые темы в этом форуме.
Вы не можете отвечать в этом форуме.
Вы не можете удалять Ваши сообщения в этом форуме.
Вы не можете редактировать Ваши сообщения в этом форуме.
Вы не можете создавать опросы в этом форуме.
Вы не можете голосовать в этом форуме.

Boinc.ru theme. Boinc.ru
Форум YAF 2.1.1 | YAF © 2003-2018, Yet Another Forum.NET
Страница сгенерирована за 0.200 секунды.