КНР и Россия разработали метод повышения производительности видеокарт Nvidia в научных вычислениях. Их удалось ускорить в 800 раз. Nvidia по решению властей США сильно ограничена в поставках своих решений для науки на Восток.
Санкции нипочем
Ученые из России и Китая совместными усилиями научились повышать производительность видеокарт Nvidia в научных вычислениях, пишет South China Morning Post. Они использовали для этого информацию, почерпнутую в ходе реверс-инжиниринга – обратного проектирования ускорителей.
Полученные знания позволили авторам идеи ускорить карты Nvidia в научных вычислениях в 800 раз. Алгоритм для работы с памятью карты, позволяющий сделать это, создали ученые из университета МГУ-ППИ.
Университет МГУ-ППИ в расположен Шэньчжэне (Китай) и является первым совместным российско-китайским вузом. Он учрежден в 2014 г., а его соучредителями являются российский МГУ имени М.В. Ломоносова, Пекинский политехнический институт наряду с Муниципальным народным правительством Шэньчжэня.
Christian Wiediger / Unsplash
Недорогая видеокарта из ближайшего компьютерного магазина теперь может стать «сердцем» высокопроизводительных вычислений
Новый алгоритм решает общую для России и КНР проблему – обе страны находятся под санкциями США и испытывают трудности с поставками ускорителей Nvidia для высокопроизводительных вычислений, в том числе для искусственного интеллекта. На обычные карты это тоже распространяется, но в меньшей степени, и китайцы, как сообщал CNews, уже научились превращать их в полноценные ускорители искусственного интеллекта. Также они скупают игровые ПК и затем вытаскивают из них видеокарты Nvidia и продают их отдельно, тем самым обходя санкционные ограничения.
Новый алгоритм, по сути, позволяет не обращать внимание на санкции и использовать в научных расчетах игровые видеокарты Nvidia, которые можно купить в официальной российской рознице, пусть и по завышенной (в связи с курсом рубля и параллельным импортом) цене.
В чем преимущество
Как пишет South China Moring Post, совместная китайско-российская разработка открывает новые возможности для решения различных сложных механических задач во многих отраслях промышленности. Издание приводит в качестве примера в первую очередь аэрокосмическую и военную промышленности
Также South China Moring Post сделало акцент на том, что новый алгоритм позволяет проводить вычисления на видеоускорителях, которые отличаются низкой стоимостью (видимо, в сравнении с ускорителями для искусственного интеллекта) и не подпадают под санкции США.
Скрывать нечего
Засекречивать факт проделанной работы китайские и российские специалисты не стали. Они описали основные ее моменты в статье, опубликованной в китайском журнале Journal of Computational Mechanics.
Технически, авторы алгоритма провели реверс-инжиниринг архитектуры Nvidia с поддержкой среды CUDA. По их словам, они достигли впечатляющих результатов. «Эта эффективная вычислительная мощность позволяет исследователям сократить затраты времени на вычисления, которые обычно занимают несколько дней, до нескольких часов или даже минут при использовании обычного домашнего графического процессора, что является значительным достижением для исследований в области частичных децентрализованных процессов», – говорится в статье ученых.
Практическое применение
Разработанный специалистами МГУ-ППИ алгоритм лег в основу созданной ими же среды разработки PD-General. Этот фреймворк предлагается использовать для проведения расчетов в сфере перидинамики. Это нелокальный численный метод для оценки материалов на их неоднородную деформацию, включая трещины и полное разрушение.
Перидинамика часто применяется в аэрокосмической отрасли. При помощи нового алгоритма такие вычисления теперь можно ускорить в 800 раз.
Комментарии
на них вроде как майнить еще можно было....?:)
Этот метод можно для любых вычислений применять или только для каких то специальных?
Этот метод называется "программирование без индусов". Вероятно, что можно оптимизировать любой код и новое железо не понадобится. Но это же убытки и прекращение гонки нанометров.
Гонку нанометров ни в коем случае нельзя останавливать даже при таких успехах в софте
Это, ты с козырей зашёл. В 85 году заимел прграммируемый калькулятор МК85. Тут же набросал программку для подсчета "счастливых" автомобильных номеров: сумма 2х первых цифр равна сумме 2х вторых (тогда номера были вида 99-99 ССС).
Ерунда. 4 цикла от 0 до 9, 4 условия, счетчик.... Запустили и пошел курить. Вернулся, ожидая получить результат, и нецензурно удивился, увидев мелькание на индикаторе. Остановил. Посмотрел, сколько прошло итераций. Почесал, тогда ещё волосатую башку. Выходило, что для завершения задачи, потребуется 56 часов.
Задумался.
Сумма 0 и 0 может быть только в одном варианте, так же как и 18-18.
Сумма 1 и 1 может быть получена 4-мя комбинациями:
01-01
01-10
10-01
10-10.
Также, как 17.
4 и 4. А, сумма 2?
9 вариантов. Так же, как и сумма 16.
Ага! Т.е., программа редуцируется до удвоенной суммы квадратов (n+1) при n от 0 до 9. И вычесть квадрат (9+1). У суммы "9" пары нет.
Переписал. Выполнилась за 20 секунд. Да. Длиннее стала. Тут же вспомнил постулат Донды: "То, что маленький компьютер может сделать, имея большую программу, большой компьютер сделает, имея малую, отсюда следует вывод, что бесконечно большая программа может действовать без всякого компьютера".
Как-то так.
Глубоко, спасибо. Это даже не (только) про компьютеры...
Все по делу, но есть нюанс. Если нормально писать софт, то растут сроки. И половина софта становится тупо не нужна вообще
Поправка: растут сроки выхода на рынок. Для
капиталистабизнеса это важно )А вот сравнение трудозатрат на разработку плюс поддержку для подходов с упором на качество и на скорость... мне не попадалось.
1. Бывают проекты короткие, срочные, условно на год. А бывают надолго, годы и десятилетия. С переписыванием и кучей версий. В первых упор на качество не даёт денежного эффекта. И первого типа проектов большинство
2. Про выход на рынок - безусловно, это финансовый вопрос. И зачастую разработка вообще не несет смысла если не выйдет за 3-6 месяцев
3. 90% продуктов вообще не требуют отдельной оптимизации, т.к. прилично пашут на любом железе последних лет трёх. В таком оптимизация идёт на стадии выбора инструментария
Еще в бытность win8 воследней виндой, встречал в сети исследование что если переписать "индусский код" нормально то, дистриб сократится на 60%, а выч вощности можно будет урезать на 50% для нормальной работы.....
В 90х писал на Clipper. Был такой язык. Тогда же появилось расширение языка ClipperTools. Сильно облегчало работу. А через пару лет кто-то переписал это на Ассемблер.
Скорость не особо возросла, все-таки основные тормоза были с базой, но памяти стал жрать меньше.
Ну базы сложно ускорить асмом.... Так что клипер что лису асмом сильно не разгонишь, а вот ресурсы это да, позволяло пользовать более слабые машины.....
Митя, Вы бесконечны буквально как атом - Вы еще FoxPro застали?
Я писал на Фортране и КвикБейсике ))
P.S. И Паскале же ещё!
Я с 1985 года знаком с компьютерами, матушка была программистом на одном из заводов и пользовала служебное положение))) ну и с азами асма знаком))) а на лисе матушка "шабашила в святые 90е" когда в поликлинниках ваодили первые стат базы, не знаю как в других МСЧ, а в нашей, районной, стат база писалась на лисе....
Да, Лиса в свое время была крайне популярна, крайне
А сейчас еще что-то пишите или уже в прошлом? Раз "дистры разрастаются и жрут ресы"?
И крайне не плоха для своего времени))) а кто то и до сих пор ее пользует под небольшие базы))
Для работы с под учётным контингентом, который отчитывается об оперативной обстановке...
Ну и рукастый же этот кто-то!
🤝
Мужик - герой
Начинал с dBase, далее FoxPro, потом Clipper. Жму руку
Я и сейчас на нём пишу....
Не часто, правда. Утилитки всякие для поддержки старинных баз . Ну как старинных... 1994 - 2017 годы. А потом переехали на Оракл, но надобность осталась.
И как же шустро сейчас работают клипперные программы!
А где тогда индусы будут харчеваться?
В США ИМХО нет проблем - будут MS Office писать
50% - это фигня. Никто жопу не почешет, если в десяток раз выигрыша не будет. А лучше даже в сотню.
Спорно. Например RTX 4080 опережает RTX 3080 12 GB на 30%. RTX 4070 опережает RTX 3070 на 21%. Так что, 50% не фигня вовсе.
Это тут при чем? Речь за то, чтобы сидеть и софт оптимизировать (ручками, естественно). Обычно такое происходит, когда после переноса на другую платформу производительность драматически проседает во многие разы, а то и десятки раз (Эльбрусу привет) и надо хоть как-то ситуацию привести к норме.
Ну с эльбрусом да, то что написано именно под него и крутится минуя "интерпритаторы и вм", работает очень даже не плохо, а вот как только запускаешь виндозное через "интерпритаторы" то сразу боль и пичаль......
В этом и проблема что все хотят "в разы".... А дистры продолжают разрастаться и жрать ресы......
Это точно
А чем любые вычисления отличаются от специальных?)) Плюсы что ли неровные?)) или минусы короче?)))
Ну просто не любые вычисления же пишутся индусами и так, что в них вместо одной строчки 800 получается.
А так-то да, это не удар, а просто напоминание, что когда речь заходит о гигаваттах для датацентров, то можно уже и на оптимизацию какие-то деньги выделить.
Ну что вы на индийских программистов?
Главное - язык!
Если русского учить в Йельсеом университете, получится Чубайс.
А ежели индуса в МГУ - получится нормальный человек, понимающий, что язык предназначен для передачи понятий.
А не для зарабатывания денег любыми путями, даже предательством.
Значит, люди, которые в Индии занимаются разработками для космоса учились в Бауманке - так как их аппарат совершил мягкую посадку на Луну. А аппарат от Роскосмоса сделал исследование поверхности Луны ударным способом.
Вообще, индийская космическая программа очень эффективна - даёт хорошие результаты при очень скромном бюджете.
Вот!
Не только МГУ, но и Бауманка делает индуса инженером и человеком.
Точнее - русский язык и инженерная школа даёт больший эффект, чем английский язык и инженерная школа.
Даже корейский язык лучше английского!
))))
Почти две трети советских аппаратов закончили свои полёты неудачей. А тут первый после долгого перерыва и развала экономики...
То есть индусы просто не все задачи в мире обсчитывают, но всё-таки и специальные вычисления делают.
Хотя бы тем, что специальные требуют много матричных вычислений.
И вы думаете, что индусы не применяют матричных вычислений?
Вопрос не применения, а оптимизации... Можно в лоб считать дискретное фурье преобразование матрицы данных, а можно разными ухищрениями, типа разностных, сократить объём расчётов на пару порядков...
то есть по вашему индусы крайне ограничены и умеют только "в лоб"?
Кто то вспомнил что, помимо высокоуровевых питонов, С# и явы есть еще и низкоуровневый асм....
Думаю немало индусов и на ассемблере программируют)))
Да я ж не против))) просто на асме сложно писать "щатейливые конструкции с костылями"))) менее продуктивно))))
Да, но до каких же скоростей таким образом можно разогнать топовые "санкционные"?
Может стоило и засекретить?
Скорее всего, разница будет не велика
Эра безраздельного лидерства США в компьютерных технологиях безвозвратно ушла в прошлое. Всё возвращается на круги своя. В смысле, мировым лидером в науке опять становится Россия. Как это и было до 25 октября 1917. Ну и Китай тоже. Ладно, чего уж там... )
Страницы