1. Объемный интегрированный "чип"/материнка для ИИ / ASIC-майнера:
1.1. Многослойные системы на тепловых трубках с ограниченной ремонтопригодностью.
ИИ / ASIC чипы на материнках с быстрой памятью(естественно технологию имеет смысл сразу отрабатывать на ASIC'е) площадью 1-2 см2 монтируются на материнку по схеме(вертикальных горизонтальных рядов с пронизывающими их тепловыми трубками(что добавляются на последнем этапе)):
zzzzzzzzzzzzzzzz ram
zххххххххххххххz ram
zхохохоххохохохz ram
zххххххххххххххz ram
zхохохоххохохохz ram
zххххххххххххххz ram
zzzzzzzzzzzzzzzz ram
где "о" - места расположения тепловых трубок, "ram" - RAM, а "z" - места контактов (прижимного действия как на процессорах) для высокоскоростной шины обмена данными что позволило бы собирать многопроцессорные кластеры материнок в блок. Это что-то вроде 256-слойных SSD флешек которые поваляют работать с RAM скоростями обмена данных.
Если для ASIC'ов это не особо актуально то для ИИ чипов (интегрированных миникомпьютеров управления до 1 триллиона параметров с вменяемым временем отклика, относительно низким энергопотреблением и не сильно агрессивным ценником скажем до 2-х к уе) ИМХО подобная технология интеграции (создания кластера чипов) вполне актуальна.
1.2. Многослойные системы относительно высокой ремонтопригодности размещенные по сути в внутри тепловой квадратной емкости - "кастрюли", с обратным холодильником(с системой наполнения фреоном (если он не агрессивен к материнским платам) как в кондиционерах (контроль или по весу или теплопотерям)). Все чипы для высокой покрываются припаянными медными лентами с капиллярной поверхностью(как внутренняя поверхность тепловых трубок).
Так даже при высокой плотности интеграции материнских плат и высокой скоростью испарения теплоносителя охлажденный теплоноситель от обратного холодильника со дна емкости/"кастрюли".
Фреон может быть слит. Обратный холодильник может быть демонтирован для проведения замены материнок (материнки имеют соответствующие контактные площадки как в варианте 1 но без тепловых трубок (хотя могут быть технологические отверстия для быстрой доставки накачки фреона)).
В случае проблем с доступом фреона к центральной части блока в систему встраивается активная полностью погруженная в фреон полуоткрытый циркуляционный насос для фреона и трубки для накачки охлажденного фреона в центр объемного блока чипов по аналогии с водяным охлаждением плоских чипов.
К примеру, в "кубе" поперек плат (ниже центра 1/4 1/3 от низа куба) оставляется сквозное отверстие в платах и с двух сторон циркуляционным насосом создается давление жидкого фреона для равномерного поступления жидкого фреона к основным чипам при малом технологическом расстоянии между платами. Следует учесть что главное обеспечить надежный контакт жидкого фреона с "капиллярными лентами" прецизионного охлаждения на всех материнках.
В некоторых случаях может использоваться конфигурация "звезды" или даже лучше перевернутой "пальмы" с радиальными(круговыми) структурами, с выводом пузырьков вверх между чипами. Пузырьки испарившегося фреона будут ухудшать охлаждение на периферии платы (или между чипами) там где будут расположены менее энерго нагруженные элементы(что не нуждаются в жидкостном охлаждении фреоном). Или может быть несколько увеличено расстояние между платами.
Между "кастрюлей" и системой охлаждения (обратным холодильником) размещается дополнительная плата для подключения ИИ/ASIC' "куба" а также встроенная в плату многоканальная высокоскоростная оптическая шина и низкоскоростная шина данных уровня USB для старта и заливки данных на SSD для простого стандартного конфигурирования ИИ/ASIC'а.
***
"Cэндвич структура", когда ИИ/ASIC чипы используются в 256 слоев по сути в объемном чипе теряется значимость нанометров. Для высокой интеграции и частот уже не надо 1 нанометр. Ту же производительность можно получить на меньших нанометрах с меньшей площадью чипа (при этом вырастает выход годных чипов т.к. редкие дефекты будут попадать на маленький чип, а не на чип площадью в кредитку). А также такие чипы проще монтировать на материнку (по технологии монтирования чипов) на сотовые телефоны на достаточно простом оборудовании). А также увеличивается срок службы таких чипов (меньшие нагрузки теплового расширения коробления). Получается вин вин. И не надо за такой "куб" отдавать от 35к резанной а то и все 70к резанной за одну материнку с ИИ чипом нового поколения, которые ко всему недоступны для покупки на контр западе.
upd
1.3. Более конкретный существующий фреон для метода 2(один из).
ru.wikipedia.org/wiki/Novec_1230
Novec 1230, «Сухая вода» (фторкетон ФК-5-1-12, хладон ПФК-49) — жидкость без цвета и запаха, хладагент, огнетушащее вещество.
Температура • плавления −108 °C • кипения 49,2 °C
Удельная теплота испарения 95 кДж/кг
применяется для охлаждения электроники методом погружения. Однако компания-производитель рекомендует для этой цели другие жидкости семейства Novec (Novec 7100, Novec 7000, Novec 7300 и т. д.).
Novec 7100 Температура кипения 61 °C
В этом случае и при внешней проточной системе охлаждения снимается проблема газообразования у фреона. Но в значительной степени ухудшается вопрос модульности и частного использования такой системы охлаждения. В т.ч. на предприятиях, ИП в качестве недорогих ИИ систем с соблюдением конфиденциальности запросов.
1.4. Пример проточной системы.
Материнки / платы вроде плат для смартфона, но с несколькими ИИ чипами с двух сторон фиксируются в разъемах PCI-e 5.0 или выше (возможно в более узком исполнении).
Полноразмерная видеокарта x16 может потреблять до 5,5 А при напряжении +12 В (66 Вт) и 75 Вт в совокупности после инициализации и настройки программного обеспечения в качестве мощного устройства.
Через 2 таких разъема можно подать 150 Ватт на плату без дополнительных разъемов питания. А если разъемы модифицированные и с учетом охлаждения, то 250 Ватт и больше. При больших размерах плат можно использовать 4 разъема - по 2 с каждой стороны.
На высоконагруженные элементы могут устанавливаться/припаиваться медные мини радиаторы (при необходимости с капиллярным напылением если это повысит надежность и пределы эксплуатации).
Проблема, что в такой конфигурации условно нижняя плата PCI-e будет использоваться только для передачи данных в режиме условно 24х. А верхняя плату придется использовать как 8х для данных(для каждой мини платы) и остальные разъемы можно отвести под питание. Тогда в емкости для системы охлаждения можно сделать множественный боковой подвод и отвод жидкости (при повышенном давлении/напоре в системе). Тогда верхнюю плату можно использовать для подключения интерфейсных кабелей и кабелей питания.
***
Возможно продукты и платформы для домашних ИИ что сегодня уже производит Nvidia
или еще решение от:
IBM представила свой процессор Telum II и ИИ-ускоритель Spyre
https://habr.com/ru/companies/dcmiran/news/838902/
для установки на ПК
будет достаточно для закрытия части вопросов предприятиям и ИП.
***
Но более серьезные видеокарты для ИИ 20-100к резаной и дороже с высокой интеграцией все еще необходимо создавать (в контр западном блоке) на альтернативной платформе и основе чем Nvidia.
ИМХО в ближайшие годы в Китае возможно будут выпущены специализированные конкуренты как для Project Digits так и Nvidia GB200 NVL72
https://habr.com/ru/companies/serverflow/articles/864314/
GB200 NVL72 — это серверный шкаф, состоящий из 36 центральных процессоров Nvidia Grace и 72 графических процессоров B200 на новейшей архитектуре Blackwell.
Nvidia DGX GB200 NVL72 Blackwell будет стоить 3 млн долларов.
3000/36=83к резаной за один серверный модуль. (для экономии энергии связь между модулями по проводам, а не по оптике)
NVIDIA H200 NVL
Благодаря подключению до четырех графических процессоров с помощью NVIDIA NVLink™ и увеличению памяти в 1,5 раза вывод большой языковой модели (LLM) может быть ускорен до 1,7 раза, а приложения HPC достигают до 1,3 раз большей производительности по сравнению с H100 NVL.
H100 NVL $38k
https://nvidia-server.ru/katalog/item/nvidia_h200_nvl_141gb/
Для сравнения h100:
https://docs.jarvislabs.ai/blog/h100-price
$25к.
***
2. Кольцо Нивена (вокруг Солнца)
Жёсткое кольцо относительно небольшой ширины (порядка процентов диаметра)
«Мир-Кольцо́» (англ. Ringworld) — научно-фантастическая серия из четырёх романов, написанных Ларри Нивеном, снискавших огромную популярность во всём мире.
Энергия помимо солнечных панелей может получаться из разницы температуры поверхностей на внутренней поверхности кольца и наружного (тепловые насосы на теплоносителе(Двигатель-генератор Стирлинга), Термоэлектричество (хотя не имеет подвижных частей чтоб ломаться, но КПД системы достаточно низкий если не смешной)) и протонного потока солнечного ветра. Смотря какой метод проще реализовать и отношение цена/качество лучше.
Основа - для кольца Нивена (а далекой предалекой перспективе освоения автономной робототехники на солнечных панелях и ИИ) астероидный пояс созданный из Меркурия.
Температура поверхности изменяется в обширном диапазоне, от -173 °C на ночной стороне и полюсах до 430 °C на экваторе в полдень.
На какой-то широте около полюса под поверхностью на Меркурии может быть вполне комфортная температура как минимум для роботизированного оборудования.
***
3. С металлоискателем на Луну и на дно морей и океанов.
Создать запустить автономный луноход на Луну с целью поиска металлических и никелевых метеоритов (если есть возможность отличить их от теоретической металлической пыли что должна содержаться в реголите).
Конечно не все падающие на Луна метеориты металлические и значительная часть просто испарятся при падении как на Земле при входе в атмосферу через преобразование кинетической энергии в тепловую (слишком сложны условия для того чтобы они не испарились). А на морском дне металл метеорита будет быстро съедаться ржавчиной. Т.е. данная "идея" смахивает на пустышку (если не на двойную пустышку).
Комментарии
Метеоритов на Луне (как и на любом крупном теле без атмосферы) быть не может. Никаких, нигде и никогда. Ана морском дне фишка другая - в придонном слое на любой пригодной поверхности оседает слой железа из раствора, причем достаточно быстро (гуглить "железомарганцевые конкреции").
Повесь магнит, да собирай пыль и обломки. Магнитных сепараторов всех видов море. Вот лунную медь собрать будет гораздо сложнее.
Перспективное направление для изучения кстати и потенциальной добычи железа на Луне.
Я даже способ знаю. Спускаешь с орбиты трос с офигенным магнитом м тралишь. Заодно мешающие пилотируемой космонавтики лунные неровности устранятся. Заметьте, даром отдаю многомиллиардный проект.
А зачем? Сферу Дайсона, как и это кольцо, придумывали, чтобы дать на какое-то время жизненное пространство для экспоненциально растущего населения, но фактический рост замедляется, и с текущими тенденциями скоро остановится.
Человек не приспособлен жить на таких структурах и вообще в космосе. Есть достаточно много видео на эту тему. И здесь даже не вопрос в радиации, а речь о гравитации и даже искусственная гравитация плохой вариант замены естественной гравитации для человека.
https://naked-science.ru/article/medicine/beg-po-stene
https://www.hse.ru/news/science/301929511.html
https://pikabu.ru/story/pochemu_do_sikh_por_net_orbitalnyikh_stantsiy_s_iskusstvennoy_gravitatsiey_ved_yeto_tak_prosto_8842498
[возможно эффекты "вращения"/укачивания возникают из-за магнитной чувствительности человеческого мозга в условиях достаточно сильного магнитного поля Земли(по сравнению с магнитным полем на других планетах и в космосе). Возможно наличие магнитного поля необходимо для здоровья человека и его необходимо симулировать в космосе]
Т.е. параметры космической станции(медленное вращение - огромный диаметр возможно еще искусственное магнитное поле) с учетом пассивной защиты от радиации (трехметровая стенка - очень слабый эквивалент атмосферы Земли причем большая часть опасной радиации отклоняется в сторону полюсов Земли) пока не реализуемы где-либо в космосе и тем более на кольце Нивена. А ведь кроме комфортных условий для жизни человека должны быть комфортные условия для всей пищевой цепочки необходимой для питания и жизни человека. Но даже банальные растения не могут жить без ветра(необходим для роста) или условной качающей вибрации.
В результате дешево человек может жить здоровым только в условиях Земной гравитации, когда есть небо над головой (чтоб не создавать эффект клаустрофобии). А космос (Луна, и даже Меркурий) или кольцо Нивена - лучше всего приспособлен (в т.ч. по энергии и отсутствию атмосферы (а также коррозии)) для небиологических ИИ форм жизни.
Т.е. для условных "пенсионеров" роботов (если ИИ/AGI когда-нибудь преодолеют предел сложности человеческого мозга по соизмеримому числу параметров хотя бы для коры головного мозга при сохранении мобильности и низкого энергопотребления (не будут требовать АЭС для своей работы)) кольцо Нивена (в перспективе) могло бы стать местом для существования и дальнейшего развития (и последующей торговли с людьми).
Просто большинство людей хотя бы краем уха слышали о хайповой сфере Дайсона, но почти ничего не слышали о более простом проекте для реализации кольце Нивена.
При этом сфера Дайсона в 100 раз более проблемная и неустойчивая конструкция при физической реализации чем кольцо Нивена(достаточно посмотреть на воздушные потоки Юпитера или провести математическое моделирование). И даже современная (реалистичная) сфера Дайсона в графическом представлении авторов (с учетом реальной физики) часто представлена как система из пересекающихся под разными направлениями и углами колец Нивена что собственно ставит под сомнение принципиальную реализуемость и практичность оригинальной концепции сферы Дайсона.
Луна также может быть разобрана на кольцо Нивена дополняющее земную орбиту. Но кольцо Нивена из Луны, чтобы не разбиваться в каменную пыль должно иметь в составе огромное количество арматуры(состоять из качественного железобетона с большим % железной арматуры). А оригинальные концепции фактически предполагают что кольцо Нивена или тем более сфера Дайсона должны быть металлическими. Любое дополняющая орбиту Земли "кольцо Нибиру" будет представлять огромную астероидную опасность для Земли как на стадии создания так и на стадии разрушения (по принципу домино) к примеру под действием каких-то сторонних астероидов или какого терроризма. Поэтому данный вариант кольца Нивена менее практичен чем вариант с Меркурием.
И если кто-то видит возможность освоения Марса людьми. То с таким же успехом можно рассмотреть освоение Меркурия (в разной схеме реализации) Даже просто самого Меркурия.
Условно "средняя полоса" Меркурия (под поверхностью) будет иметь вполне комфортные для ИИ и даже для людей условия обитания.
Это лучше чем Луна для потенциального обитания людей и места больше.
Но еще лучше Меркурий и кольцо Нивена на основе Меркурия подходят для небиологических форм жизни.
Эти проекты (освоения Солнечной системы) малоинтересны для людей и человечества прямо сейчас. Возможно лет через 1000 (если эффективная роботизация (роботы делают роботов) будет достигнута) они будут востребованы как концепции и не только концепции.
Вычислительные мощности в пределах кольца Нивена на орбите Меркурия ИМХО смогут генерировать в сутки объем (цифровой) информации в триллион раз больше чем все человечество за всю его историю до сегодняшнего дня. При символических или отсутствующих ресурсах поставляемых с Земли в т.ч. на стадии создания проекта. Наоборот какие-то востребованные ресурсы (в т.ч. к примеру редкоземы) могли бы поставляться на Землю.
По сути при наличии таких избыточных для решения любых (стоящих перед человечеством) задач вычислительных мощностей, не будет проблемы создать условно игровой сервер (и не один) симуляции вселенной. И реализовать игру для почти вечной ИИ жизни в ней как фентези игру в виде людей - нищебродская версия симулятора жизни (хорошо там где нас нет) для ШНМ ИИ.
***
В будущем, (как минимум) ИИ дата центры (и по сути средства их производства) симуляторы(обучение через бруте форсе симуляцию (как обучался альфа Go)) Солнечной системы. социума, физического мира, расшифровка генома биологических видов биосферы, для глубокого обучения нейросетей - должны быть вынесены за пределы Земли. Возможно и промышленые зоны по автоматизированному производству роботов (со всеми их достаточно токсичными отходами) также должны быть вынесены за пределы Земли. Там есть как неограниченные по сравнению с Землей ресурсы так и неограниченные объемы энергии.
Как вчера запад выносил производства за пределы США (в Китай и ЮВА) создавая постиндустриальную экономику, возможно завтра потребуется сделать из Земли экологический заповедник, без токсичных производств (одновременно реализуется концепция "вкалывают роботы"), а все или большинство автоматических производств (за исключением выращивания продуктов) необходимо (или даже рационально, технически обоснованно) вынести за пределы Земли(к примеру на Луну, Меркурий?). Доставка конечной продукции (партий роботов) в любую точку Земли магнитными катапультами с Луны.
Одновременно все это системы двойного назначения. Партии роботов могут быть условным вооруженным космо робо десантом в отдельно взятую страну которая может быть взята под контроль полицейскими роботами за один день, а все военные объекты могут быть упреждающе внезапно уничтожены гиперзвуковыми болванками точного наведения.
***
Вынос грязных производств за пределы Земли (и почти монопольный контроль за производством) вызовет соответствующие социальные изменения в жизни людей(переход от капиталистической свободной платформы жизни к тоталитарно управляемой и контролируемой по большинству аспектов(реальная свобода будет только в виртуальных мирах)):
Технология уже освоена и используется. Through-silicon via называется. Как раз для HBM в основном.
Это другая технология хотя её и планируют использовать в 1,6 нм техпроцессе для чипов от Интелл, где дата линии и линии питания с разных сторон чипа(надо уточнять).
https://www.youtube.com/watch?v=jSHKIlqXb9s
Сегодня когда говорят о необходимости 1,6 нм это необходимо для повышения "плотности" транзисторов на площади чипа. Вплоть до многослойных схем затворов (вертикальные затворы / транзисторы). Выше плотность - деталей и транзисторов - выше внутренние синхронные скорости обработки передачи данных без их дополнительного преобразования. Это то же самое что внести оперативную память ГПУ которая сегодня необходима террабайтами внутрь процессора/ГПУ. Сделать её кэшем.
При том же количестве транзисторов (как на всей материнской плате) если все это реализовано на одном чипе только за счет внутренней интеграции и высокоскоростными шинами передачи данных с около нулевыми задержками (гигагерцевая частота шины данных) в десятки раз повышается скорость обработки данных.
Но при большой интеграции возникает проблема дефектов (резко понижается выход готовых чипов поэтому они такие дорогие). И возникает проблема отвода тепла из очень объемной структуры.
В природе не существует техпроцесса 1,6 нм (в этом возникают проблема туннельного эффекта (транзисторы перестают работать)) - физический тех процесс и минимальный размер элемента чуть ли не 8 нм. Речь об общей условной плотности транзисторов на чипе, когда (затвор чипа делатся в несколько слоев и операций? (надо уточнять)), а дата линии и линии питания выносятся в дополнительные слои чипа.
Но если по сути отводить тепло изнутри чипов - когда условные тепловые трубки - как сегодня медные проводники - интегрированы внутрь чипа - могли бы решить проблему отвода тепла. Но в этом случае возникает слишком большой градиент температуры что физически разрушит чип.
Поэтому объемная интеграция чипов с необходимым отводом тепла может быть дешево реализована на чипах обычного 5 нм к примеру техпроцессе, вместо 1,6 нм одним из методов выше. По сути речь о кластере серверов (условно смартфонных чипов с смартфонными чипами памяти и SSD - и таких сотни) в одном литре объхема 50% которого занимает система охлаждения фреоном или тепловыми трубками с фреонов от которого отводятся пара киловатт тепла во время интенсивной работы.
Никто не утверждает что 1,6 нм транзисторы в пересчете на транзистор будут кушать меньше энергии. Вся погоня за нанометрами делается ради интеграции процессора и его памяти (кэша) на чип для повышения производительности.
Энергопотребление современных ИИ ГПУ - киловатты.
И с моей точки зрения это тупиковый путь развития (слишком большие инвестиции в слишком большой и трудоемкий процесс при понижении ). Хотя конечно никто не откажется от халявной EUV фотолитографии когда значимые патенты на её реализацию станут просроченными.
Но для реализации эффективных ИИ (и отработки технологий ИИ для развития которых необходимо как минимум пару лет) сегодня возможно все еще достаточно DUV фотолитографии 5 нм. А через 5 лет уже будет новое поколение ИИ и срок действия значимой части патентов EUV фотолитографии завершится.
Помимо плоскостной интеграции материнская плата на чипе(?):
https://www.cnews.ru/news/top/2023-09-19_intel_budet_vypuskat_proryvnye
необходимо развитие объемной интеграции чипов с условием достаточного отвода тепла из объема.
Уже существуют версии смартфонов в которых ЦПУ и чип памяти паяются друг на друга,
https://dzen.ru/video/watch/65acd6435f45134aba78dd78
но там не предусмотрено значимого отвода тепла из объема(и это только два слоя (хотя с противоположной стороны платы могут быть еще чипы)). И ремонтопригодность таких конструкций и срок работы ограничены - такая технология годится для смартфонов, но отнюдь не для серверов, где надежность и условно ремонтопригодность и как минимум диагностичность на всех этапах производства - должны быть на первом месте ИМХО.
Не сильно вникаю в эти темы и мне не сильно они интересны - это мимопроходящая антипатент блог тема(что стоила для меня меньше чем время потраченное на создание данного блога(фоновый инсайт ничего не стоит с точки зрения трудозатрат)). Меньше возможных патентов выше конкуренция - лучше для простых людей (т.е. нас с вами).
ВладиславЛ, перелогиньтесь.