CNBC: Nvidia в красной зоне, теряя небольшой рост, поскольку угроза DeepSeek продолжает преследовать производителя чипов ИИ

5.5K 17:50 - 28/Янв/25 Улучшенный аккаунт

(10 лет 2 месяца)

Во вторник акции немного восстановились, так как некоторые трейдеры начали покупать их на следующий день после того, как появление более дешевой модели искусственного интеллекта с открытым исходным кодом из Китая привело к крупнейшей потере рыночной стоимости в истории фондового рынка.

Но отскок был не столь динамичным, и акции выросли всего на 2%. Ранее на предпродажной сессии они были выше, а к официальному открытию рынка рост ослаб.

В понедельник акции упали на 17%, а оценка компании сократилась более чем на 595 миллиардов долларов, что стало самым крупным падением рыночной капитализации за один день в истории.

скрыть содержимое

NVIDIA Corp

RT Quote | Последний NASDAQ LS, VOL от CTA | USD

117.10 цитата цена стрелка вниз -1.32( -1,49% )

Резкая распродажа в понедельник, которая вызвала шок во всей технологической отрасли (Nasdaq Composite упал на 3%), произошла на фоне опасений трейдеров, что пузырь акций ИИ может лопнуть из-за китайского стартапа DeepSeek.

На прошлой неделе DeepSeek выпустила модель с открытым исходным кодом, которая, как сообщается, превзошла OpenAI в различных тестах. Компания также заявила, что первоначальная версия этой модели обошлась менее чем в 6 миллионов долларов — это лишь малая часть миллиардов долларов, которые крупные американские технологические компании тратят на ИИ.

Конечно, компания Nvidia, которая является символом американской индустрии искусственного интеллекта благодаря своим мощным чипам, назвала модель R1 от DeepSeek « превосходным достижением в области искусственного интеллекта ».

«Работа DeepSeek иллюстрирует, как можно создавать новые модели с помощью этой технологии, используя широко доступные модели и вычисления, которые полностью соответствуют экспортному контролю», — заявил представитель Nvidia в интервью CNBC в понедельник.

Кроме того, большинство аналитиков Уолл-стрит поддержали Nvidia после распродажи, и никто из них пока не понизил рейтинг акций. Некоторые также рассматривают разработки DeepSeek как долгосрочный позитив для ИИ.

«Мы считаем, что инвесторам необходимо различать влияние потенциальных преимуществ и недостатков DeepSeek на индустрию программного обеспечения. Более мощные модели LLM, которые могут работать за малую долю от первоначальных оценок затрат (если подтвердятся), будут означать, что принятие genAI должно произойти легче… и, следовательно, быстрее и шире во вселенной программного обеспечения», — написал аналитик Barclays Раймо Леншоу.

Конечно, хотя Джозеф Мур из Morgan Stanley сохранил свой рейтинг акций как «выше среднего», во вторник он снизил целевую цену с 166 до 152 долларов.

«В релизе DeepSeek освещаются эволюционные инновации в области ИИ, некоторые из которых могут быть дефляционными. При этом реакция фондового рынка, вероятно, важнее причины и может привести к дальнейшему контролю экспорта или снижению энтузиазма в отношении расходов; но оставаясь позитивными», — сказал он.

Авторство:

Авторская работа / переводика

Использованные источники:

CNBC.COM

Комментарий автора:

Как бы то ни было китайцы показали, что у США нет модели оправдывающей триллионные капитализации.

Пройдет немного времени и КНР вообще может обойти американцев как это уже было с электромобилями, солнечными панелями и остальным

что тогда будет с фондовым и долговым рынками? Точнее что будет с пузырями и пирамидами которые еще по старинке считают рынком бумаг?

@Финансы#Перезагрузка финсистемы#Гиперок @Это америка бро

@Лидеры обсуждений#Перспективный чат

@Пиндосия

Блог пользователя basil10 | Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Ну, хорошего в этом мало, однако если выбор стоит между "не иметь" и "иметь тормознутый", то второе кажется более предпочтительный. Но я для друга спрашиваю - у меня самого и десктопа-то нет (если только у ребенка отобрать, но он бы понял).

Там еще всякие проблемы и тормоза будут из-за NUMA и т д.

Войдите или зарегистрируйтесь для комментирования

(13 лет 1 месяц)19:39-28/Янв/25

Да ну, фигня! Кто-то наварится, кто-то разорится. Вся эта биржевая движуха яйца выеденного не стоит.

Войдите или зарегистрируйтесь для комментирования

(9 лет 8 месяцев)20:46-28/Янв/25

Железо топ качества по цене/производительности (если будет доступно для Китая...).

https://habr.com/ru/companies/bothub/news/872002/

GB10 может обеспечивать до 1 петафлопа мощности для обработки AI с точностью FP4

Насколько понял заточен под DeepSeek-R1 (Либо если FP8 FP16 то производительность будет пропорционально меньше?)

Nvidia планирует выпустить Project Digits через свои каналы и партнеров в мае по цене 3 000 долларов.

до 4 ТБ NVMe-хранилища (неизвестно сколько в базовой комплектации)

вы можете соединить две системы Digits [2 петафлопа для FP4] с помощью сетей Nvidia ConnectX, увеличивая общую емкость до обработки моделей с 405 миллиардами параметров.

Пользователи получат доступ к программной библиотеке NVIDIA, включающей инструменты разработки, средства оркестрации и предварительно обученные модели через каталог NVIDIA NGC. Система работает под управлением Linux-based NVIDIA DGX OS и поддерживает популярные фреймворки, такие как PyTorch, Python и Jupyter Notebook. Разработчики могут настраивать модели с помощью фреймворка NVIDIA NeMo и ускорять рабочие процессы обработки данных с помощью библиотек NVIDIA RAPIDS.

GPU System Requirements for Running DeepSeek-R1

https://apxml.com/posts/gpu-requirements-deepseek-r1

GPU Requirements Guide for DeepSeek Models (V3, All Variants)

https://apxml.com/posts/system-requirements-deepseek-models

GPU / VRAM Requirements for Llama 3.1 405B

что будет работать на Dual Project Digits, а значит и DeepSeek-R1 671B с высокой вероятностью будет работать на Dual Project Digits

https://www.notebookcheck-ru.com/Meta-predstavljaet-samyi-bolshoi-samyi-umnyi-bezvozmezdnyi-II-Llama-3-1-405B.867800.0.html

***

Это значит что Nvidia по сути спилили сук на котором сидели.

Ждем (ближе к апрелю) на маркетплейсах условные Dual Project Digits (и Single Project Digits для нищебродов) с предустановленным DeepSeek-R1. За условные ~7к и 3,5к соответственно(хотя вероятно и больше, тогда лучше бу оборудование купить).

с видео инструкцией как пользоваться с доступом через веб интерфейс

с динамическим ценником за вопрос в токенах(мультимайнинг, когда не пользуешься сам (причем конфиденциально) - можно сдать в аренду агрегатору сторонних запросов). Принцип ценника у агрегатора, как у комиссии за крипто транзакцию. Чем более срочный запрос и выше текущая нагрузка на сеть тем выше цена(запросы если не обработаны можно отменять). Интересно за сколько подобный аппарат окупится и выйдет в прибыль.

И какова цена запроса будет в энергии, плюс число средних запросов по сравнению с другими сетями. (с учетом потенциального износа SSD хотя том больше режим чтения работает).

Если цена запроса слишком низкая (нет запросов и очереди запросов нет для совсем нищебродов), то в качестве альтернативы можно попробовать запустить просто майнинг или генерацию картинок или видео(хотя это может сказаться на износе SSD).

Запустят сетевую структуру вместо майнинга (и будет реальная польза от вычислений). Будет выгодно там где цена на электричество ниже и температура до 20 или надо кондиционирование.

ИМХО должно взлететь через агрегаторов (ИИ пулы) лучше чем майнинг.

Но если общая производительность по энергии и затратам будет хуже чем у ТНК инвесторов что инвестируют в специализированное топ оборудование, то данный подход не взлетит. В данном случае будет просто наименьшая цена с набольшей конфиденциальностью при (опциональной) офлайн работе.

Nvidia представила новый суперкомпьютер Digits

Новый Project Digits от Nvidia предлагает суперкомпьютерную мощность для AI прямо с вашего рабочего стола, обеспечивая возможность запуска моделей искусственного интеллекта с параметрами до 200...

Войдите или зарегистрируйтесь для комментирования

(9 лет 5 месяцев)23:09-28/Янв/25

Размер DeepSeek-R1 671B 404 гигабайта Llama 3.1 405B 200 с копейками гигов

DeepSeek-R1

1.5B - 1.1GB

7B - 4.7GB

8B - 4.9GB

14B - 9GB

32B - 20GB

70B - 43GB

671B - 404GB

https://ollama.com/library/deepseek-r1 Оно в свободном доступе все, как и другие модели.

Войдите или зарегистрируйтесь для комментирования

(9 лет 8 месяцев)23:52-28/Янв/25

Требования к VRAM после распаковки модели смотрится в документации. Вы приводите размер упакованной модели, насколько понял, и только путаете людей(занижаете). Пройдитесь по ссылкам выше. Специально для совсем ленивых разместил.

Там конкретные размеры (выше что вы указали примерно в 2 и более раза (после распаковки и индексации если надо)) и де факто это требования к VRAM (к "SSD", если переводить на ИИ мини комп от Nvidia).

Черным по белому:

VRAM Requirement (GB) (4-bit)

DeepSeek-R1

671B

~336 GB

Multi-GPU setup (e.g., NVIDIA A100 80GB x6)

***

DeepSeek V3 671B

671 billion

~1543 GB

~386 GB

Model Variant	Recommended GPUs (FP16)	Recommended GPUs (4-bit Quantization)
DeepSeek V3 671B	NVIDIA H100 80GB (16x or more)	NVIDIA H100 80GB (6x or more)

***

Llama 3.1 405B

Для запуска полной модели потребуется восемь Графических процессоров Nvidia A100 или аналогичных, обеспечивающих два узла MP16 и 810 ГБ VRAM GPU для выводов, в системе с 1 ТБ ОЗУ.

***

Все зависит от размере SSD (что на мини компе заменяет VRAM) просто пишут что если размер модели большой, а производительность ИИ чипа маленькая то нейросеть будет работать нестандартно медленно. И не получится с ней комфортно работать онлайн скорее всего.

Реальные тесты скорости работы (как в версии для нищебродов так и в дуал премиум версии) будут ближе к марту, если НВИДЕА позволит опционально ставить DeepSeek-R1 и другие фри модели которые обещают выпустить на свой чудо мини комп.

Войдите или зарегистрируйтесь для комментирования

(9 лет 5 месяцев)23:24-28/Янв/25

Нахрена мне куда-то ходить Если она у меня сейчас запущена ))? Это вы путаете людей занижая требования, по вашей ссылке ей надо 336GB.

Ps выбы названия табличек почитали, там полная и квантованая модели приведены. Я дал ссылку на скачивание квантованой.

Войдите или зарегистрируйтесь для комментирования

(9 лет 8 месяцев)23:45-28/Янв/25

Llama 3.1 405B 200 с копейками гигов

Это не соответствует действительности Llama 3.1 405B надо 810 гигов(добавил в комент выше).

Нашел требования ко всем существующим версиям R1. Выше не полный список версий. См. 1:11 :

https://www.youtube.com/watch?v=_-rESC_aufM

R1 есть еще круче версии чем четырехбитная. Q4 Q6 Q8 соответственно надо 404, 550 и 713 гиг vram если не ошибаюсь.

Войдите или зарегистрируйтесь для комментирования

(9 лет 5 месяцев)23:54-28/Янв/25

Ох уж эти теоретики https://ollama.com/library/llama3.1/tags квантованая в q4 занимает 243 гига. Вы нашли требования, только читать таблички не умете. И да для работы модели ей недостаточно развернутся в VRAM ей еще и работать надо но это уже другой вопрос, сколько там памяти понадобится под конкретную задачу.

PS 800 ей надо в fp16 режиме.

Войдите или зарегистрируйтесь для комментирования

(9 лет 5 месяцев)23:47-28/Янв/25

Все зависит от размере SSD (что на мини компе заменяет VRAM) просто пишут что если размер модели большой, а производительность ИИ чипа маленькая то нейросеть будет работать нестандартно медленно. И не получится с ней комфортно работать онлайн скорее всего.

Реальные тесты скорости работы (как в версии для нищебродов так и в дуал премиум версии) будут ближе к марту, если НВИДЕА позволит опционально ставить DeepSeek-R1 и другие фри модели которые обещают выпустить на свой чудо мини комп.

Я вам по большому секрету скажу, у нас сейчас в стойке два самоспаяных ящика стоит из FPGA и NVME дисков. И все что вы описываете я знаю так сказать из первых рук )

Все зависит от размере SSD (что на мини компе заменяет VRAM) просто пишут что если размер модели большой, а производительность ИИ чипа маленькая то нейросеть будет работать нестандартно медленно. И не получится с ней комфортно работать онлайн скорее всего.

И вот это вот тоже решается через параллелизм и LLVM. Ну и тут упирается все не в размер чипа, а медленный флеш. Нужно соблюдать баланс. Пока железка от нвидии выглядит как заточенная на работу с ОЗУ и редкий своп на ssd, либо как похожие проекты на расчет локальных данных лежащих на ssd.

Войдите или зарегистрируйтесь для комментирования

(12 лет 3 месяца)01:05-29/Янв/25

Есть у нвидиа хорошая технология когда ГПУ в обход процессора сразу к ОЗУ обращается но она только для игр предусмотрена на сколько я знаю

Войдите или зарегистрируйтесь для комментирования

(9 лет 5 месяцев)19:52-29/Янв/25

Из cuda можно лазить как в память системы так и на хост обращаться. Но там проблемы с фрагментацией, скоростью самой памяти, замарочками в мультипроцессорный системах с numa и т д. Ну и по факту получается максимальная скорость внешней памяти ограничена pcie интерфейсом, а если в системе еще и pcie switch то и скоростью коммутации. Зато можно pcie запихнуть в инфабанд и сделать мегакластер )