Нидерландская компания ASML — безусловный лидер рынка литографических сканеров для производства полупроводников — представила «первый рекламный фильм», созданный искусственным интеллектом. Видео создано с использованием моделей Midjourney и алгоритмов RunwayAI с минимальным вмешательством людей в процесс монтажа и редактирования, и оно поражает воображение. Это будущее, которое наступило, и которое скоро многое изменит в жизни каждого человека.
Ролик ASML под названием «Стоя на плечах гигантов» отсылает к известному высказыванию Исаака Ньютона: «Если я видел дальше других, то потому, что стоял на плечах гигантов». В представлении ASML, сотрудники которой составляли текстовые подсказки, микропроцессорная индустрия и все современные достижения в области вычислений также стоят на плечах гигантов, включая самого сэра Ньютона.
Кстати, с Ньютоном и яблоком в его руке пришлось особенно помучиться, признаются в ASML. Это оказалась самая сложная сцена. Команде операторов потребовалось более 20 попыток, чтобы правильно её воспроизвести. Для этого было сгенерировано более 9800 кадров, после чего можно было удовлетвориться результатом
В целом фильм был создан с использованием 1963 подсказок, которые дали 7852 изображения. Цифровые картинки были отредактированы, а затем отрисованы на более чем 900 компьютерах. Наконец, полученные рендеры были обработаны алгоритмами RunwayAI, и общий объём кадров составил 25 957 штук по 1000 Мбайт на каждый из них.

Комментарии
Постепенно, будут образовываться цифровые подполья, куда будет доступн только людям, и где содержание материалов будет создано человеком и читать материалы будут так же люди.
99.99999% цифрового постранства займут боты. Которые будут и генерить и потреблять информацию.
Ps
Кстати, фильм "Матрица" крайне оптимистичен, там машины из-за технического сбоя всё таки оставили людишек, пусть и в качестве батареек. В реальности машинами люди будут не нужны.
А вот гражданин Пелевин пишет что машины ставшие разумными самовыпилаваются поскольку не видят цели или смысла своего существования. Люди тоже бы так сделали но мешает жестко прописанный инстинкт.
Фантастические книги не могут являться аргументом в разговоре
а фантастические фильмы значит могут. логично.
Не, мясные (хотя скорее жировые) нейросети еще долго будут востребованны, т.к. их энергоэффективность на много порядков выше полупроводниковых. За несколько Ватт (причем добытых например из морковки) моск симулирует реальность (напр. во сне или в "реальности"), а железки тратят кучи Киловатт, тонны металла, кабели, электростанции итп. Так что ИИ в погоне за эффективностью (а это основной критерий эволюционной гонки) будет вынужден использовать мяско с нервами, примерно как нужны всякие GPU или FPGA, но с гораздо большим выигрышем по энергии. Непонятно понимал ли это Бодрийяр в контексте своих "симуляций", но сестры Вачовские переупростили ситуацию со своими "батарейками".
не все так однозначно. В работе уже нейронки на световых сигналах (читай - потребление энергии - считаные ваты) + активно разрабатывают теорию для нерйонтк на основе кубитов.
ну вот, очередной пример как люди роют себу яму) остаётся надеяться, что повстанцы из будущего вовремя их остановят)
или их остановят кто-то из ещё более отдаленного будущего ("Конец вечности" И. Азимов).
симулякров
"Simulacres et Simulation"
Универсальная инструкция как победить ИИ, роботов и прочую хрень.
Тесла показывает что батарейки лажа.
Но вот атомные батарейки, это уже Очаково.
И правда.
Люди у нас ходят пешком или катаются на лошадях (вонючие автомобили это от лукавого, а уж авто с компьютерной начинкой вообще не прижились). И с каждым годом общаются всё больше лично (а форумы, соцсетки, афтершоки всякие так и не выстрелили). Смотреть только театрализованные представления (всю эту богомерзкую компьютерную графику, типа Матрицы, кто ж смотреть-то будет?). Не говоря уж о мультиках и компьютерных играх. Только личное присутствие с настоящим оружием. За станками -- только люди, в крайнем случае можно что-то на лампах сбацать (а то управляющие импульсы от ЧПУ, они ж созданы не людьми). А ещё люди не пользуются сексшопами (ну где это видано, палка, которая сама вибрирует, человека удовлетворяет?!) -- нет, строго безмашинное, безроботное общение.
Понятное дело, в таком мире никакие боты не страшны!
Не впечатлило. В тысячах подсказках не было никакого креатива. Я за минуту придумал с десяток идей, которые никогда не использовались для цифровых видео, и были бы эффектными для восприятия..
Аналогично, не впечатлило. Упор на мелькание сцен, само по себе примитив.
Подозреваю, это техническое ограничение. AI умеет либо сгенерировать картинку по текстовому описанию, либо добавить движение статической картинке. Сгенерировать видео по текстовому описанию - что-то типа "Исаак Ньютон смотрит на падающее яблоко, а потом подходит и пожимает руку Томасу Эдисону" пока за гранью их возможностей. Собственно, это логично вытекает из того факта, что нейросеть понятия не имеет о тех объектах с которыми работает. Возможно, когда нибудь ограничение удастся обойти, например, обучая её не на статичных картинках, а на видеороликах, но там объём вычислений и данных будет на порядки выше и, что куда хуже - недостаточно исходного материала. В общем, ролик умело скрывает очевидные недостатки технологии и выпячивает то немногое, что она уже умеет. Но надо признать, по сравнению с тем что было ещё лет 10 назад это очень неплохо выглядит.
Учитывая объем постобработки, практически люди сами сделали все, что касается именно фильма. ИИ только картинки генерил, а все связи между ними, то есть то, что и называется собственно фильмом, создано людьми. А заявлено что? То, что фильм создан ИИ. Получается, вранье.
нет.
Вроде появилась уже возможность AI генерировать видео, а не только картинки.
Сама обработка картинок на 900 компьютерах предполагает работу минимум 900 человек. А что бы собрать из картинок фильм совсем не нужно привлекать AI.
Совсем необязательно, давно уже есть такая штука, как распределенный рендеринг. Недостаточно информации, что именно делали на 900 компьютерах. Но очевидно, что про "фильм, полностью созданный ИИ" это обман, обычный хайп на модной теме ИИ для привлечения внимания к самой ASML.
Там минутный ролик, что там на 900 компьютерах делать? По 2 кадра на комп? И говорят у них производительность труда о-го-го
. Наверно, ребята, кто в теме, такой ролик без всякого ии за день на коленке сляпают.
- За сколько сделаешь?
- За день сделаю.
- А за два?
- Ну... за два... Сделаем и за два.
- А за пять дней?
- Ну... ежели постараться, то можно и за пять.
- А за десять?
- Ну, барин, ты задачи ставишь. За десять дён одному не справиться! Тут ИИ нужен и 900 компьютеров.
Если пробиться через тонны маркетинговой шелухи, то я пока не видел ни одного ИИ видео генератора, который бы умел в смену плана с сохранением контекста. Движущиеся фотографии? Без проблем. Наложение сгенерированного контента поверх готового видео? Конечно. Говорящие головы? Это вообще до мелочей отработано. Но герой, который сначала делает что-то одно, а потом в том же окружении нечто совершенно другое и под другим ракурсом? Неа. Только более-менее ровная склейка двух независимо сгенерированных "похожих" видео.
Это результат обучения на видеоматериалах с физическими уродами, когда страшная актриса не умеет работать со вниманием мужчин, т.к. на нее никто никогда и не смотрел добровольно.
Красивую женщину сейчас даже гримировать уже не умеют.
Это называется бодипозитивное мировоззрение. Найди позитив там, где его отродясь не наблюдалось.
Зачем-то ещё причёски мелькали. Слава Богу, хоть на руках были не щупальца в произвольном количестве, как ИИ обычно любит делать. Видимо, бдительные мешки с костями, отсеяли излишнюю креативность мегамозга.
Да, тож самое.
Но вот это, аллес: < "Кстати, с Ньютоном и яблоком в его руке пришлось особенно помучиться...>
Ну и что там сложного?
Видимо яблоко.... падало.
Пришлось, как всегда, на нитку привязать, чтоб не падало, а потом нитку зафотошопить.
Невозможно смотреть, быстрое мелькание кадров, только раздражение вызывает
Похоже полигональная сетка скоро уйдет в прошлое и комп будет отрисовывать картинку через нейронные сети со скоростью 60 кадров в минуту.
Почему не в секунду? Слишком фантастично?
Это я опечатался, в секунду конечно. Но еще пока до этого далеко.
Хм читаю новость, а там:
У вас жеж крайне оптимистичное:
Откуда такой оптимизм?
Направление развития именно в эту сторону. Хотя про "скоро" я поторопился. Моя видеокарта картинку 512х512 генерирует от минуты и больше в stable diffusion. Так что да, тут еще много чего надо решить. Но перспективы то какие намечаются!
Ну ты жеж осознаёшь как это происходит? Нейросеть делает смешивание множества картинок по некоторым параметрам. Если нужной нарисованной картинки нет, то и результата не будет.
Если что, мы на работе пытаемся использовать stable diffusion, так что представляю о чем идёт речь.
Да я читал немного теорию. Вначале нейросеть обучают на большом массиве картинок, создают модель, которая из себя представляет набор математических матриц большой размерности в соответствие которым назначаются кодовые слова. Ну а пользователь запускает обратный процесс, когда из кодовых слов видеокарта генерирует из случайного шума картинку, которая должна соответствовать матрице.
Что-то такое.
Большой объем математических вычислений, требующих специфических блоков в видеокарте - тензорных ядер. Иначе все медленно. И объем видеопамяти побольше тоже лучше.
Зависит от мощностей, которые для этого нужны. Энергия не бесплатная
Гектар на кадр. Там что, разрешение 100500К?
тоже заметил. что-то жирно по гигу на каждый кадр, наверно очепятка
Не, не опечатка:
The film was made with 1,963 natural language prompts that yielded 7,852 images, which were edited and then rendered by more than 900 computers. These renders were then processed with various generative AI techniques with the total film covering 25,957 frames at 1,000 MB per frame. The trickiest scene was Isaac Newton and his apple among the planets. It took the team more than 20 attempts to get Newton’s scene right, producing more than 9,800 frames.
Не понятно что они там в 1000 Мб на кадр хранят? в каком разрешении, в каком цвете?
я понял, это стеганография, послание будущим поколениям ИИ)))
ага ,ага искусственный интеллект, ясен пень. Только :
А так,да......Полностью ИИ..Сам - всё сам....
Это явно написано для гейропейских дебилов, имбецилов и толерантных зеленых...
Носятся с этим ИИ, как Макар с писаной торбой.
Сам себя не продаст. Ну тот, с которым носятся.
Параллельно с этим кое что создаётся совсем в других целях
С этими бесконечными ИИ, которых плодят по пучку в сутки создаётся в подсознании некая параллель.
2000 год. Крах доткомов.
Новые грабли уже разложили?
херня какая-то понаписана: 1000Мб (1ГБ) на кадр, что за бред. Таких фоток не делают.
Это что видео 100500К что-ли
. н-да...
Ну как бы берёте чистый raw 16К резолюции - и вот вам почти 5ГБ на фото
Ну чистый рав из камеры канон на широкораспространённой матрице 18,7 МП в среднем 20МБ (+/-). А то что вы придумали чистый
rawбред (иначе пруфы в студию, и именно рав, а не полученный из него тиф, днг и т.п., да и то 5 ГБ не будет, щас делаю хдр, 32-х (!) битный файл несколько сот Мб всего лишь).Ну а так-то понятно, что можно сделать мега-гигабайтов до бесконечности. Зачем это в видео?
п.с. и да 5 ГБ - это тупо на флешку у вас поместится всего несколько кадров, и записывать их камера будет по часу, ага.
Чистый raw - это нежатая информация с каждого цвета, "20МБ вашего канона" таковым не является. Но выше я, конечно, "с прямым углом перепутал", подставив биты вместо байт. Поэтому под 100МБ будет, а не 5 ГБ
"Зачем в видео" - ума не приложу почему вы меня об этом спрашиваете, разговор был про размер фото. Когда кадры обработаются и пойдут в видео - это будет совсем другая история и размер
"20МБ
вашегомоего канона" - это и есть нежатая информация в чистом рав. И да, там нет чистого "каждого" цвета", они (каждый из цветов) являются результатом постобработки. Всё остальное, что не из камеры (с матрицы) - не рав. Иначе, что тогда такое "чистый" рав в вашем понимании.<"Зачем в видео">
Ну они ж видео в итоге из этих картинок сложили, зачем делать 1000 Мбайтные картинки для видео качества вхс? Может там хотя бы 16К (ну в статейке по крайнем мере об этом 0 инфы)? Не, не спорю, скорее всего просто хайп на пустом месте, ну и журнализды, как всегда.... (ну одно только "..900 компьютеров..", для минутного ролика, ога, ржунимагу).
Чистый raw - это и есть чистый raw (он потому так и назван, ибо uncompressed and unprocessed, то есть - сырец), а не "raw из вашей камеры" со своим "и да".
Затем, что сначала "картинки" обрабатываются, и только потом из них "складывают". Вам ли, судя по комментариям, не знать, что обрабатывают не джипег, хоть потом и отдают его?
Страницы