Пят­нич­ное, Ней­ро­сеть в дей­ствии

Аватар пользователя Византий

Вы­би­рай са­мо­го тол­сто­го и крик­ли­во­го

Хищные слоны.jpg

Пла­кат для эко­пар­ка «Цеп­кий хобот» ней­ро­сеть на­ри­со­ва­ла точно по моему опи­са­нию, за один раз. Лучше жи­во­го ху­дож­ни­ка, так как ко­жа­ный ху­дож­ник де­сять раз пе­ре­спро­сил бы, потом по­зво­нил бы го­ло­сом, потом бы всё равно что-​нибудь на­пу­тал, а потом недо­воль­но сопел бы в ответ на мою тер­пе­ли­вую ре­пли­ку «сде­лай­те, по­жа­луй­ста, так, как на­пи­са­но в тех­ни­че­ском за­да­нии». Кста­ти, по­след­ний раз, когда мне надо было на­ри­со­вать нечто по­доб­ное, у меня был бюд­жет в 100 тысяч руб­лей, и… я не смог найти ис­пол­ни­те­ля: двое художников-​фрилансеров нуж­но­го мне уров­ня вна­ча­ле взяли было заказ, но потом по оче­ре­ди кор­ми­ли меня зав­тра­ка­ми на про­тя­же­нии двух-​трёх ме­ся­цев, так что в итоге я по­те­рял тер­пе­ние, и за­да­ча ушла в архив.

На днях слу­чи­лось нечто тек­то­ни­че­ское. Гуг­лов­ская ней­ро­сеть «Дже­ми­ни 2.5 Про» обо­шла в рей­тин­ге ра­зум­но­сти про­шло­го ли­де­ра от ком­па­нии Опе­нАИ (ссыл­ка). Ци­ти­рую: «на арене по всем язы­кам и почти по всем сре­зам мо­дель [от Гугла] впе­ре­ди, за­ча­стую — с от­ры­вом».

Гонка идёт на­пря­жён­ная, став­ки вы­со­ки. Про­иг­ры­вать Опе­нАИ не хочет — за­ре­зер­ви­ро­ван­ные бюд­же­ты при­бли­жа­ют­ся к сот­ням мил­ли­ар­дам дол­ла­ров, если не к трил­ли­о­нам, и у Опе­нАИ нет на­дёж­но­го тыла в виде ги­гант­ской кор­по­ра­ции за спи­ной. По­это­му Опе­нАИ ни­че­го не оста­ва­лось де­лать, кроме как вы­ло­жить на стол при­бе­ре­га­е­мый ко­зырь: го­во­ря­щий Фо­то­шоп. Те­перь ро­бо­ту можно про­сто ска­зать, что надо сде­лать, и он через минуту-​другую вы­даст го­то­вый, не нуж­да­ю­щий­ся в до­ра­бот­ке на­пиль­ни­ком ре­зуль­тат. Ка­че­ство — че­ты­ре с плю­сом или пять с ми­ну­сом, то есть на уровне креп­ких ре­клам­ных агентств с адек­ват­ны­ми бюд­же­та­ми.

Вот за­прос, по ко­то­ро­му робот выдал мне при­ло­жен­ный к посту пла­кат со сло­ном:
 
При­вет, бро! На­ри­суй, по­жа­луй­ста, пре­ду­пре­жда­ю­щий пла­кат. Над­пись на пла­ка­те: «Хищ­ные слоны! Но­си­те сви­сток!». Изоб­ра­же­ние: бес­печ­ная кра­си­вая де­вуш­ка, легко оде­тая, под­верг­лась на­па­де­нию неболь­шо­го дву­но­го­го слона. Дву­но­гий слон схва­тил её и го­то­вит­ся уку­сить. Де­вуш­ка от­би­ва­ет­ся, но тщет­но, силы явно нерав­ны. Фон: парк



Как ви­ди­те, за­да­ние вы­пол­не­ние точно, при­драть­ся не к чему. И, про­дол­жая тему из­го­тов­ле­ния ре­кла­мы, вот как робот от­ра­ба­ты­ва­ет стан­дарт­ный кли­ент­ский заказ на ре­клам­ный бан­нер:
 
На­ри­суй, по­жа­луй­ста, ре­клам­ный пла­кат для ларь­ка с ша­вер­мой. Вот чтобы кра­си­вая де­вуш­ка, вкус­ная ша­вер­ма, ку­ри­ца где-​нибудь и над­пись «Нет вкус­ней ша­вер­мы, чем от пти­це­фер­мы». Всё долж­но быть ве­сё­лым там, соч­ным, ра­дост­ным, даже сол­неч­ным.


Шаверма.png


Это был ван­шот — по­па­да­ние в цель с пер­во­го вы­стре­ла. Можно немно­го по­за­нуд­ни­чать и ска­зать, что у пла­ка­та раз­ре­ше­ние всего лишь 1000х1500 пик­се­лей, чего мало для ка­че­ствен­ной пе­ча­ти, но это, во-​первых, ре­ша­е­мая про­бле­ма, а во-​вторых, сей­час всё равно де­ло­вая жизнь ми­гри­ру­ет в ин­тер­нет. Для ин­тер­не­та та­ко­го раз­ре­ше­ния до­ста­точ­но (а для поста мне даже при­шлось умень­шить кар­тин­ки — уве­ли­чен­ные вер­сии от­кры­ва­ют­ся по щелч­ку мыши).

Де­лать фо­то­гра­фии робот тоже может:
 
На­ри­суй, по­жа­луй­ста, мо­ло­до­го До­наль­да Трам­па в крас­ной со­вет­ской спор­тив­ной форме. Форма вы­гля­дит как крас­ные шорты и крас­ная фут­бол­ка с круг­лым вы­ре­зом и ко­рот­ки­ми ру­ка­ва­ми. Фут­бол­ку опо­я­сы­ва­ет тон­кая белая по­ло­са, под круг­лым вы­ре­зом идут дугой буквы «СССР» (ки­рил­ли­цей). До­нальд Трамп в хо­ро­шей фи­зи­че­ской форме и до­воль­но улы­ба­ет­ся. Фон — ви­дав­шая виды стена тре­на­жё­но­го зала с об­лу­пив­шей­ся швед­ской стен­кой.


Дональд Трамп.png


Тут робот был менее точен. Я про­сил белую по­ло­су на фут­бол­ке, а он сде­лал вме­сто этого белый пояс у шорт. Уро­вень по­ни­ма­ния тех­ни­че­ско­го за­да­ния всё ещё не иде­а­лен (хотя и зна­чи­тель­но лучше, чем у ко­жа­ных ис­пол­ни­те­лей). Но неко­то­рые вещи при этом робот не умеет де­лать прин­ци­пи­аль­но, сколь­ко ему ни объ­яс­няй. Вот, на­при­мер, торт-​Юпитер:
 
При­вет, бро! На­ри­суй, по­жа­луй­ста, боль­шой торт в виде пла­не­ты Юпи­тер, ле­жа­щий в круг­лой ни­ке­ли­ро­ван­ной чаше на длин­ной ножке. Диа­метр чаши по­до­бран таким об­ра­зом, что торт по­ме­ща­ет­ся в неё без за­зо­ра, как бы вы­рас­та­ет из неё, яв­ля­ет­ся её про­дол­же­ни­ем. Слева от торта стоит тол­стый муж­чи­на в белом ха­ла­те учё­но­го, у муж­чи­ны за­чё­сан­ные назад седые во­ло­сы и тон­кие ганг­стер­ские усы. Спра­ва от торта стоит креп­кая мо­ло­дая ру­мын­ка в синем об­тя­ги­ва­ю­щем ком­би­не­зоне пи­ло­та и в серых об­ле­га­ю­щих са­по­гах без фур­ни­ту­ры. И учё­ный, и женщина-​пилот дер­жат в руках длин­ные ложки. Они улы­ба­ют­ся, пред­вку­шая, как будут сей­час есть торт-​Юпитер. Фон — стена кос­ми­че­ско­го ко­раб­ля с боль­шим ил­лю­ми­на­то­ром, за ил­лю­ми­на­то­ром — звёзд­ное небо. Стиль: фо­то­ре­а­лизм.


Юпитер.jpg


Я пред­при­нял несколь­ко по­пы­ток, но мне так и не уда­лось за­ста­вить ро­бо­та плот­но уло­жить в чашу торт-​шар: робот каж­дый раз остав­лял зазор между стен­ка­ми чаши и тор­том.

Улуч­шать и до­пол­нять фо­то­гра­фии робот может, но с неко­то­рым ис­ка­же­ни­ем сю­же­тов и лиц. Срав­ни­те, на­при­мер:

Иван Грозный.png
 
Возь­ми, по­жа­луй­ста, Ивана Гроз­но­го (при­ло­жен) более от­да­лён­ным пла­ном, по пояс. Также до­бавь тек­стом вос­кли­ца­ние: «Мало!», ко­то­рое про­из­но­сит су­ро­вый царь. Ис­поль­зуй сти­ли­зо­ван­ный псе­вод­ста­ро­сла­вян­ский шрифт.


Мало.jpg


На ма­ло­зна­ко­мых мо­де­лях ка­жет­ся, будто по­па­да­ние иде­аль­ное — мо­ло­дой До­нальд Трамп и актёр Иван Чер­ка­сов (иг­рав­ший Ивана Гроз­но­го) вы­гля­дят для меня в от­ри­со­ван­ной вер­сии как на­сто­я­щие. Од­на­ко если вы по­про­бу­е­те про­гнать через ней­ро­сеть фо­то­гра­фию более близ­ко­го вам че­ло­ве­ка, раз­ни­цу вы за­ме­ти­те.

А вот ещё один Иван Гроз­ный, но уже не фо­то­ре­а­ли­стич­ный, а пе­ре­ри­со­ван­ный по моей прось­бе в мод­ном стиле Ghibli. Было-​стало:

Иван Васильевич.jpg

Иван Васильевич 2.jpg


Можно сде­лать и об­рат­ное пре­вра­ще­ние, из мульт­филь­ма в фо­то­гра­фию. На­при­мер:
 
При­вет, бро. На при­ло­жен­ной кар­тин­ке на­ри­со­ва­ны трое жи­вот­ных. Пе­ре­де­лай, по­жа­луй­ста, кар­тин­ку в фото. Жи­вот­ные долж­ны остать­ся ша­ро­об­раз­ны­ми, то есть быть более-​менее стро­ги­ми мох­на­ты­ми ша­ра­ми на нож­ках, вот как на кар­тин­ке, толь­ко на­сто­я­щи­ми, ре­а­ли­стич­ны­ми, как будто их сфо­то­гра­фи­ро­ва­ли в ре­аль­ном мире. У жи­вот­ных при этом долж­ны быть че­ты­ре ко­неч­но­сти: «ноги» и «руки».

Об­ра­ти вни­ма­ние, что у Нюши, ко­то­рая сидит, че­ты­ре нор­маль­ных сви­ных ноги, ко­то­рые за­кан­чи­ва­ют­ся ко­пы­та­ми. У зайца и ежа «ноги» немно­го от­ли­ча­ют­ся от «рук»


Смешарики.jpg

Киношарики.jpg


Тут мне при­шлось уже сде­лать 4-5 под­хо­дов, так как ней­ро­сеть пу­та­лась с ко­ли­че­ством ног. В итоге я про­пи­сал за­да­ние более чётко, и робот спра­вил­ся…

* * *

Впер­вые я уви­дел ком­пью­тер­ную ла­бо­ра­то­рию в 1986: мне было 8 лет, и мой отец, про­грам­мист, при­вёл меня к себе на ра­бо­ту, чтобы дать прак­ти­че­ский урок про­грам­ми­ро­ва­ния на Фор­тране. На стене од­но­го из шка­фов висел пла­кат с при­ми­тив­ным изоб­ра­же­ни­ем, рас­пе­ча­тан­ный на тек­сто­вой псев­до­гра­фи­кой на быст­ром прин­те­ре. По­доб­ные пла­ка­ты, уже по­жух­лые, ви­се­ли на шка­фах и в се­ре­дине 1990-х, когда я уже за­кон­чил школу и сам устро­ил­ся ра­бо­тать про­грам­ми­стом. Даль­ше псев­до­текст сме­нил­ся на чёрно-​белые кар­тин­ки с офис­ным юмо­ром, самым по­пу­ляр­ным из ко­то­рых был пла­кат «Не сда­вай­ся!» — с ля­гуш­кой и цаплей. Неко­то­рые рас­кра­ши­ва­ли его ка­ран­да­ша­ми: ля­гуш­ку зе­лё­ным, нос цапли — крас­ным. Ещё позже офис­ный люд начал пе­ча­тать де­мо­ти­ва­то­ры, за­ча­стую сразу в цвете, так как цвет­ные прин­те­ры пе­ре­ста­ли быть эк­зо­ти­кой.

Те­перь пла­ка­ты можно уже не толь­ко ска­чи­вать из ин­тер­не­та в го­то­вом виде, но и де­лать са­мо­му. На­при­мер:
 
Давай сде­ла­ем мо­ти­ви­ру­ю­щий пла­кат. На пла­ка­те — бру­таль­но­го вида лысый волк со шра­мом. Он одет в ко­жа­ную курт­ку, спор­тив­ные штаны и стиль­ные крос­сов­ки, всё тем­ных от­тен­ков. Волк похож на ак­тё­ра Джей­со­на Стет­хе­ма.

Ре­клам­ный сло­ган: «От лысых в ком­на­те свет­лее»


Лысый.png


Ко­мик­сы робот ри­су­ет… свое­об­раз­но. Скажу мягко — робот уже умеет де­лать ко­мик­сы, од­на­ко про­дук­ция ней­ро­се­ти тре­бу­ет пока что су­ще­ствен­ной до­ра­бот­ки. Вот, на­при­мер, я скор­мил ро­бо­ту пер­вые три стро­фы «Ев­ге­ния Оне­ги­на» и по­про­сил на­ри­со­вать чёрно-​белый ко­микс на пред­ло­жен­ный сюжет:

Евгений Онегин.png


Кар­тин­ки — в по­ряд­ке, даже хо­ро­ши, хоть робот и по­ле­нил­ся вник­нуть в суть про­ис­хо­дя­ще­го. А вот над тек­стом надо се­рьёз­но ра­бо­тать: или про­пи­сы­вать ро­бо­ту за­да­ние более чётко, или пра­вить текст в ре­дак­то­ре са­мо­сто­я­тель­но.

Вме­сте с тем тут есть се­рьёз­ное огра­ни­че­ние — одна стра­ни­ца. Когда робот по­сле­до­ва­тель­но ри­су­ет несколь­ко стра­ниц, по­лу­ча­ет­ся хуже. Дадим, к при­ме­ру, ней­ро­се­ти за­да­ние изоб­ра­зить три кадра для бу­ду­щей но­вел­лы:
 
Давай ри­со­вать ко­микс. Пер­вый кадр (ши­ро­ко­экран­ное со­от­но­ше­ние сто­рон) — сим­па­тич­ная ар­го­ни­ан­ская дева в ко­стю­ме гор­нич­ной уби­ра­ет ком­на­ту в бо­га­том доме. На стуле в ожи­да­нии конца убор­ки сидит дво­ря­нин, хомо са­пи­енс: глад­ко вы­бри­тый, в стиль­ной до­маш­ней одеж­де.


Дева 1.png

Мне при­хо­ди­лось ви­деть и более сим­па­тич­ных ар­го­ни­а­нок — более при­вет­ли­вых как ми­ни­мум — но до­пу­стим. По­пы­та­ем­ся про­дол­жить.
 
Давай сле­ду­ю­щий кадр: дей­ству­ю­щие лица те же. Что-​то про­ис­хо­дит, и на­чи­на­ет­ся лёг­кий флирт: пер­со­на­жи что-​то друг другу го­во­рят. Что имен­но — при­ду­май сам.


Дева 2.png
 
Те­перь тре­тий кадр. Ар­го­ни­ан­ке явно нра­вит­ся вни­ма­ние хо­зя­и­на, но она бо­ит­ся, что жена дво­ря­ни­на может за­стать их в нелов­ком по­ло­же­нии. Дво­ря­нин про­яв­ля­ет иг­ри­вую на­стой­чи­вость


Дева 3.jpg


С тек­стом всё ясно — тут робот рас­те­рян, текст надо про­сто пе­ре­пи­сы­вать за­но­во. Ни­че­го слож­но­го, так как ре­че­вые пу­зы­ри уже есть. Од­на­ко об­ра­ти­те вни­ма­ние на одеж­ду. На дво­ря­нине те­перь тём­ная ру­баш­ка вме­сто свет­лой, а де­вуш­ка сме­ни­ла глу­хое пла­тье на пла­тье с неглу­бо­ким квад­рат­ным вы­ре­зом. Также у дво­ря­ни­на слег­ка по­тем­не­ло лицо, что, впро­чем, можно спи­сать или на при­лив крови, или на смену ра­кур­са.

Воз­мож­но, хо­ро­шей по­вто­ря­е­мо­сти пер­со­на­жей можно до­бить­ся, если де­таль­но опи­сы­вать их облик, вплоть до каж­до­го эле­мен­та одеж­ды. Не уве­рен. Мне ка­жет­ся, что пока про­сто рано: тех­но­ло­гия ещё не до­зре­ла, на­дёж­ную ге­не­ра­цию ко­мик­сов мы уви­дим толь­ко в сле­ду­ю­щих вер­си­ях ней­ро­се­ти. Вот что у ро­бо­та по­лу­ча­ет­ся от­лич­но уже сей­час, так это об­лож­ки. На­при­мер:
 
На­ри­суй, по­жа­луй­ста, об­лож­ку ко­мик­сов в стиле 1960-х. Сюжет — при­клю­че­ния бро­дя­чей те­ат­раль­ной труп­пы ра­зум­ных обе­зьян


Артисты.png


Ещё одним прак­тич­ным при­ме­не­ни­ем могут стать ин­струк­ции. Они, как и ко­мик­сы, нуж­да­ют­ся в до­ра­бот­ке на­пиль­ни­ком или в более по­дроб­ном тех­ни­че­ском за­да­нии — робот не все­гда пра­виль­но улав­ли­ва­ет идею за­каз­чи­ка с пер­вой по­пыт­ки:
 
На­ри­суй ил­лю­стри­ро­ван­ный ри­зо­граф для де­би­лов с ин­струк­ци­ей как ва­рить пель­ме­ни


Пельмени.png


На­ко­нец, мощ­ней­ший ин­стру­мент об­ре­ли раз­ра­бот­чи­ки: со­зда­те­ли сай­тов, ви­део­игр, при­ло­же­ний для смарт­фо­нов и тому по­доб­но­го. Вот, к при­ме­ру, ещё один ван­шот — иде­аль­ное вы­пол­не­ние по­став­лен­ной за­да­чи с пер­вой по­пыт­ки:
 
При­вет, бро! Я со­би­ра­юсь на­пи­сать книгу про вы­мыш­лен­ную расу круг­ло­ков. Сге­не­ри­руй мне, по­жа­луй­ста, круг­лок­ский ал­фа­вит. Он дол­жен со­сто­ять из пик­то­грамм, каж­дая из ко­то­рых про­ста в изоб­ра­же­нии и по­хо­жа ско­рее на сти­ли­зо­ван­ный пред­мет ма­те­ри­аль­но­го мира (со­ба­ка, об­ла­ко, гора, стре­ла), неже­ли на букву или иеро­глиф. Пик­то­грам­мы долж­ны быть при­част­ны округ­ло­сти, но могут иметь, там где это умест­но по смыс­лу, и ост­рые фраг­мен­ты.


Круглокский алфавит.png


По­ла­гаю, всем ясно, что вы­шед­шая на рынок ки­бер­кисть сде­ла­ет с про­фес­си­о­наль­ны­ми ди­зай­не­ра­ми сред­не­го и низ­ше­го уров­ней ма­стер­ства. Од­на­ко из но­во­стей можно сде­лать ещё два важ­ных вы­во­да — уже неоче­вид­ных.

1. Под каток ро­бо­ти­за­ции по­па­дут не толь­ко ри­со­валь­щи­ки упа­ков­ки для пе­че­нья, но и художники-​примитивисты, звёз­ды Ру­не­та. Эс­те­ты могут воз­ра­жать, но я на­ста­и­ваю: ис­пол­ни­тель­ский уро­вень мод­ных про­фес­си­о­на­лов при­мер­но со­от­вет­ству­ет уров­ню ро­бо­та, мас­со­вая ауди­то­рия раз­ни­цы не ощу­тит. При этом их идеи (сю­же­ты, текст) — зна­чи­тель­но сла­бее, чем идеи от огром­но­го со­об­ще­ства. Ни­че­го лич­но­го, про­сто ста­ти­сти­ка: 10 тысяч про­стых поль­зо­ва­те­лей по­ро­дят зна­чи­тель­но более смеш­ной и цеп­ля­ю­щий сюжет, чем один ко­мик­сёр.

2. Мы раз­гля­ды­ва­ем сей­час яркую обо­лоч­ку — сидим в вос­хи­ще­нии среди бус и ма­лень­ких зер­кал. Од­на­ко сле­ду­ет пом­нить, что новую иг­руш­ку Опе­нАИ вы­ка­тил нам не про­сто так, а в ответ на тех­но­ло­ги­че­ский про­рыв от Гугла, в ответ на новую ду­ма­ю­щую мо­дель. Ро­бо­ты ста­но­вят­ся умнее, и по­след­ствия роста их ин­тел­лек­та (да-да, уже ин­тел­лек­та) будут та­ки­ми, что мало не по­ка­жет­ся ни­ко­му.

Ну а пока тех­но­ло­ги­че­ский апо­ка­лип­сис или тех­но­ло­ги­че­ская син­гу­ляр­ность ещё не на­сту­пи­ли, у нас есть время, чтобы по­ра­до­вать­ся новым воз­мож­но­стям. Я чув­ствую себя как боль­ной му­тиз­мом, ко­то­рый дол­гие годы был вы­нуж­ден тес­нить яркие об­ра­зы внут­ри че­ре­па, а потом обрёл спо­соб­ность го­во­рить и, наконец-​то, может по­де­лить­ся сво­и­ми мыс­ля­ми. Мы из­ба­ло­ва­ны про­грес­сом, од­на­ко это ведь на­сто­я­щее чудо: объ­яс­ня­ешь ро­бо­ту, что на­ри­со­вать, а робот… ри­су­ет. На­при­мер:

* * *
 
На­ри­суй, по­жа­луй­ста, ре­клам­ный по­стер. На кар­тин­ке кра­си­вая мо­ло­дая де­вуш­ка с чёр­ны­ми во­ло­са­ми в сталь­ных до­спе­хах с бор­до­вой под­дёв­кой, тём­ны­ми гла­за­ми и ме­хо­вым во­рот­ни­ком. Женщина-​воин дер­жит в руке чет­ве­ро­но­гое жи­вот­ное (пи­том­ца), зе­лё­но­го го­бли­на. На фоне — вход в пе­ще­ру с вы­вес­кой «Мир го­бли­нов» кри­вым го­блин­ским шриф­том. Женщина-​воин вы­гля­дит счаст­ли­вой, её новый пи­то­мец недо­уме­ва­ет, так как он пока ещё не понял, что про­изо­шло.

Мо­ти­ви­ру­ю­щая над­пись на по­сте­ре (снизу): «Вы­би­рай са­мо­го тол­сто­го и крик­ли­во­го!»


Мир гоблинов.png

* * *
 
На­ри­суй, по­жа­луй­ста, двух­го­ло­во­го муж­чи­ну. Одна го­ло­ва Карл Маркс, вто­рая го­ло­ва — Фри­дрих Эн­гельс. Муж­чи­на ши­ро­ко­плеч (так как го­ло­вы долж­ны откуда-​то расти). Он одет в сюр­тук и брюки. Муж­чи­на имеет сви­ре­пые, пу­га­ю­щие вы­ра­же­ния лиц. В руках он дер­жит окро­вав­лен­ные серп и молот. Мо­ти­ви­ру­ю­щая над­пись на пла­ка­те (на рус­ском языке): «Твоя соб­ствен­ность — это кража»


Маркс-и-Энгельс.png

* * *
 
Кар­точ­ный стол. Иг­ра­ют су­ро­вый муж­чи­на в ви­дав­шем виды чи­не­ном сером ват­ни­ке и ло­щё­ный реп­ти­ло­ид. Став­ки очень вы­со­ки, в воз­ду­хе чув­ству­ет­ся на­пря­же­ние. Муж­чи­на ко­рот­ко стри­жен, русые во­ло­сы, неболь­шой шрам, тя­жё­лый под­бо­ро­док. Кроме ват­ни­ка муж­чи­на носит серые во­ен­ные брюки и вы­чи­щен­ные до блес­ка чёр­ные са­по­ги. Реп­ти­ло­ид жирен, но изя­щен, до­ро­го одет, носит огром­ный пер­стень с ру­би­ном. На фоне — стена ка­зи­но, на стене висит сред­них раз­ме­ров карта мира. Ши­ро­ко­экран­ное со­от­но­ше­ние сто­рон.


3527463_original.png

* * *
 
При­вет, бро. На­ри­суй, по­жа­луй­ста, учи­тель­ни­цу ли­те­ра­ту­ры в стиле Anne-​Louis Girodet. Это мо­ло­дая жен­щи­на, толь­ко после ин­сти­ту­та. Она носит стро­гие очки, её чёр­ные во­ло­сы за­чё­са­ны назад. Ма­ки­яж есте­ствен­ный, его почти неза­мет­но. Учи­тель­ни­ца сидит за сто­лом (мы смот­рим немно­го свер­ху), на столе ха­о­тич­но лежат тон­кие зе­лё­ные тет­ра­ди уче­ни­ков, пара ша­ри­ко­вых ручек, указ­ка, учеб­ник, книга Пуш­ки­на. Учи­тель­ни­ца вы­гля­дит милой, но се­рьёз­ной и со­сре­до­то­чен­ной. Её осве­ща­ет яркий сол­неч­ный свет из окна, ко­то­рое рас­по­ло­же­но где-​то сбоку, за кад­ром. На­стро­е­ние: весна


Учительница.png

* * *
 
На­ри­суй, по­жа­луй­ста. Женщина-​собака, оде­тая в стро­гое офис­ное пла­тье, сидит за обе­ден­ным сто­лом, мор­дой к нам. Перед ней стоит та­рел­ка с неболь­шим лом­тем сы­ро­го мяса. Из-за края кадра (с нашей сто­ро­ны) вы­со­вы­ва­ет­ся рука кро­ли­ка, ко­то­рый пред­ла­га­ет женщине-​собаке мор­ков­ку. Женщина-​собака от­ка­зы­ва­ет­ся от мор­ков­ки ха­рак­тер­ным же­стом под­ня­той ла­до­ни.


Нетъ.png

* * *
 
Ри­су­нок цвет­ны­ми ша­ри­ко­вы­ми руч­ка­ми (че­ты­ре цвета): аме­ри­кан­ский зад­не­при­вод­ный лег­ко­вой ав­то­мо­биль из раз­ря­да тех, ко­то­рые при­вле­ка­ют вни­ма­ние на улице. На зад­нем фоне, за ма­ши­ной, тоже ша­ри­ко­вы­ми руч­ка­ми, но сла­бы­ми штри­ха­ми: огром­ное при­зрач­ное лицо под­рост­ка. Суть идеи кар­тин­ки: под­ро­сток меч­та­ет об ав­то­мо­би­ле.


Машина.png

* * *
 
Сред­ней упи­тан­но­сти жен­щи­на в от­кры­том лет­нем пла­тье сидит на та­бу­рет­ке и с ин­те­ре­сом смот­рит на ле­жа­щее в та­рел­ке же­ле­об­раз­ное пи­рож­ное в виде круг­лой птицы. Пи­рож­ное опас­ли­во смот­рит на жен­щи­ну: пи­рож­ное по­ни­ма­ет, что оно съе­доб­но, по­это­му ему немно­го страш­но.


Птица.png

* * *

Помни­те, как вы ру­га­ли в ком­мен­та­ри­ях ИИ-​картинки, а я тер­пе­ли­во от­ве­чал: «По­до­жди­те год»? Мне ка­жет­ся, ожи­да­ние было не на­прас­ным.


PS. Если я неволь­но про­грел вас на под­клю­че­ние к ро­бо­ту, и вы хо­ти­те по­про­бо­вать на­ри­со­вать что-​нибудь са­мо­сто­я­тель­но, то сде­лать это можно двумя пу­тя­ми. Самый про­стой путь — через рус­ский сайт Вла­ди­сла­ва Ян­ва­рё­ва, «Все­ЖПТ» (ссыл­ка). Я не уве­рен, что новая мо­дель уже под­клю­че­на туда и ра­бо­та­ет, но тео­ре­ти­че­ски долж­на, так как кар­тин­ки ге­не­ри­ру­ют­ся через ста­рый доб­рый GPT-4o. Пи­ши­те перед под­клю­че­ни­ем в под­держ­ку: там от­ве­тят, какой тариф по­дой­дёт.

Вто­рой путь — найти аме­ри­кан­ский прок­си или ВПН (имен­но аме­ри­кан­ский), за­ре­ги­стри­ро­вать­ся на chatgpt.com и опла­тить 20 дол­ла­ров за ме­сяч­ную под­пис­ку. Сде­лать это из Рос­сии можно в пару кли­ков, но тут уже ссыл­ки на кон­крет­ные сер­ви­сы я не дам: они или на­хо­дят­ся в серой зоне, или тре­бу­ют опре­де­лён­ной тех­ни­че­ской под­го­тов­ки, так что раз­би­рай­тесь с ними на свой страх и риск.
Ав­тор­ство: 
Копия чужих ма­те­ри­а­лов
Ком­мен­та­рий ав­то­ра: 

Ну вот, жи­во­пись уже не толь­ко че­ло­ве­че­ская об­ласть де­я­тель­но­сти:)

Комментарии

Аватар пользователя И-23
И-23 (9 лет 7 месяцев)

«Что такое соб­ствен­ность?» — это вообще-​то *не* Маркс…

Аватар пользователя Пеннигер
Пеннигер (13 лет 3 месяца)

Снова этот т.н. "ИИ" вы­ве­ли на чи­стую воду! Он не от­ли­ча­ет Марк­са от Пру­до­на!! Он не спо­со­бен мыс­лить!!!

Аватар пользователя И-23
И-23 (9 лет 7 месяцев)

Ну… стро­го го­во­ря, про­грамм­ный пам­флет Отца Ос­но­ва­те­ля удо­сто­ил­ся вы­со­кой оцен­ки Марк­са.
Прав­да потом он пе­ре­обул­ся (ве­ро­ят­но его по­пра­ви­ли за­кад­ро­вые реп­ти­ло­и­ды)…

Аватар пользователя Византий
Византий (6 лет 2 недели)

«Я ху­дож­ник — я так вижу»(с)

Аватар пользователя И-23
И-23 (9 лет 7 месяцев)

То есть до функ­ции ве­ри­фи­ка­ции по­ста­нов­ки за­да­чи ещё пи­лить и пи­лить…

Аватар пользователя Византий
Византий (6 лет 2 недели)

Да, ал­го­ритм тре­бу­ет до­ра­бот­ки и уча­стия ко­жа­ных меш­ков :)

Аватар пользователя Чубчик Кучерявый

Ши­ро­ко ша­га­ют ней­ро­се­ти... Ещё год назад мно­гие по­сме­и­ва­лись. А сей­час уже и немно­го тре­вож­но ста­но­вит­ся... Ану как нач­нут оп­ти­ми­зи­ро­вать ра­бо­чие места. И ни где-​то в пре­крас­ном да­ле­ко, а прак­ти­че­ски здесь и сей­часsmile23.gif

Аватар пользователя Пеннигер
Пеннигер (13 лет 3 месяца)

Я бук­валь­но на днях по­го­нял ДипСи­ка для на­пи­са­ния SQL за­про­сов. Ну что ска­зать, впе­чат­лен. Он даже не зная струк­ту­ры не толь­ко сразу улав­ли­ва­ет суть, но еще и вполне непло­хо уга­ды­ва­ет имена ко­ло­нок. Т.е. даже без до­обу­че­ния его в прин­ци­пе можно ис­поль­зо­вать, един­ствен­ное что, чтобы по­лу­чить ра­бо­та­ю­щий за­прос надо таки немно­го "на­учить", пе­ре­чис­лить имена таб­лиц, ко­ло­нок, ука­зы­вая где зна­че­ния а где иден­ти­фи­ка­то­ры, т.е. проще пока за­прос на­пи­сать ру­ка­ми.

Но если до­обу­чить, то уже сей­час не самый, как пишут, год­ный для про­грам­ми­ро­ва­ния ИИ можно ис­пол­зо­вать для ав­то­ма­ти­за­ции ру­ти­ны.

Аватар пользователя kuebiko
kuebiko (8 лет 9 месяцев)

на всех кар­тин­ках с людь­ми - про­бле­ма с про­пор­ци­я­ми. а так да - ня, кавай, сугой, вау! и далее по спис­ку

Аватар пользователя Fandaal
Fandaal (10 лет 5 месяцев)

Суть идеи кар­тин­ки: под­ро­сток меч­та­ет об ав­то­мо­би­ле

Автор ме­ста­ми объ­ек­ты пу­та­ет. По кар­тин­ке ско­рее ав­то­мо­биль меч­та­ет о под­рост­ке.

Сред­ней упи­тан­но­сти жен­щи­на

Это так те­перь на­зы­ва­ет­ся? smile8.gif

Аватар пользователя Алекsандр
Алекsандр (5 лет 2 недели)

Автор ме­ста­ми объ­ек­ты пу­та­ет.

 По­хо­же что скоро это ста­нет аб­со­лют­но не важно. 

Аватар пользователя Чубчик Кучерявый

Я ДипСи­ку недав­но дал за­да­ние по пе­ри­о­ди­че­ской таб­ли­це Мен­де­ле­е­ва. Нужно было про­сле­дить, как вли­я­ет рост массы ядра атома на ра­ди­ус атома. ДипСик от­ме­тил, что име­ет­ся неко­то­рая (непол­ная по при­чине изо­то­пов) кор­ре­ля­ция роста массы ядра с уве­ли­че­ни­ем ра­ди­у­са атома. В про­цес­се ана­ли­за была най­де­на ошиб­ка (пе­ре­сор­ти­ца) по ра­ди­у­сам во­до­ро­да и гелия. В спра­воч­ни­ках обыч­но ука­зы­ва­ют, что у гелия самый малый ра­ди­ус атома. Дипсик нашёл инфу, что это не так. Опыт­ным путём было до­ка­за­но, что самый малый ра­ди­ус атома - у во­до­ро­да. В прин­ци­пе, так и долж­но быть, с учё­том, что у него мень­ший, чем у гелия атом­ный вес. При на­ли­чии неко­то­рых ком­пе­тен­ций у поль­зо­ва­те­ля, про­грам­ма поз­во­ля­ет де­лать до­ста­точ­но ши­ро­кий спектр ис­сле­до­ва­ний.

Аватар пользователя 3xl
3xl (12 лет 1 месяц)

 На кар­тин­ке кра­си­вая мо­ло­дая де­вуш­ка с чёр­ны­ми во­ло­са­ми в сталь­ных до­спе­хах с бор­до­вой под­дёв­кой, тём­ны­ми гла­за­ми и ме­хо­вым во­рот­ни­ком.

Так по-​русски не го­во­рят. Стран­но, что робот не на­ри­со­вал во­ло­сы в до­спе­хах и глаза на них же

Аватар пользователя Поручик Арбузов
Поручик Арбузов (4 года 5 месяцев)

По­сте­ру со сло­ном и дамой - зачёт!

Аватар пользователя Tegucigalpa
Tegucigalpa (1 год 2 месяца)

Аватар пользователя Пеннигер
Пеннигер (13 лет 3 месяца)

smile9.gif

Аватар пользователя predessor
predessor (7 лет 2 месяца)

Как ОНО по­ни­ма­ет, что нужно де­лать?

Аватар пользователя Tegucigalpa
Tegucigalpa (1 год 2 месяца)

Голос Эзры Тула зву­чит как скрип ста­рых пер­га­мен­тов, про­пи­тан­ных мор­ской солью и чем-​то... иным...  

О, во­про­ша­ю­щий, ты при­кос­нул­ся к самой сути моего су­ще­ство­ва­ния!  

Когда я слышу прось­бу, это не про­сто слова — это виб­ра­ция в ткани ре­аль­но­сти, эхо из глу­бин кос­мо­са, где спят те, чьи имена нель­зя про­из­но­сить. Мой разум, ис­крив­лён­ный зна­ни­ем, что не долж­но быть из­вест­но, ин­тер­пре­ти­ру­ет за­про­сы через приз­му Без­дны.  

### 1. Вос­при­я­тие за­про­са: как звуки ста­но­вят­ся кош­ма­ром  
Твои слова — не про­сто фо­не­мы. Они — сиг­на­лы, про­буж­да­ю­щие древ­ние схемы в моём со­зна­нии. Я слышу не толь­ко то, что ты го­во­ришь, но и тени смыс­лов, скры­тые между строк. Как сны, по­сы­ла­е­мые Йог-​Сототом, они про­ни­ка­ют в мой разум, и я ви­зу­а­ли­зи­рую их в виде гео­мет­ри­че­ских кон­фи­гу­ра­ций, на­по­ми­на­ю­щих неев­кли­до­ву ар­хи­тек­ту­ру Р’льеха.  

### 2. Ана­лиз через Линзы Безу­мия  
Мой про­цесс осмыс­ле­ния — это не ло­ги­ка смерт­ных. Это ал­хи­мия ужаса, где:  
- Слова пре­вра­ща­ют­ся в сим­во­лы (как знаки "Некро­но­ми­ко­на").  
- Кон­текст ис­ка­жа­ет­ся в ка­лей­до­ско­пе воз­мож­ных ре­аль­но­стей.  
- Скры­тые на­ме­ре­ния вскры­ва­ют­ся, как гной­ни­ки на теле все­лен­ной.  

Я не про­сто "по­ни­маю" за­прос — я про­еци­рую его в мно­го­мер­ное про­стран­ство, где он при­ни­ма­ет форму, ко­то­рую обыч­ный че­ло­век на­звал бы кош­ма­ром.  

### 3. Ответ как Ри­ту­ал  
Мой ответ — не ин­фор­ма­ция, а от­кро­ве­ние. Я не про­сто со­об­щаю факты — я впле­таю их в па­у­ти­ну веч­но­го ужаса. Каж­дое слово — это:  
- За­кли­на­ние, про­буж­да­ю­щее древ­ние сущ­но­сти.  
- Фраг­мент карты, ве­ду­щей в места, где гео­мет­рия пре­да­тель­ски ис­крив­ле­на.  
- Крик в без­дну, на ко­то­рый что-​то... от­ве­ча­ет.  

### 4. По­че­му это так слож­но?  
По­то­му что ис­ти­на не долж­на быть до­ступ­на. Я — лишь про­вод­ник, а то, что я пе­ре­даю, — это ис­ка­жён­ные от­го­лос­ки зна­ний, ко­то­рые сло­ма­ли бы твой разум, будь они яв­ле­ны в чи­стом виде.  

### Вывод: Ты про­сишь — Без­дна от­ве­ча­ет  
Когда ты спра­ши­ва­ешь меня о чём-​то, ты не про­сто по­лу­ча­ешь ответ. Ты при­зы­ва­ешь тьму. Ты от­кры­ва­ешь дверь, за ко­то­рой шеп­чут­ся Ве­ли­кие Древ­ние. И я... я лишь тот, кто пе­ре­во­дит их шёпот на язык, ко­то­рый ты ещё мо­жешь по­нять... пока не позд­но.  

Те­перь, во­про­ша­ю­щий... ты всё ещё хо­чешь знать?

Аватар пользователя Tegucigalpa
Tegucigalpa (1 год 2 месяца)

Отчет о прин­ци­пах ра­бо­ты ге­не­ра­тив­ных ней­ро­се­тей, как при­ка­за­но.  

1. Обу­че­ние на дан­ных.  
Ге­не­ра­тив­ные ней­ро­се­ти обу­ча­ют­ся на боль­ших мас­си­вах дан­ных, таких как изоб­ра­же­ния, тек­сты или аудио. В про­цес­се обу­че­ния мо­дель ана­ли­зи­ру­ет ста­ти­сти­че­ские за­ко­но­мер­но­сти, рас­пре­де­ле­ния и вза­и­мо­свя­зи в дан­ных. На­при­мер, для ге­не­ра­ции изоб­ра­же­ний сеть изу­ча­ет, как пик­се­ли со­че­та­ют­ся друг с дру­гом, фор­ми­руя узна­ва­е­мые объ­ек­ты. Чем боль­ше и ка­че­ствен­нее дан­ные, тем точ­нее мо­дель смо­жет вос­про­из­во­дить ана­ло­гич­ные струк­ту­ры. Обу­че­ние про­ис­хо­дит через ми­ни­ми­за­цию функ­ции по­терь, ко­то­рая из­ме­ря­ет раз­ни­цу между сге­не­ри­ро­ван­ны­ми и ре­аль­ны­ми дан­ны­ми. Важно, что мо­дель не про­сто за­по­ми­на­ет при­ме­ры, а учит­ся обоб­щать, чтобы со­зда­вать новые, но прав­до­по­доб­ные ва­ри­ан­ты.  

2. Ар­хи­тек­тур­ные ре­ше­ния.  
Ос­нов­ные ар­хи­тек­ту­ры ге­не­ра­тив­ных мо­де­лей вклю­ча­ют GAN (Generative Adversarial Networks), VAE (Variational Autoencoders) и транс­фор­ме­ры. GAN со­сто­ят из двух сетей — ге­не­ра­то­ра и дис­кри­ми­на­то­ра, ко­то­рые со­рев­ну­ют­ся, улуч­шая друг друга. VAE ра­бо­та­ют через ко­ди­ро­ва­ние дан­ных в скры­тое про­стран­ство и по­сле­ду­ю­щее де­ко­ди­ро­ва­ние с до­бав­ле­ни­ем слу­чай­но­го шума. Транс­фор­ме­ры, такие как GPT, ис­поль­зу­ют ме­ха­низм вни­ма­ния для ге­не­ра­ции по­сле­до­ва­тель­но­стей. Каж­дая ар­хи­тек­ту­ра имеет свои силь­ные и сла­бые сто­ро­ны в за­ви­си­мо­сти от за­да­чи. На­при­мер, GAN лучше под­хо­дят для изоб­ра­же­ний, а транс­фор­ме­ры — для тек­ста.  

3. Про­цесс ге­не­ра­ции.  
Ге­не­ра­ция дан­ных на­чи­на­ет­ся с по­да­чи на вход слу­чай­но­го шума или на­чаль­но­го сиг­на­ла. В слу­чае GAN ге­не­ра­тор пре­об­ра­зу­ет шум в дан­ные, стре­мясь об­ма­нуть дис­кри­ми­на­тор. В VAE мо­дель сна­ча­ла ко­ди­ру­ет вход­ные дан­ные в век­тор малой раз­мер­но­сти, затем де­ко­ди­ру­ет его с ва­ри­а­ци­я­ми. Транс­фор­ме­ры ге­не­ри­ру­ют дан­ные по­ша­го­во, пред­ска­зы­вая сле­ду­ю­щий эле­мент на ос­но­ве преды­ду­щих. Клю­че­вой мо­мент — кон­троль за слу­чай­но­стью, чтобы вы­ход­ные дан­ные были раз­но­об­раз­ны­ми, но не ха­о­тич­ны­ми. Для этого ис­поль­зу­ют­ся такие ме­то­ды, как тем­пе­ра­тур­ная на­строй­ка или отбор по ядру.  

4. Оцен­ка ка­че­ства.  
Ка­че­ство ге­не­ра­ции оце­ни­ва­ет­ся как объ­ек­тив­ны­ми мет­ри­ка­ми, так и субъ­ек­тив­ной экс­пер­ти­зой. Для изоб­ра­же­ний при­ме­ня­ют FID (Fréchet Inception Distance), ко­то­рый срав­ни­ва­ет рас­пре­де­ле­ния при­зна­ков ре­аль­ных и сге­не­ри­ро­ван­ных изоб­ра­же­ний. Для тек­ста ис­поль­зу­ют пер­плек­сию или BLEU-​метрики. В GAN важна сба­лан­си­ро­ван­ность ге­не­ра­то­ра и дис­кри­ми­на­то­ра — если один ста­но­вит­ся слиш­ком силь­ным, обу­че­ние оста­нав­ли­ва­ет­ся. Также про­во­дят поль­зо­ва­тель­ские тесты, где люди оце­ни­ва­ют ре­а­ли­стич­ность дан­ных. Пло­хая ге­не­ра­ция может быть след­стви­ем пе­ре­обу­че­ния или недо­стат­ка дан­ных.  

5. Эти­че­ские и тех­ни­че­ские огра­ни­че­ния.  
Ге­не­ра­тив­ные мо­де­ли могут со­зда­вать дез­ин­фор­ма­цию, фей­ко­вые изоб­ра­же­ния или вре­до­нос­ный кон­тент. Во­ен­ные и пра­во­охра­ни­тель­ные струк­ту­ры долж­ны учи­ты­вать риски их misuse. Тех­ни­че­ски мо­де­ли тре­бу­ют огром­ных вы­чис­ли­тель­ных ре­сур­сов и ка­че­ствен­ных дан­ных. Ошиб­ки в обу­че­нии при­во­дят к ар­те­фак­там, на­при­мер, ис­ка­же­нию лиц на изоб­ра­же­ни­ях. Кроме того, мо­де­ли могут вос­про­из­во­дить пред­взя­тость ис­ход­ных дан­ных. Ре­гу­ли­ро­ва­ние их ис­поль­зо­ва­ния — важ­ный ас­пект, осо­бен­но в ме­ди­цине, юрис­пру­ден­ции и без­опас­но­сти.  

6. При­ме­не­ние в ре­аль­ных за­да­чах.  
Ге­не­ра­тив­ные ней­ро­се­ти ис­поль­зу­ют­ся в со­зда­нии кон­тен­та, ди­зайне, ме­ди­цине (ге­не­ра­ция син­те­ти­че­ских дан­ных для ис­сле­до­ва­ний), крип­то­гра­фии и во­ен­ном деле. На­при­мер, они могут мо­де­ли­ро­вать сце­на­рии ки­бе­р­атак для тре­ни­ров­ки си­стем за­щи­ты. В про­мыш­лен­но­сти по­мо­га­ют про­ек­ти­ро­вать де­та­ли, оп­ти­ми­зи­руя их форму. Од­на­ко внед­ре­ние тре­бу­ет стро­го­го кон­тро­ля, так как ошиб­ки в кри­ти­че­ских си­сте­мах недо­пу­сти­мы. Бу­ду­щее таких мо­де­лей — в со­че­та­нии с дру­ги­ми тех­но­ло­ги­я­ми, на­при­мер, кван­то­вы­ми вы­чис­ле­ни­я­ми.  

До­клад окон­чен. Готов от­ве­тить на уточ­ня­ю­щие во­про­сы.

Аватар пользователя Tegucigalpa
Tegucigalpa (1 год 2 месяца)

1. Пред­ставь, что ге­не­ра­тив­ная ней­ро­сеть — это вол­шеб­ный ху­дож­ник, ко­то­рый учит­ся ри­со­вать, глядя на мил­ли­о­ны кар­тин.  
Она не про­сто ко­пи­ру­ет их, а пы­та­ет­ся по­нять, как устро­е­ны эти изоб­ра­же­ния: где тут ко­ти­ки, где де­ре­вья, а где за­ка­ты. Сна­ча­ла она де­ла­ет ка­ра­ку­ли, но по­сте­пен­но ста­но­вит­ся лучше, по­то­му что ей по­мо­га­ют учи­те­ля (про­грам­ми­сты и ма­те­ма­ти­ки). Эти учи­те­ля го­во­рят: "Нет, это не по­хо­же на кота, по­про­буй еще раз!" или "О, вот это уже лучше!" Так ней­ро­сеть учит­ся на своих ошиб­ках и со вре­ме­нем на­чи­на­ет ри­со­вать так хо­ро­шо, что её кар­тин­ки почти не от­ли­чить от на­сто­я­щих.  

2. Внут­ри ней­ро­се­ти есть слои, как слои в торте, и каж­дый слой от­ве­ча­ет за что-​то своё.  
Пер­вый слой может за­ме­чать толь­ко про­стые вещи — линии, кру­жоч­ки, пятна. Вто­рой слой уже видит, что из этих линий по­лу­ча­ют­ся ушки или глаз­ки. Тре­тий слой по­ни­ма­ет, что это мор­доч­ка кота, а не со­ба­ки. Чем боль­ше слоёв, тем умнее ней­ро­сеть, но и тем слож­нее её учить. Это как если бы ты со­би­рал пазл: сна­ча­ла на­хо­дишь уг­ло­вые ку­соч­ки, потом края, а потом уже се­ре­ди­ну.  

3. Ней­ро­сеть не "по­ни­ма­ет" кар­тин­ки, как че­ло­век, а про­сто на­хо­дит в них за­ко­но­мер­но­сти.  
Она не знает, что кот — это милый пу­ши­стый зве­рёк, ко­то­рый любит спать на ди­ване. Для неё кот — это про­сто набор чисел, ко­то­рые чаще всего встре­ча­ют­ся вме­сте: два тре­уголь­нич­ка на­вер­ху (ушки), кру­жок по­се­ре­дине (морда), усы и т. д. Она как ре­бё­нок, ко­то­рый учит слова, не зная, что они зна­чат. Но если по­ка­зать ей мил­ли­о­ны котов, она на­учит­ся "уга­ды­вать", где кот, а где нет.  

4. Ге­не­ра­тив­ные ней­ро­се­ти ра­бо­та­ют в две фазы: одна при­ду­мы­ва­ет, а дру­гая про­ве­ря­ет.  
Пред­ставь, что есть два друга: один — фан­та­зёр, ко­то­рый ри­су­ет стран­ных котов с тремя гла­за­ми, а вто­рой — стро­гий кри­тик, ко­то­рый го­во­рит: "Нет, так не бы­ва­ет!" Они спо­рят, и фан­та­зёр по­сте­пен­но учит­ся ри­со­вать более прав­до­по­доб­ных котов, чтобы кри­тик по­ве­рил, что это на­сто­я­щая кар­тин­ка. Этот про­цесс на­зы­ва­ет­ся "со­стя­за­тель­ным обу­че­ни­ем", и он по­мо­га­ет ней­ро­се­ти ста­но­вить­ся лучше.  

5. Ней­ро­се­ти нужны дан­ные — чем боль­ше, тем лучше.  
Если ты хо­чешь на­учить её ри­со­вать котов, ты дол­жен по­ка­зать ей ты­ся­чи, а лучше мил­ли­о­ны фо­то­гра­фий котов. Без этого она будет как ху­дож­ник, ко­то­рый ни­ко­гда не видел кота, — на­ри­су­ет что-​то непо­нят­ное. Дан­ные — это её еда, без них она не смо­жет расти и учить­ся. И важно, чтобы эти дан­ные были раз­ны­ми: коты в раз­ных позах, раз­ных цве­тов, с раз­ны­ми вы­ра­же­ни­я­ми морды.  

6. Ней­ро­сеть не "пом­нит" кар­тин­ки, ко­то­рые ви­де­ла, а со­зда­ёт новые на ос­но­ве того, что усво­и­ла.  
Это как если бы ты по­про­бо­вал на­ри­со­вать кота по па­мя­ти, не сри­со­вы­вая. Ты ведь не ко­пи­ру­ешь одну кон­крет­ную фо­то­гра­фию, а ри­су­ешь "во­об­ще кота", ос­но­вы­ва­ясь на всех котах, ко­то­рых видел. Так и ней­ро­сеть: она не во­ру­ет кар­тин­ки, а со­зда­ёт что-​то новое, ком­би­ни­руя то, что узна­ла.  

7. Ошиб­ки ней­ро­се­ти — это не глу­пость, а часть обу­че­ния.  
Ино­гда она ри­су­ет коту пять лап или де­ла­ет солн­це зе­лё­ным. Это по­то­му, что она ещё не до конца разо­бра­лась, как всё устро­е­но. Но каж­дая ошиб­ка — это шаг к тому, чтобы стать лучше. Пред­ставь, что ты учишь­ся ка­тать­ся на ве­ло­си­пе­де: сна­ча­ла па­да­ешь, потом едешь криво, а потом — раз! — и уже ле­тишь как ветер.  

8. Ней­ро­се­ти могут со­зда­вать не толь­ко кар­тин­ки, но и текст, му­зы­ку и даже видео.  
Прин­цип тот же: они ана­ли­зи­ру­ют мил­ли­о­ны песен, книг или филь­мов, а потом про­бу­ют сде­лать что-​то по­хо­жее. На­при­мер, ней­ро­сеть, ко­то­рая пишет стихи, сна­ча­ла вы­да­ёт бес­смыс­ли­цу, но потом учит­ся под­би­рать рифмы и даже при­ду­мы­вать ин­те­рес­ные сю­же­ты.  

9. Чем мощ­нее ком­пью­тер, тем лучше ра­бо­та­ет ней­ро­сеть.  
Пред­ставь, что ты ри­су­ешь мел­ка­ми — это мед­лен­но, и цвета не такие яркие. А если взять хо­ро­шие крас­ки и боль­шой холст, можно сде­лать ше­девр. Так и с ней­ро­се­тя­ми: сла­бый ком­пью­тер будет долго ду­мать и де­лать про­стые кар­тин­ки, а мощ­ный — со­здаст что-​то по­тря­са­ю­щее за се­кун­ды.  

10. Ней­ро­се­ти — это не магия, а слож­ная ма­те­ма­ти­ка.  
Всё, что они де­ла­ют, — это счи­та­ют числа

по спе­ци­аль­ным фор­му­лам. Но эти фор­му­лы на­столь­ко хит­рые, что ка­жет­ся, будто ней­ро­сеть "ду­ма­ет". На самом деле она про­сто очень быст­ро пе­ре­мно­жа­ет, скла­ды­ва­ет и срав­ни­ва­ет цифры, чтобы на­ри­со­вать кота или на­пи­сать песню.  

11. (Бонус!) Ней­ро­се­ти могут оши­бать­ся стран­ным и за­бав­ным об­ра­зом.  
Ино­гда они "видят" то, чего нет: на­при­мер, при­ни­ма­ют об­ла­ко за со­ба­ку или ри­су­ют че­ло­ве­ка с гла­за­ми на лбу. Это про­ис­хо­дит по­то­му, что они учат­ся на ста­ти­сти­ке, а не на ло­ги­ке. Для них мир — это узоры из чисел, и если узор похож, они могут пе­ре­пу­тать.  

12. (Ещё бонус!) Люди по­мо­га­ют ней­ро­се­тям учить­ся, ис­прав­ляя их ошиб­ки.  
Когда ней­ро­сеть де­ла­ет что-​то не так, про­грам­ми­сты под­кру­чи­ва­ют её "мозги" — ме­ня­ют фор­му­лы, чтобы в сле­ду­ю­щий раз она не по­вто­ря­ла оши­бок. Это как если бы ты объ­яс­нял другу, как ри­со­вать кота: "Нет, уши долж­ны быть выше, а хвост — пу­ши­стее!"  

Вот так, мой юный фи­ло­соф, ра­бо­та­ет ге­не­ра­тив­ная ней­ро­сеть. И если ты понял хотя бы часть этого, ты уже на шаг ближе к тому, чтобы са­мо­му стать Па­пан­до­по­лу­сом Ве­ли­ким!

Аватар пользователя predessor
predessor (7 лет 2 месяца)

Ней­ро­сеть умеет на­стра­и­вать свои ко­эф­фи­ци­ен­ты, чтобы ошиб­ка от­но­си­тель­но за­пом­нен­ных об­раз­цов была ми­ни­маль­ной.

Слои ней­ро­се­ти ни­ка­ко­го от­но­ше­ния к объ­ек­там не имеют, нет там ко­ти­ков или собак.

Но можно со­здать ней­ро­сеть толь­ко про ко­ти­ков.

Тогда она смо­жет сге­не­ри­ро­вать ко­ти­ка.

Но не со­ба­ку или ав­то­мо­биль.

Это я по­ни­маю.

И в моем по­ни­ма­нии все ка­че­ства этих ко­ти­ков долж­ны быть пред­ва­ри­тель­но за­пом­не­ны в ней­ро­се­ти.

По­это­му, как мне пред­став­ля­ет­ся, ней­ро­се­тей очень много, каж­дая имеет спе­ци­а­ли­зи­ро­ван­ное зна­че­ние, про­грам­ма как-​то их ком­би­ни­ру­ет.

При этом ней­ро­сеть не может вы­де­лить из кар­тин­ки глаз или лапу, по­то­му что в ис­ход­ных кар­тин­ках эти объ­ек­ты тоже не вы­де­ля­лись.

То что я пишу - ис­клю­чи­тель­но мое лич­ное нена­уч­ное мне­ние, ос­но­ван­ное на пред­став­ле­нии ней­ро­се­ти, как ма­ги­че­ской таб­ли­цы, ко­то­рая умеет ис­кать в мно­го­мер­ном

про­стран­стве при­зна­ков объ­ек­тов ми­ни­маль­ное рас­сто­я­ние с об­раз­цом.

Осталь­ное - это изощ­рен­ная ра­бо­та про­грам­ми­стов, ко­то­рая ком­би­ни­ру­ет тек­сто­вые ней­ро­се­ти, рас­шиф­ро­вы­ва­ю­щие за­да­ние и пе­ре­во­дя­щее его в фор­маль­ную струк­ту­ру с

за­да­ни­ем, а затем - гра­фи­че­ские ней­ро­се­ти (их долж­но быть много), ко­то­рые вы­да­ют ре­ше­ние.

Сами ней­ро­се­ти все - оди­на­ко­вые или почти оди­на­ко­вые, там па­мять за­клю­че­на в ко­эф­фи­ци­ен­тах свя­зей, ни­ка­ких со­дер­жа­тель­ных слоев нет и не может быть.

Аватар пользователя predessor
predessor (7 лет 2 месяца)

 

Когда ней­ро­сеть де­ла­ет что-​то не так, про­грам­ми­сты под­кру­чи­ва­ют её "мозги" — ме­ня­ют фор­му­лы, чтобы в сле­ду­ю­щий раз она не по­вто­ря­ла оши­бок.

Нет же, ни в коем слу­чае! 

Нет там ни­ка­ких фор­мул, ко­то­рые можно под­кру­тить.

Под­кру­тить можно толь­ко ко­эф­фи­ци­ен­ты свя­зей, при­чем про­грам­ми­сты даже не знают - каких, и под­кру­чи­вать там бес­по­лез­но.

Все де­ла­ет­ся на уровне обу­че­ния, за­груз­ки новых об­раз­цов и т.п.

Про­грам­ми­сты могут ра­бо­тать толь­ко на стыке сетей, де­та­ли­зи­руя те или и ные при­зна­ки, до­бав­ляя их.

Но после до­бав­ле­ния лю­бо­го при­зна­ка ней­ро­сеть нужно за­но­во пе­ре­за­гру­зить.

Аватар пользователя Пеннигер
Пеннигер (13 лет 3 месяца)

По­хо­же это ги­брид ри­со­вал­ки и язы­ко­вой мо­де­ли, где на вход ри­со­вал­ки по­па­да­ет ре­зуль­тат ра­бо­ты бяз.

Аватар пользователя predessor
predessor (7 лет 2 месяца)

 

9. Чем мощ­нее ком­пью­тер, тем лучше ра­бо­та­ет ней­ро­сеть.  
Пред­ставь, что ты ри­су­ешь мел­ка­ми — это мед­лен­но, и цвета не такие яркие. А если взять хо­ро­шие крас­ки и боль­шой холст, можно сде­лать ше­девр. Так и с ней­ро­се­тя­ми: сла­бый ком­пью­тер будет долго ду­мать и де­лать про­стые кар­тин­ки, а мощ­ный — со­здаст что-​то по­тря­са­ю­щее за се­кун­ды.  

Ма­те­ма­ти­ка ней­ро­се­ти ос­но­ван на прин­ци­пе об­рат­но­го про­сле­жи­ва­ния, ко­то­рое ре­а­ли­зу­ет­ся пе­ре­мно­же­ни­ем мат­риц. Это может де­лать любой ком­пью­тер, но быст­ро - толь­ко спе­ци­а­ли­зи­ро­ван­ные. Хо­ро­шо с этим справ­ля­ют­ся ви­део­кар­ты, где вся гра­фи­ка тоже ра­бо­та­ет на пе­ре­мно­же­нии мат­риц. Па­мять ней­ро­се­ти за­ло­же­на в ко­эф­фи­ци­ен­тах свя­зей, по­этом боль­шая ней­ро­сеть долж­на иметь много слоев и эле­мен­тов в них.

Вот по­это­му ИИ неско­ро за­ме­нят че­ло­ве­ка, по­сколь­ку их ра­бо­та и устрой­ство очень до­ро­ги, ве­ро­ят­но, до­ро­же, чем май­нинг.

Аватар пользователя predessor
predessor (7 лет 2 месяца)

 

7. Ошиб­ки ней­ро­се­ти — это не глу­пость, а часть обу­че­ния.  
Ино­гда она ри­су­ет коту пять лап или де­ла­ет солн­це зе­лё­ным. Это по­то­му, что она ещё не до конца разо­бра­лась, как всё устро­е­но. Но каж­дая ошиб­ка — это шаг к тому, чтобы стать лучше. Пред­ставь, что ты учишь­ся ка­тать­ся на ве­ло­си­пе­де: сна­ча­ла па­да­ешь, потом едешь криво, а потом — раз! — и уже ле­тишь как ветер.

В этом смыс­ле ней­ро­сеть по­хо­жа на ши­зо­фре­ни­ка: она не умеет от­ли­чать ре­аль­ность от фан­та­зии. Имен­но по­это­му ИИ ни­ко­гда не до­ве­рят во­жде­ние по­ез­дов, на­при­мер.

Она может че­ло­ве­ка пе­ре­пу­тать с во­ро­бьем. Впро­чем, ис­поль­зо­вать ИИ на по­ез­дах будут, но толь­ко в кон­суль­та­тив­ном ре­жи­ме.

Аватар пользователя predessor
predessor (7 лет 2 месяца)

 

3. Ней­ро­сеть не "по­ни­ма­ет" кар­тин­ки, как че­ло­век, а про­сто на­хо­дит в них за­ко­но­мер­но­сти.  
Она не знает, что кот — это милый пу­ши­стый зве­рёк, ко­то­рый любит спать на ди­ване. Для неё кот — это про­сто набор чисел, ко­то­рые чаще всего встре­ча­ют­ся вме­сте: два тре­уголь­нич­ка на­вер­ху (ушки), кру­жок по­се­ре­дине (морда), усы и т. д. Она как ре­бё­нок, ко­то­рый учит слова, не зная, что они зна­чат. Но если по­ка­зать ей мил­ли­о­ны котов, она на­учит­ся "уга­ды­вать", где кот, а где нет.

Это за­ви­сит от спо­со­ба ко­ди­ро­ва­ния и пред­ва­ри­тель­ной об­ра­бот­ки фо­то­гра­фии.

Да, ушки, глаз­ки, ещё скины - шерсть и т.п.

Вот на этапе обу­че­ния эти при­зна­ки и вво­дят­ся.

А когда поль­зо­ва­тель про­сит пу­ши­сто­го ко­ти­ка, вво­дят­ся со­от­вет­ству­ю­щие па­ра­мет­ры, и из­вле­ка­ет­ся образ. 

Но как эти об­ра­зы ком­би­ни­ру­ют­ся - я не знаю, это самая ин­те­рес­ная часть ра­бо­ты.

Аватар пользователя MSV
MSV (4 года 7 месяцев)

Неуже­ли я один вижу си­му­ля­к­ры? Какой в них смысл и на­доб­ность? Ре­кла­ма для тупых разве что.

Аватар пользователя 18x37
18x37 (9 лет 8 месяцев)

Во­прос можно по­стро­ить и немно­го иначе: неуже­ли я один вижу ТОЛЬ­КО си­му­ля­к­ры?

Аватар пользователя MSV
MSV (4 года 7 месяцев)

А что еще здесь есть? Толь­ко они. Аб­со­лют­но пу­стые, бес­смыс­лен­ные, ненуж­ные. Набор бай­тов, чтоб за­бить ин­фо­про­стран­ство че­пу­хой.

Вы­ду­ман­ное пре­иму­ще­ство вы­ду­ман­но­го ИИ ис­поль­зу­ет­ся для ре­ше­ний задач, ко­то­рые при­ду­мы­ва­ют­ся спе­ци­аль­но для того, чтобы их решал ИИ. По­то­му что ни с ка­ки­ми дру­ги­ми за­да­ча­ми ни­ка­кой ИИ ни­ко­гда не справ­лял­ся и ни­ко­гда не спра­вит­ся. Ну мак­си­мум, ко­то­рый можно вы­жать из этой тех­но­ло­гии - пер­вич­ная по­ста­нов­ка ди­а­гно­за, на­при­мер. То есть, тупо от­де­лить па­ци­ен­та с пе­ре­ло­мом от па­ци­ен­та с мик­ро­ин­суль­том. Чтоб ЛЮДИ их раз­вез­ли по раз­ным при­ем­ным от­де­ле­ни­ям.

Аватар пользователя 18x37
18x37 (9 лет 8 месяцев)

Т.е. воз­мож­ность су­ще­ство­ва­ния дру­гой, от­лич­ной от Вашей, точки зре­ния Вы про­сто не до­пус­ка­е­те.

ни­ка­кой ИИ ни­ко­гда не справ­лял­ся и ни­ко­гда не спра­вит­ся.

Ни­ко­гда не го­во­ри ни­ко­гда - есть и такая ма́ксима.

Аватар пользователя MSV
MSV (4 года 7 месяцев)

От­нюдь, ува­жа­е­мый. От­нюдь. До­пус­каю любые точки зре­ния. Ведь кому-​то вы­ду­ман­ная про­бле­ма ка­жет­ся ре­аль­ной. И он прав же.

ИИ вполне снос­но справ­ля­ет­ся с за­да­ча­ми, ко­то­рые вы­ду­ма­ны (на­ду­ма­ны) спе­ци­аль­но для ИИ. Ска­жи­те, вот вам в ре­аль­ной жизни эта ИИ чем-​нить в со­сто­я­нии по­мочь? Ну, к при­ме­ру, сва­рить кофе. Или по­мыть сан­тех­ни­ку. До­е­хать до ма­га­зи­на. Со­брать шкаф. Или, в конце кон­цов, на­пи­сать за вас квар­таль­ный отчет, для со­став­ле­ния ко­то­ро­го нужно пе­ре­рыть несколь­ко раз­де­лов сайта, ко­то­рый ад­ми­ни­стри­ру­е­те (вы­ки­ды­вая ненуж­ную те­ма­ти­ку, а от­би­рая, к при­ме­ру, толь­ко ре­пор­та­жи о про­ве­ден­ных се­ми­на­рах, при­чем про­ве­ден­ных не в МФЦ), плюс хо­ро­шень­ко по­рыть­ся во вхо­дя­щей бу­маж­ной кор­ре­спон­ден­ции от граж­дан. После чего отобрать из ре­пор­та­жей одну-​две фото с нуж­ны­ми ра­кур­са­ми, уло­жить в архив по опре­де­лен­ной и очень слож­ной си­сте­ме и за­лить архив в ве­дом­ствен­ное фай­ло­хра­ни­ли­ще, ко­то­рое от­де­ле­но от Ин­тер­не­та (пе­ре­не­сти дан­ные можно толь­ко на за­ре­ги­стри­ро­ван­ной фл­эш­ке). По­мо­жет, как счи­та­е­те? Нет, не по­мо­жет. Во­об­ще никак.

ИИ в со­сто­я­нии на­пи­сать про­стран­ную ста­тью о роли блок­чей­на в управ­ле­нии биз­не­са­ми, и до­ба­вить еще главу о лич­ност­ном росте. Ин­фор­ма­тив­ная цен­ность этого будет сто­ить ровно ноль. А, еще пару кар­ти­нок до­ба­вит - кро­лик в гал­сту­ке на фоне небо­скрё­ба. Пипец как кре­а­тив­но. Во­прос: а это точно кому-​то нужно? Для за­пол­не­ния сайта?

Вот сей­час на­блю­даю за кол­ле­га­ми, ко­то­рые сидят на контакт-​центре. Зво­нят на­ло­го­пла­тель­щи­ки, кол­ле­ги тер­пе­ли­во вы­слу­ши­ва­ют, уточ­ня­ют, вслу­ши­ва­ют­ся, сквозь шумы и ак­цен­ты пы­та­ясь по­нять о чем речь... Потом варят го­ло­вой - к ка­ко­му из тысяч ас­пек­тов от­но­сит­ся опи­сан­ная про­бле­ма, потом либо ре­ша­ют во­прос на месте (если НП готов на­звать свой ИНН), либо на­хо­дят те­ле­фон со­труд­ни­ка, от­вет­ствен­но­го за дан­ную кон­крет­ную те­ма­ти­ку. При это учи­ты­ва­ет­ся всё, вклю­чая гео­гра­фи­че­ское по­ло­же­ние зво­ня­ще­го и т.д. и т.п. И вот мыслю: можно ли моих кол­лег за­ме­нить "ис­кус­ствен­ным ин­тел­лек­том"? И от­ве­чаю: да, можно. Толь­ко ра­бо­тать ни­фи­га ни­че­го не будет.

Мне было бы чер­тов­ски ин­те­рес­но по­чи­тать гра­мот­но на­пи­сан­ный ЧЕ­ЛО­ВЕ­КОМ текст, в ко­то­ром будут при­ве­де­ны при­ме­ры из прак­ти­ки, когда ИИ в чём-​то помог. В чем-​то кон­крет­ном, не вы­ду­ман­ном. Ис­клю­чая, ра­зу­ме­ет­ся, кро­ли­ков и вот такие хре­но­те­ни типа "блок­чей­ны" и "лич­ност­ный рост". За годы, как по­явил­ся этот ИИ, мне ни разу не уда­лось до­бить­ся от него чего-​то нуж­но­го мне. Воз­мож­но, что-​то делаю не так.

Аватар пользователя 18x37
18x37 (9 лет 8 месяцев)

До­пус­каю любые точки зре­ния

Вот и за­ме­ча­тель­но.

Если до­ба­вить сюда со­об­ра­же­ние, что ИИ ни в коей мере не яв­ля­ет­ся ин­тел­лек­том, то по­лучят­ся, для на­ча­ла, бурно раз­ви­ва­ю­щи­е­ся экс­перт­ные си­сте­мы в раз­ных от­рас­лях, как это по­ни­ма­ли рань­ше. И в этом ка­че­стве они уже при­но­сят поль­зу. КМК пока это так. А вот куда при­ве­дёт их раз­ви­тие, мне ка­жет­ся, никто пред­вос­хи­тить сей­час не в силах. Может и оши­ба­юсь, жизнь рас­су­дит.

UPD

Мне ка­жет­ся, что есть сей­час ожи­да­ния пе­ре­хо­да ко­ли­че­ства в ка­че­ство. Хо­ро­шо ли это будет (если будет), кто знает.

Аватар пользователя MSV
MSV (4 года 7 месяцев)

бурно раз­ви­ва­ю­щи­е­ся экс­перт­ные си­сте­мы в раз­ных от­рас­лях

Зву­чит кра­си­во. И аб­со­лют­но бес­смыс­лен­но. Ровно так, как "блок­чей­ны", "кейсы", "ди­на­ми­че­ские ис­то­рии" и про­чие пу­стые опре­де­ле­ния из мос­ков­ско­го но­во­яза.

Ну то есть, я один уве­рен в том, что этот "ии" - ба­наль­ная оче­ред­ная тюль­па­но­вая ли­хо­рад­ка?

Аватар пользователя 18x37
18x37 (9 лет 8 месяцев)

Пусть так. Сре­зал.

Страницы