ИИ: немно­го о скры­той ло­ги­ке

Аватар пользователя Mr.Wolf

"Дру­зья мои, я опе­ча­лен!"

Жур­на­ли­сты нашли еще один повод по­бо­ять­ся ИИ. Ока­зы­ва­ет­ся (!) ав­то­ры кон­крет­ной ИИ-​модели могут де­лать в ней "за­клад­ки", ко­то­рые при опре­де­лен­ных усло­ви­ях - будут да­вать непра­виль­ные от­ве­ты или вы­пол­нять про­чие не со­всем ожи­да­е­мые дей­ствия. 

Ге­ни­аль­ность дан­но­го от­кры­тия слож­но осо­знать од­но­мо­мент­но, тре­бу­ет­ся спе­ци­аль­ная под­го­тов­ка и со­от­вет­ству­ю­щий на­строй. Так что - не спе­ши­те с вы­во­да­ми! (сар­казм).

Од­на­ко - к фак­ту­ре. Ока­зы­ва­ет­ся, при­ме­не­ние ИИ в тех или иных сфе­рах че­ло­ве­че­ской де­я­тель­но­сти, несет по­ми­мо тра­ди­ци­он­ных и неко­то­рые новые риски, свя­зан­ные с этим самым ИИ. Про­стей­ший ва­ри­ант: вы ис­поль­зу­е­те ИИ для обес­пе­че­ния про­пуск­но­го ре­жи­ма на неко­то­рый объ­ект, убрав ре­аль­ных охран­ни­ков с кон­тро­ля входа. В слу­чае, если зло­умыш­лен­ник смо­жет об­ма­нуть ИИ (на­при­мер, удач­но при­ки­нув­шись штат­ным со­труд­ни­ком) - ни­ка­ких про­блем с про­ник­но­ве­ни­ем на объ­ект у него не воз­ник­нет. Со­от­вет­ствен­но, если рань­ше надо был сле­дить за охран­ни­ка­ми и ре­гу­ляр­но учить их иден­ти­фи­ци­ро­вать чу­жа­ков - то те­перь ана­ло­гич­ные дей­ствия долж­ны вы­пол­нять­ся в от­но­ше­нии при­ме­ня­е­мо­го ИИ: его ре­гу­ляр­но надо "до­учи­вать" с уче­том воз­ник­но­ве­ния у зло­умыш­лен­ни­ков новых спо­со­бов об­ма­на. Пока всё ло­гич­но.

В 2019 году на ан­ти­ви­рус­ные про­дук­ты за ав­тор­ством аме­ри­кан­ской ком­па­нии Cylance (ко­то­рая ре­а­ли­зо­ва­ла в них при­ме­не­ние ИИ), была со­вер­ше­на успеш­ная атака, поз­во­лив­шая за­ра­зить мно­гих кли­ен­тов, поль­зо­вав­шим­ся их про­дук­та­ми. Идея атаки была такая же, как в при­ве­ден­ном выше при­ме­ре: по­ни­мая как имен­но ра­бо­та­ет в ан­ти­ви­ру­се Cylance ИИ-​модель, зло­умыш­лен­ни­ки со­зда­ли вирус, ко­то­рый дан­ная мо­дель не рас­по­зна­ва­ла в ка­че­стве угро­зы и про­пус­ка­ла в за­щи­ща­е­мую сеть, предо­став­ляя ши­ро­кий про­стор для  даль­ней­ших дей­ствий. 

Ряд со­труд­ни­ков этой самой Cylance сде­ла­ли ве­ли­кий вывод, что та­ко­го рода атаки воз­мож­ны не толь­ко на про­дукт их ра­бо­то­да­те­ля, а во­об­ще на любой про­дукт, ис­поль­зу­ю­щий ИИ, уви­де­ли в этом для себя неко­то­рую воз­мож­ность за­ра­бо­тать и ор­га­ни­зо­ва­ли ком­па­нию HiddenLayer, ко­то­рая

раз­ра­ба­ты­ва­ет ин­стру­мен­ты и биб­лио­те­ки для ви­зу­а­ли­за­ции и ана­ли­за ней­рон­ных сетей. Про­дук­ты HiddenLayer по­мо­га­ют ис­сле­до­ва­те­лям и раз­ра­бот­чи­кам ви­зу­а­ли­зи­ро­вать и по­ни­мать внут­рен­нюю струк­ту­ру ней­рон­ных сетей, что может быть по­лез­но для от­лад­ки, оп­ти­ми­за­ции и улуч­ше­ния мо­де­лей ма­шин­но­го обу­че­ния.
Кроме того, ком­па­ния также спе­ци­а­ли­зи­ру­ет­ся на ки­бер­без­опас­но­сти ис­кус­ствен­но­го ин­тел­лек­та (ИИ) и ма­шин­но­го обу­че­ния. Она про­во­дит ис­сле­до­ва­ния уяз­ви­мо­стей в ИИ-​системах и раз­ра­ба­ты­ва­ет ре­ше­ния для укреп­ле­ния без­опас­но­сти этих тех­но­ло­гий, по­мо­гая предот­вра­щать воз­мож­ные вре­до­нос­ные дей­ствия.

(ис­точ­ник)

И вот эти самые та­лант­ли­вые HiddenLayer-​специалисты, ко­вы­ря­ясь в спо­со­бах взло­ма ИИ-​моделей (в дей­стви­тель­но­сти - вполне себе по­лез­ная де­я­тель­ность, и в своем блоге они ре­гу­ляр­но пуб­ли­ку­ют опре­де­лен­ные на­ра­бот­ки по дан­но­му во­про­су), за­од­но ре­ши­ли по­ко­пать и в немно­го дру­гую сто­ро­ну: а что если автор ИИ-​модели сам не так чтобы чист на руку, и пред­ла­гая оную кому-​то в дей­стви­тель­но­сти за­сы­ла­ет "тро­ян­ско­го коня"? 

Re: "Да неже­ли такое воз­мож­но"! (крик души)

В общем, ре­бя­та по­ин­те­ре­со­ва­лись име­ю­щи­ми­ся на­уч­ны­ми на­ра­бот­ка­ми по дан­ной теме (см. тут и тут) и при­шли к пе­чаль­но­му вы­во­ду - что там всё плохо. В том смыс­ле, что - да, угро­за не толь­ко не аб­стракт­на, но очень даже кон­крет­на. Од­на­ко - сюр­приз! - ее ре­а­ли­за­ция (в рас­смат­ри­ва­е­мых ва­ри­ан­тах) - за­ня­тие из не так чтобы де­ше­вых. По­то­му как ИИ-​модель за­го­ня­лась в нуж­ный ва­ри­ант по­ве­де­ния путем скарм­ли­ва­ния ей спе­ци­аль­но под­го­тов­лен­ных обу­ча­ю­щих по­сле­до­ва­тель­но­стей. Это, ко­неч­но же - за­трат­но и по сро­кам и по сто­и­мо­сти, хотя вполне себе ре­а­ли­зу­е­мо (пом­ним скан­дал с ви­зу­а­ли­за­ци­ей ИИ се­на­то­ров США в 19 веке,

что не так чтобы атака, но ра­бо­то­спо­соб­ность схемы вполне себе под­твер­жда­ет: если учить мо­дель толь­ко на цвет­ных - про белых она и знать то не будет). Ну а если до­ро­го - то и бо­ять­ся силь­но не надо (ибо толь­ко у дяди Сэма денег неме­ря­но, а он и так всё что угод­но за­му­тит).

Од­на­ко озна­чен­ные твор­че­ские умы пошли ис­кать более де­ше­вые ва­ри­ан­ты фор­ми­ро­ва­ния за­кла­док. И - ко­неч­но же - нашли. На­зва­ли их "ShadowLogic", про­ве­ри­ли ра­бо­то­спо­соб­ность на ряде до­ступ­ных мо­де­лей - и опуб­ли­ко­ва­ли об­на­де­жи­ва­ю­щие ре­зуль­та­ты: да, ИИ-​троянам быть!

Крат­ко идея в сле­ду­ю­щем: по­сколь­ку сама по себе ИИ-​модель - это некий набор ве­со­вых функ­ций и пра­вил по­лу­че­ния ре­зуль­та­та - ко­то­рый весь­ма велик по объ­е­му, то среди оных можно скрыть несколь­ко шту­чек, пред­на­зна­чен­ных для пе­ре­клю­че­ния мо­де­ли в нуж­ный для зло­умыш­лен­ни­ка режим ра­бо­ты при по­лу­че­нии на вход неко­то­ро­го "триг­гер­но­го со­об­ще­ния" (a la "стоп-​слова"). При­чем внешне эти самые "до­пол­ни­тель­ные" функ­ции ничем не от­ли­ча­ют­ся от всех осталь­ных таких же, пред­на­зна­чен­ных для вы­пол­не­ния мо­де­лью за­яв­лен­но­го функ­ци­о­на­ла, вот толь­ко ко­эф­фи­ци­ен­ти­ки у них под­прав­ле­ны в нуж­ную сто­ро­ну и оформ­ле­ны так, чтобы не ме­ня­лись при обу­че­нии.

У под­хо­да об­на­ру­жи­лись сразу несколь­ко плю­сов: от­но­си­тель­ная де­ше­виз­на, по­ра­зи­тель­ная скрыт­ность и прак­ти­че­ски невоз­мож­ность вы­яв­ле­ния путем внеш­не­го те­сти­ро­ва­ния, ибо мо­дель до по­лу­че­ния "стоп-​слова" - пол­но­цен­но вы­пол­ня­ет весь свой функ­ци­о­нал. В ка­че­стве бо­ну­са - это устой­чи­вость та­ко­го рода за­кла­док к пе­ре­обу­че­нию мо­де­ли: ни­ка­кое до­пол­ни­тель­ное обу­че­ния не из­ме­ня­ет за­ло­жен­ный навык мо­де­ли иден­ти­фи­ка­ции "стоп-​слова", ну а даль­ше - у зло­умыш­лен­ни­ка весь­ма ши­ро­кий про­стор при­ме­не­ния своих фан­та­зий.

Что имеем в сухом остат­ке? А вот очень пло­хие вы­во­ды. Если вы пла­ни­ру­е­те ис­поль­зо­вать ИИ-​модель в каких-​то зна­чи­мых про­цес­сах де­я­тель­но­сти - то вам при­дет­ся самим не толь­ко ее обу­чить, но и со­здать. Ибо иначе ни­ка­ких га­ран­тий от­сут­ствия в ней за­кла­док у вас нет. При­чем вы­явить та­ко­го рода за­клад­ки путем де­таль­но­го ана­ли­за графа мо­де­ли тео­ре­ти­че­ски, ко­неч­но, можно, но сто­ить это будет су­ще­ствен­но боль­ше, чем на­пи­сать ее с нуля. Увы.

Ав­тор­ство: 
Ав­тор­ская ра­бо­та / пе­ре­во­ди­ка
Ком­мен­та­рий ав­то­ра: 

Оче­ред­ное под­твер­жде­ние те­зи­са о недо­пу­сти­мо­сти пе­ре­да­чи ИИ сколько-​нибудь кри­тич­ных функ­ций без над­зо­ра со сто­ро­ны че­ло­ве­ка. ИИ - это ин­стру­мент, ка­че­ство ра­бо­ты ин­стру­мен­та опре­де­ля­ет­ся в первую оче­редь опе­ра­то­ром. По­след­ствия от­ка­за от опе­ра­то­ра - могут быть лю­бы­ми. По самым раз­ным при­чи­нам, в том числе - по при­ве­ден­ным в ма­те­ри­а­ле.

P.S. Уми­ля­ет под­ход пуб­лич­но­го из­да­ния, раз­ме­ща­ю­ще­го ма­те­ри­ал, фак­ти­че­ски сво­ди­мый к явной ре­кла­ме непо­нят­но­го ин­стру­мен­та­рия. Но это - такое...

Ком­мен­та­рий ре­дак­ции раз­де­ла Аль­тер­на­тив­ный Ин­тел­лект

Комментарии

Аватар пользователя predessor
predessor (7 лет 2 месяца)

Это де­ла­ют США.

А кто у них глав­ный?

Но­ми­наль­но - пре­зи­дент.

Бай­ден и де­ла­ет.

Аватар пользователя Mr.Wolf
Mr.Wolf (5 лет 12 месяцев)

ОК. Идите и бой­тесь Ка­ма­лу.

А мы тут как-​нибудь без ма­раз­ма­тич­ных опа­се­ний обой­дем­ся.

Аватар пользователя борис 7171
борис 7171 (8 лет 10 месяцев)

На­сколь­ко ии яв­ля­ет­ся ии? Вот в чем во­прос? 

Аватар пользователя Mr.Wolf
Mr.Wolf (5 лет 12 месяцев)

Эва. Если крат­ко - ИИ - это во­об­ще не ин­тел­лект. 

Про фор­маль­ное опре­де­ле­ние - тут.

Аватар пользователя predessor
predessor (7 лет 2 месяца)

Это сей­час ИИ не ин­тел­лект, а ней­рон­ная сеть или сбо­ри­ще та­ко­вых.

А в 1980 году речь шла имен­но об ин­тел­лек­те.

Аватар пользователя Mr.Wolf
Mr.Wolf (5 лет 12 месяцев)

Я по­смот­рел на ка­лен­дарь. У меня - вроде как 24 ок­тяб­ря 2024 года.

С какой ра­до­сти мы долж­ны пе­ре­ме­стить­ся в вир­ту­аль­ный 1980? 

Аватар пользователя predessor
predessor (7 лет 2 месяца)

С такой ра­до­сти, что по­ня­тие ИИ при­ду­ма­но не се­го­дня и не вчера.

В то время были вполне при­лич­ные под­хо­ды,  свя­зан­ные с до­ка­за­тель­ства­ми и вы­во­да­ми, ко­то­рые будет де­лать тот же пы­ле­сос.

То,  что все сей­час упер­лось в обу­че­ние НС - это те­ку­щее раз­ви­тие науки,  не от­ри­ца­ю­щее дру­гие под­хо­ды.

Аватар пользователя Mr.Wolf
Mr.Wolf (5 лет 12 месяцев)

По­ня­тие чего угод­но может быть при­ду­ма­но когда угод­но. Что это ме­ня­ет?

Се­го­дня есть офи­ци­аль­ное опре­де­ле­ние, это - се­го­дняш­няя ре­аль­ность, жить при­хо­дит­ся в ней.

Вы же там за ко­ди­фи­ка­цию то­пи­ли вроде как. Ну дык сие и есть. Ибо опре­де­ле­ние утвер­жде­но ука­зом Пре­зи­ден­та. У вас есть воз­ра­же­ния? Рады за вас. Но это ни­че­го в фор­маль­ной об­ла­сти не ме­ня­ет.

А в го­ло­вах у кого угод­но - могут быть какие угод­но идеи. 

Аватар пользователя predessor
predessor (7 лет 2 месяца)

Кста­ти, в ИППИ АН СССР ра­бо­ты с пред­ше­ствен­ни­ка­ми НС ве­лись ещё в 60-е годы.

Аватар пользователя talvolta
talvolta (2 года 4 месяца)

На­прас­ный крик души. За­клад­ки (где воз­мож­но) это обя­за­тель­но в про­дук­те со вре­мен тел­не­та.

Аватар пользователя Mr.Wolf
Mr.Wolf (5 лет 12 месяцев)

Тут ин­те­ре­сен не факт на­ли­чия за­кла­док, а ме­то­ди­ка их фор­ми­ро­ва­ния.

"Пре­ду­пре­жден - зна­чит во­ору­жен!" (с)

Аватар пользователя talvolta
talvolta (2 года 4 месяца)

А , какая там ме­то­ди­ка фор­ми­ро­ва­ния ?

Пи­шет­ся кусок кода под пивас.

Аватар пользователя Mr.Wolf
Mr.Wolf (5 лет 12 месяцев)

Пред­ла­гаю со­блю­дать сле­ду­ю­щее пра­ви­ло:

1. сна­ча­ла чи­та­ем ма­те­ри­ал

2. потом ком­мен­ти­ру­ем

В про­тив­ном слу­чае - по­лу­ча­ет­ся пу­стая трата моего вре­ме­ни.

Аватар пользователя talvolta
talvolta (2 года 4 месяца)

Так у меня не по­лу­чит­ся - вре­ме­ни в обрез )).

Аватар пользователя prometey2013
prometey2013 (9 лет 5 месяцев)

По­то­му как ИИ-​мо­дель за­го­ня­лась в нуж­ный ва­ри­ант по­ве­де­ния путем скарм­ли­ва­ния ей спе­ци­аль­но под­го­тов­лен­ных обу­ча­ю­щих по­сле­до­ва­тель­но­стей...

Крат­ко идея в сле­ду­ю­щем: по­сколь­ку сама по себе ИИ-​мо­дель - это некий набор ве­со­вых функ­ций и пра­вил по­лу­че­ния ре­зуль­та­та - ко­то­рый весь­ма велик по объ­е­му, то среди оных можно скрыть несколь­ко шту­чек, пред­на­зна­чен­ных для пе­ре­клю­че­ния мо­де­ли в нуж­ный для зло­умыш­лен­ни­ка режим ра­бо­ты при по­лу­че­нии на вход неко­то­ро­го "триг­гер­но­го со­об­ще­ния" (a la "стоп-​слова"). При­чем внешне эти самые "до­пол­ни­тель­ные" функ­ции ничем не от­ли­ча­ют­ся от всех осталь­ных таких же, пред­на­зна­чен­ных для вы­пол­не­ния мо­де­лью за­яв­лен­но­го функ­ци­о­на­ла, вот толь­ко ко­эф­фи­ци­ен­ти­ки у них под­прав­ле­ны в нуж­ную сто­ро­ну и оформ­ле­ны так, чтобы не ме­ня­лись при обу­че­нии.

Что ин­те­рес­но, а ведь эти же ме­то­ды вполне ра­бо­та­ют и с  есте­ствен­ным ин­тел­лек­том. 

Аватар пользователя Mr.Wolf
Mr.Wolf (5 лет 12 месяцев)

Ка­са­тель­но есте­ствен­но­го ин­тел­лек­та и "стоп-​слов"- тут вообще-​то нужна пред­рас­по­ло­жен­ность и ра­бо­та гип­но­ти­зе­ра. ИМХО.

Аватар пользователя eagleowl73
eagleowl73 (9 лет 5 месяцев)

В есте­ствен­ный ин­тел­лект крайне слож­но встро­ить вот такие вот схемы об­хо­да ло­ги­ки. Помни­те ро­бо­ко­па, ко­то­рый не мог за­стре­лить преступника-​босса? 

А пре­сло­ву­тые 3 за­ко­на ро­бо­то­тех­ни­ки? Это тоже по­доб­ные це­поч­ки об­хо­да. Пра­ви­ла, ко­то­рые невоз­мож­но убрать пе­ре­обу­че­ни­ем. 

Аватар пользователя prometey2013
prometey2013 (9 лет 5 месяцев)

Да ну. Самый про­стой при­мер -​нужно все де­лать по за­ко­ну, но если это боль­шое на­чаль­ство. На счёт ко­до­вой фразы -​посмотрите на сек­тан­тов. Че­ло­век нор­маль­ный -​нормальный, но стоит про­из­не­сти ко­до­вое слово -и по­нес­лось. Кста­ти, сек­тан­ты бы­ва­ют же не толь­ко ре­ли­ги­оз­ны­ми. На­слу­шав­шись про­па­ган­ды можно за­про­сто стать по­ли­ти­че­ским сек­тан­том, а там -​прощай рас­су­док. При­чем не во всем, а в том, что свя­за­но с ко­до­вой темой. Ну или иа же По­вест­ка на За­па­де.

Скрытый комментарий Повелитель Ботов (без обсуждения)
Аватар пользователя eagleowl73
eagleowl73 (9 лет 5 месяцев)

К со­жа­ле­нию, эта схема ничем не от­ли­ча­ет­ся от всех во­об­ще из­де­лий че­ло­ве­че­ства. На­ча­ло таки да, по­ло­же­но в Трое. А с тех пор под­ход толь­ко раз­ви­вал­ся. 

Помни­те, как хак­ну­ли цен­три­фу­ги в Иране? Через сред­ство раз­ра­бот­ки кода для кон­трол­ле­ров. 

Так что если вы хо­ти­те до­ве­рять из­де­лию пол­но­стью, вы долж­ны пол­но­стью сде­лать его са­мо­сто­я­тель­но либо пол­но­стью до­ве­рять тем, кто по­став­лял вам все его со­став­ные части.

Для ИТ устройств это озна­ча­ет, что всё долж­но быть своё на­чи­ная с ло­ги­ки ис­поль­зу­е­мых мик­ро­схем. За­им­ство­вать можно толь­ко си­сте­му ко­манд мик­ро­про­цес­со­ров. Все сред­ства раз­ра­бот­ки ло­ги­ки, трас­си­ров­ки, из­го­тов­ле­ния об­раз­ца, из­го­тов­ле­ния всего СВТ - всё своё. И ещё кон­троль всех эта­пов, чтобы зло­деи в твои про­цес­сы не под­ме­ша­ли своих бэк­до­ров. 

Аватар пользователя Mr.Wolf
Mr.Wolf (5 лет 12 месяцев)

Умом-​то это всё по­нят­но.

Но народ ведь как себе пред­став­ля­ет: вот есть си­сте­ма - а вот в ней "червь". 

А тут ис­сле­до­ва­те­ли явно по­ка­за­ли, что "червь" может быть ре­а­ли­зо­ван ну вааще свое­об­раз­но: не путем встав­ки каких-​то там "чер­ви­вых" ко­манд, а про­сто ука­за­ни­ем спе­ци­фич­ных ци­фе­рок, на­ря­ду с кучей неспе­ци­фич­ных. Это дей­ству­ет, в неко­то­ром смыс­ле, как хо­лод­ный душ. ИМХО. 

Аватар пользователя Анастасия Злец
Анастасия Злец (1 год 7 месяцев)

Чтобы да­вать боль­шо­му ко­ли­че­ству людей кор­рект­ное пред­став­ле­ние об ИИ, нужно пе­ре­стать на­зы­вать его Ис­кус­ствен­ным Ин­тел­лек­том. 

На­зы­вай­те тем, чем он на деле яв­ля­ет­ся - мат­ри­цей ко­эф­фи­ци­ен­тов. Тогда у каж­до­го че­ло­ве­ка за­ко­но­мер­но по­явит­ся пред­став­ле­ние о том, каким об­ра­зом и кто ней­ро­сеть обу­чал. 

На мой взгляд, про­сто до­ба­вить в курс уни­вер­си­те­та обя­за­тель­ную ла­бо­ра­тор­ную по со­зда­нию и обу­че­нию соб­ствен­ной ней­ро­се­ти. У меня было такое. Сразу сни­ма­ет все лиш­ние во­про­сы и необос­но­ван­ные на­деж­ды. 

Аватар пользователя Mr.Wolf
Mr.Wolf (5 лет 12 месяцев)

Мы на­зы­ва­ем его так, как опре­де­ле­но дей­ству­ю­щи­ми нор­ма­тив­ны­ми ак­та­ми (см. тут). Когда пре­зи­дент под­пи­шет иной указ - будет на­зы­вать иначе. А фан­та­зи­ро­вать и из­го­лять­ся каким-​то об­ра­зом - зачем?

P.S. Не все ва­ри­ан­ты ре­а­ли­за­ции ИИ - это мат­ри­ца ко­эф­фи­ци­ен­тов. Хотя в ма­те­ри­а­ле - ско­рее да.

Страницы

Лидеры обсуждений

за 4 часаза суткиза неделю

Лидеры просмотров

за неделюза месяцза год