«Пер­вый ИИ-​программист» бес­по­ле­зен, он справ­ля­ет­ся толь­ко с 15% по­став­лен­ных задач

Аватар пользователя eprst

Сер­вис Devin, за­яв­лен­ный ав­то­ра­ми в ка­че­стве «пер­во­го ИИ-​программиста», ока­зал­ся не в силах за­ме­нить ре­аль­но­го раз­ра­бот­чи­ка. Гран­ди­оз­ный раз­ре­кла­ми­ро­ван­ный про­ект ре­ша­ет лишь малую часть по­став­лен­ных перед ним задач. Про­цент успе­ха на­хо­дит­ся на уровне 15% – это крайне низ­кий по­ка­за­тель, тем более, что Devin был за­пу­щен срав­ни­тель­но давно.

Ре­аль­ный ум лучше вир­ту­аль­но­го

Сер­вис Devin, яв­ля­ю­щий­ся, по сло­вам ав­то­ров, «пер­вым ИИ-​программистом» в мире (the first AI software engineer), ока­зал­ся на­ред­кость пло­хим раз­ра­бот­чи­ком ПО. Тесты по­ка­за­ли, что он едва справ­ля­ет­ся с ра­бо­той – он ока­зал­ся спо­со­бен вы­пол­нить лишь 15% по­став­лен­ных перед ними задач, пишет The Register.

За про­ек­том Devin стоит ком­па­ния Cognition AI. Как со­об­щал CNews, пре­мье­ра Devin со­сто­я­лась в марте 2024 г., и до этого вре­ме­ни ве­лась его раз­ра­бот­ка. С марта по де­кабрь 2024 г. ве­лось его сво­е­го рода за­кры­тое бета-​тестирование, в ходе ко­то­ро­го про­ект до­ра­ба­ты­вал­ся, и в де­каб­ре 2024 г. Devin стал фак­ти­че­ски об­ще­до­ступ­ным.

Од­на­ко вос­поль­зо­вать­ся им смо­гут лишь те, кто рас­по­ла­га­ет сво­бод­ны­ми $500 (49,1 тыс. руб. по курсу ЦБ на 24 ян­ва­ря 2025 г.). Это сто­и­мость еже­ме­сяч­ной под­пис­ки на сер­вис.

Слиш­ком много обе­ща­ний

Если об­ра­тить­ся к офи­ци­аль­ной до­ку­мен­та­ции к Devin, под­го­тов­лен­ной Cognition AI, то в ней ска­за­но: «Devin – это ав­то­ном­ный инженер-​программист ИИ, ко­то­рый может пи­сать, за­пус­кать и те­сти­ро­вать код, по­мо­гая инженерам-​программистам ра­бо­тать над лич­ны­ми за­да­ча­ми или ко­манд­ны­ми про­ек­та­ми». По за­ве­ре­ни­ям раз­ра­бот­чи­ков, Devin в со­сто­я­нии са­мо­сто­я­тель­но «про­смат­ри­вать пулл рек­ве­сты (за­про­сы на вне­се­ние из­ме­не­ний – прим. CNews) под­дер­жи­вать ми­гра­цию кода, ре­а­ги­ро­вать на про­бле­мы по вы­зо­ву, со­зда­вать веб-​приложения и даже вы­пол­нять за­да­чи пер­со­наль­но­го по­мощ­ни­ка, на­при­мер, за­ка­зы­вать обед в DoorDash», уве­ря­ют ав­то­ры про­ек­та.

Сер­вис ис­поль­зу­ет кор­по­ра­тив­ный мес­сен­джер Slack в ка­че­стве ос­нов­но­го ин­тер­фей­са для вза­и­мо­дей­ствия с поль­зо­ва­те­лем, а также кон­тей­нер Docker (про­грамм­ная плат­фор­ма для раз­ра­бот­ки, до­став­ки и за­пус­ка кон­тей­нер­ных при­ло­же­ний), в ко­то­ром раз­ме­ще­ны тер­ми­нал, бра­у­зер, ре­дак­тор кода и пла­ни­ров­щик.

Devin под­дер­жи­ва­ет ин­те­гра­цию API с внеш­ни­ми сер­ви­са­ми. Это поз­во­ля­ет ему, на­при­мер, от­прав­лять со­об­ще­ния элек­трон­ной почты от имени поль­зо­ва­те­ля через сер­вис для тран­зак­ци­он­ной и мар­ке­тин­го­вой элек­трон­ной почты SendGrid.

У семи ней­ро­се­тей про­грам­мист без зна­ний

Как пишет The Register, Devin пред­став­ля­ет собой «слож­ную си­сте­му ис­кус­ствен­но­го ин­тел­лек­та» (compound AI system). В своей ра­бо­те этот сер­вис на опи­ра­ет­ся сразу на несколь­ко обу­чен­ных мо­де­лей ис­кус­ствен­но­го ин­тел­лек­та, в число ко­то­рых вхо­дит GPT-4o ком­па­нии OpenAI. Дру­ги­ми сло­ва­ми, от недо­че­тов одной кон­крет­ной ИИ-​модели он из­бав­лен и может брать луч­шее от раз­ных.

В тео­рии, Devin можно ад­ре­со­вать самые раз­ные за­да­чи, вклю­чая ми­гра­цию кода. А с уче­том того, что за ним стоят про­дви­ну­тые ней­ро­се­ти с за­слу­жен­но хо­ро­шей ре­пу­та­ци­ей, можно ожи­дать, что Devin легко спра­вит­ся с их вы­пол­не­ни­ем. Но на деле этого не про­ис­хо­дит.

Ре­аль­ные раз­ра­бот­чи­ки ПО вы­яви­ли у Devin мно­же­ство недо­че­тов. Ранее Cognition AI опуб­ли­ко­ва­ла промо-​ролик, в ко­то­ром по­ка­за­но, как ИИ-​программист ав­то­ном­но вы­пол­ня­ет про­ек­ты на плат­фор­ме фри­лан­се­ров Upwork. Раз­ра­бот­чик про­грамм­но­го обес­пе­че­ния Карл Браун (Carl Brown) про­ана­ли­зи­ро­вал этот ролик и пол­но­стью раз­вен­чал его.

Дру­гой экс­перт в про­грам­ми­ро­ва­нии и по сов­ме­сти­тель­ству YouTube-​блогер тоже рас­кри­ти­ко­вал Devin. По его сло­вам тот со­дер­жит кри­ти­че­ские про­бле­мы без­опас­но­сти.

Позже три спе­ци­а­ли­ста по об­ра­бот­ке дан­ных, свя­зан­ных с ла­бо­ра­то­ри­ей ис­сле­до­ва­ний и раз­ра­бо­ток в об­ла­сти ис­кус­ствен­но­го ин­тел­лек­та Answer.AI, про­те­сти­ро­ва­ли Devin и об­на­ру­жи­ли, что он успеш­но вы­пол­нил толь­ко 3 из 20 задач. Свои тесты они про­во­ди­ли в ян­ва­ре 2025 г., то есть спу­стя почти год с мо­мен­та офи­ци­аль­но пре­мье­ры Devin.

Те­сти­ро­ва­ни­ем за­ни­ма­лись Ха­мель Ху­сейн (Hamel Husain), Айзек Флат (Isaac Flath) и Джоно Уи­та­кер (Johno Whitaker). Со­глас­но их от­че­ту, на на­чаль­ном этапе Devin справ­лял­ся очень непло­хо – на­при­мер, он успеш­но пе­ре­нес дан­ные из базы дан­ных Notion в «Google Таб­ли­цы». ИИ-​программисту также уда­лось со­здать тре­кер пла­нет для про­вер­ки за­яв­ле­ний об ис­то­ри­че­ских по­ло­же­ни­ях Юпи­те­ра и Са­тур­на.

Од­на­ко по мере про­дол­же­ния ис­пы­та­ний трое ис­сле­до­ва­те­лей столк­ну­лись с про­бле­ма­ми.

«За­да­чи, ко­то­рые ка­за­лись про­сты­ми, часто за­ни­ма­ли дни, а не часы, и Devin за­стре­вал в тех­ни­че­ских ту­пи­ках или вы­да­вал слиш­ком слож­ные, непри­год­ные ре­ше­ния, – объ­яс­ня­ют ис­сле­до­ва­те­ли в своем от­че­те. – Еще более тре­вож­ной была тен­ден­ция Devin про­дви­гать­ся впе­ред с за­да­ча­ми, ре­шить ко­то­рые на самом деле было невоз­мож­но».

В ка­че­стве при­ме­ра они при­ве­ли слу­чай, когда Devin, когда его по­про­си­ли раз­вер­нуть несколь­ко при­ло­же­ний на плат­фор­ме раз­вер­ты­ва­ния ин­фра­струк­ту­ры Railway, не понял, что это невоз­мож­но, и по­тра­тил боль­ше дня, про­буя под­хо­ды, ко­то­рые не ра­бо­та­ли, и при­ду­мы­вая несу­ще­ству­ю­щие функ­ции.

Неуте­ши­тель­ный итог

Из 20 задач, пред­став­лен­ных Devin, вир­ту­аль­ный про­грам­мист за­вер­шил удо­вле­тво­ри­тель­но толь­ко три – две при­ве­ден­ных выше и за­да­ние по со­зда­нию бота для за­бло­ки­ро­ван­но­го в Рос­сии мес­сен­дже­ра Discord на языке про­грам­ми­ро­ва­ния Python. Три дру­гих за­да­чи дали неопре­де­лен­ные ре­зуль­та­ты, а 14 про­ек­тов ока­за­лись от­кро­вен­но про­ва­лен­ны­ми.

Ис­сле­до­ва­те­ли за­яви­ли, что Devin обес­пе­чил от­то­чен­ный поль­зо­ва­тель­ский ин­тер­фейс, ко­то­рый был впе­чат­ля­ю­щим, когда сам сер­вис ра­бо­тал кор­рект­но.

«Но в этом-​то и про­бле­ма – это про­ис­хо­ди­ло редко», – под­черк­ну­ли они.

«Боль­ше всего бес­по­ко­и­ла наша неспо­соб­ность пред­ска­зать, какие за­да­чи будут успеш­ны­ми. Даже за­да­чи, по­хо­жие на наши ран­ние по­бе­ды, тер­пе­ли неуда­чу слож­ны­ми, от­ни­ма­ю­щи­ми много вре­ме­ни спо­со­ба­ми. Ав­то­ном­ная при­ро­да, ко­то­рая ка­за­лась мно­го­обе­ща­ю­щей, стала обу­зой – Devin про­во­дил дни, пы­та­ясь найти невоз­мож­ные ре­ше­ния, вме­сто того чтобы рас­по­зна­вать фун­да­мен­таль­ные пре­пят­ствия», – поды­то­жи­ли экс­пер­ты.

Ав­тор­ство: 
Копия чужих ма­те­ри­а­лов

Комментарии

Аватар пользователя MisterBigger
MisterBigger (4 года 5 месяцев)

Уж лучше поль­зо­вать­ся ло­укод или но­укод си­сте­ма­ми, чем потом на­пиль­ни­ком все до­ра­ба­ты­вать ...

Аватар пользователя Vanov
Vanov (5 лет 2 недели)

ИИ не новый бог, а ком­пью­тер с про­грам­мой, со­здан­ной для по­лу­че­ния су­пер­при­бы­лей. ИИ до­ступ­на ариф­ме­ти­ка (ко­неч­ные мно­же­ства), но недо­ступ­на выс­шая ма­те­ма­ти­ка (бес­ко­неч­но­мер­ные мно­же­ства). Бес­ко­неч­ное при­хо­дит­ся сво­дить к ко­неч­но­му, что при­во­дит к неопре­де­лен­ным ошиб­кам. Толь­ко че­ло­век может при­ни­мать важ­ные и слож­ные ре­ше­ния, а ИИ может об­лег­чить и  уско­рить про­цесс (как любой ин­стру­мент).

Бе­те­лин:

ИИ - это ком­пью­тер с про­грам­мой, а сам тер­мин "ис­кус­ствен­ный ин­тел­лект" - это кра­си­вый эпи­тет.

ИИ со­сто­ит на 90% из мар­ке­тин­га и толь­ко на 10% из ре­аль­но­сти.

если объ­ек­ты, с ко­то­ры­ми будет ра­бо­тать ИИ, при­над­ле­жат к бес­ко­неч­но­мер­ным мно­же­ствам.  часть ин­фор­ма­ции все равно оста­ет­ся неохва­чен­ной.

сво­дят бес­ко­неч­ное к ко­неч­но­му, фак­ти­че­ски со­зда­ют эм­пи­ри­че­ские ней­рон­ные сети, ко­то­рые оши­ба­ют­ся. При­чем, когда и как, не знает никто.

От­сю­да вывод. Наш мир бес­ко­не­чен, и че­ло­век это по­ни­ма­ет, а ком­пью­тер - нет, ему никак не объ­яс­нить, что такое бес­ко­неч­ность, его "ра­зу­му" до­ступ­на толь­ко ко­неч­ность

При­мер про­сто­го во­про­са ИИ для его са­мо­уни­что­же­ния в филь­ме 1974г))):

От­ро­ки во Все­лен­ной, 1974. А и Б си­де­ли на трубе...

https://vkvideo.ru/video-​10429260_456240313?ref_domain=yastatic.net

Аватар пользователя Зима
Зима (7 лет 7 месяцев)

В филь­ме «От­ро­ки во Все­лен­ной». Два вида ИИ. Один вид ИИ (ис­пол­ни­те­ли) пе­ре­го­ра­ли на этом во­про­се. А вот вто­рой вид ИИ легко от­ве­чал на этот во­прос.

Аватар пользователя Vanov
Vanov (5 лет 2 недели)

Так и во­прос про­стой, не с бес­ко­неч­ны­ми мно­же­ства­ми

Аватар пользователя Beowulf
Beowulf (10 месяцев 1 неделя)

У нас на ра­бо­те тоже за­пре­ти­ли поль­зо­вать­ся DeepSeek

Künstliche Intelligenz von DeepSeek in Italien vorerst nicht verfügbar
https://www.zeit.de/digital/2025-01/italien-​deepseek-ki-nicht-verfuegbar

Аватар пользователя shprotas
shprotas (9 лет 3 месяца)

У нас на ра­бо­те тоже за­пре­ти­ли поль­зо­вать­ся DeepSeek

Все пра­виль­но идеи и дан­ные долж­ны уте­кать пен­до­сам (githab, chatgpt, gmail), а не ки­тай­цам. 

Аватар пользователя Medved075
Medved075 (7 лет 4 месяца)

зна­чит осталь­ные за­да­чи крмое этих 15 % про­сто уны­лое фуфло, надо на них за­бить:)

Аватар пользователя ИЮЛь Майский
ИЮЛь Майский (9 лет 3 месяца)

«Пер­вый ИИ-​про­грам­мист» бес­по­ле­зен, он справ­ля­ет­ся толь­ко с 15% по­став­лен­ных задач

Ну так можно же во­об­ще не ста­вить такие за­да­чи.

Вот в США ока­за­лось, что чёр­ные не умеют в ма­те­ма­ти­ку. Чтобы они не стра­да­ли, по­стра­да­ла сама ма­те­ма­ти­ка. ))  

Аватар пользователя Alexish
Alexish (10 лет 7 месяцев)

Вот в США ока­за­лось, что чёр­ные не умеют в ма­те­ма­ти­ку.

"Не умеют" не со­всем то же что и "не могут")

Аватар пользователя morok721
morok721 (6 лет 1 неделя)

помню что на со­зда­ние пер­во­го бота обыг­рав­ше­го чем­пи­о­на по шах­ма­там тоже ушло время, и не очень боль­шое

Аватар пользователя Piteretz
Piteretz (5 лет 2 месяца)

На­по­ми­на­ет анек­дот про япон­скую пилу и му­жи­ков. Под­су­ну­ли нере­ша­е­мые за­да­чи и вы­да­ли хайп. Чтобы они ска­за­ли на то, если бы им на ра­бо­те по­ста­ви­ли бы такие же за­да­чи, они бы типа сказали-​ это невоз­мож­но сде­лать. На что  им бы от­ве­ти­ли на выход с ма­нат­ка­ми, най­дем дру­гих. И самое смеш­ное, во мно­гих слу­ча­ях бы и нашли)).

Аватар пользователя eprst
eprst (13 лет 1 месяц)

Ин­те­рес­но дру­гое - это вы ре­ши­ли, что за­да­чи нере­ша­е­мы. 

Аватар пользователя Бендер Задунайский

Ин­те­рес­но как этой штуке за­да­чи ста­ви­ли.

по­про­си­ли раз­вер­нуть несколь­ко при­ло­же­ний на плат­фор­ме раз­вер­ты­ва­ния ин­фра­струк­ту­ры Railway, не понял, что это невоз­мож­но

Ну тут не со­всем кор­рект­но, все таки ты ра­бо­та­ешь с ро­бо­том как не крути, умной, на­чи­тан­ной но про­грам­мой. Она не знает про то что на Railway невоз­мож­но раз­вер­нуть несколь­ко при­ло­же­ний, ей дали за­да­чу - прога чест­но пы­та­лась ее ре­шить. Это тоже самое что ро­бо­ту по­ста­вить за­да­чу лож­кой гра­нит­ную глыбу рас­ко­лоть, ма­ши­на чест­но будет пы­тать­ся, а когда все пе­ре­про­бу­ет ска­жет что это невоз­мож­но.

Так что непло­хая на­вер­ное штука, но ко­то­рой нужно все объ­яс­нять. Типа джун-​аутист такой. Если пра­виль­но за­да­чу по­ста­вить - цены не будет. А так дурак-​дураком.

Аватар пользователя eprst
eprst (13 лет 1 месяц)

Ну так какой смысл ста­вить за­да­чи этому ИИ, если проще ре­шить их без него, чем объ­яс­нять ду­ра­ку оче­вид­ные вещи?

Аватар пользователя Бендер Задунайский

Не со­всем так, ему 2 раза одно и тоже по­вто­рять не надо. Про­сто со­за­дал один раз год­ный промт со всеми ин­струк­ци­я­ми. И он шпа­рит со страш­ной ско­ро­стью. 24 часа без вы­ход­ных. И всго за 46К. Это ж празд­ник, Где вы джуна на питон за 40 де­ре­вян­ных ко­са­рей най­де­те.

Аватар пользователя eprst
eprst (13 лет 1 месяц)

Что же этому ИИ, за такое дли­тель­ное время его функ­ци­о­ни­ро­ва­ния, не объ­яс­ни­ли этого? 

Сер­вис Devin, за­яв­лен­ный ав­то­ра­ми в ка­че­стве «пер­во­го ИИ-​программиста», ока­зал­ся не в силах за­ме­нить ре­аль­но­го раз­ра­бот­чи­ка.

Эти люди со­би­ра­лись за­ра­ба­ты­вать день­ги, но что-​то пошло не так.

Аватар пользователя Pablo666
Pablo666 (2 года 1 неделя)

Не учли, что 10 джуниор-​программистов не равно 1 си­ньо­ру.
А 10 бух­гал­те­ров не равны од­но­му джуну.

Как и 10  ге­не­ра­то­ров тек­ста воз­мож­но и сге­не­рят что-​то ра­бо­та­ю­щее в каком то про­цен­те слу­ча­ев, но из этим 100 кус­ков не сшить что-​то ра­бо­та­ю­щее.
Т.е. 10 хел­ло­уворл­дов не равны одной функ­ции пу­зырь­ко­вой сор­ти­ров­ки.

Аватар пользователя Бендер Задунайский

Что же этому ИИ, за такое дли­тель­ное время его функ­ци­о­ни­ро­ва­ния, не объ­яс­ни­ли этого? 

Не объ­яс­ни­ли чего?  У каж­до­го же свои за­да­чи, общие пра­ви­ли какие то на­вер­ня­ка за­да­ли. Но это как с 1Ской, "из ко­роб­ки" тебе толь­ко кон­струк­тор без ин­струк­ции, а даль­ше сам до­пи­ли­ва­ешь под себя.

Эти люди со­би­ра­лись за­ра­ба­ты­вать день­ги, но что-​то пошло не так.

Ну эт оче­вид­но, все мы чего то де­ла­ем, мутим, не из-за любви к дви­жу­хе а все таки ради де­не­жек.

Аватар пользователя eprst
eprst (13 лет 1 месяц)

Вот имен­но, что у всех свои за­да­чи и у за­каз­чи­ков нет цели обу­чать этот ИИ, им нужен ре­зуль­тат.

Аватар пользователя Бендер Задунайский

Ви­ди­мо вы про­сто не их це­ле­вая ауди­то­рия.

Аватар пользователя Hamulus
Hamulus (10 лет 9 месяцев)

не раз писал и по­вто­рюсь: те­ку­щая про­бле­ма LLM в их "са­мо­уве­рен­но­сти", то есть они очень часто дают непра­виль­ные от­ве­ты, пы­та­ют­ся ре­шить прин­ци­пи­аль­но нере­ша­е­мые за­да­чи и также редко тре­бу­ют уточ­не­ния задач

через какое-​то время воз­мож­но эту про­бле­му решат, под­клю­чив ИИ непо­сред­ствен­но к ис­пол­не­нию кода, чтобы он мог по­лу­чать об­рат­ную связь от ин­тер­пре­та­то­ра или ком­пи­ля­то­ра, от­лав­ли­вать ошиб­ки, устра­нять их и учить­ся на этих ошиб­ках

тогда будет дру­гой раз­го­вор

Аватар пользователя Pablo666
Pablo666 (2 года 1 неделя)

Уже сей­час ни­че­го не ме­ша­ет так де­лать - ко­пи­руй что по­лу­чи­лось и от­да­вай чатГПТ. Можно даже скрипт на­пи­сать.

Толь­ко по­до­зре­ваю, что эта фи­го­ви­на будет про­сто под авто-​тесты ре­зуль­та­ты под­го­нять. 

Аватар пользователя shprotas
shprotas (9 лет 3 месяца)

Мне чат гпт писал код под мои за­да­чи на язы­ках, в ко­то­рых я ни зуб ногой. 

Прав­да он бы­ва­ет упи­ра­ет­ся и по кругу одну и туже херню несет, при­хо­дит­ся са­мо­му чи­тать до­ку­мен­та­цию и да­вать ему уточ­ня­ю­щие во­про­сы: а по­че­му ты не ис­поль­зу­ешь эту функ­цию или эту пе­ре­мен­ную. И тогда у него по­лу­ча­ет­ся сде­лать за­ду­ман­ное мною. 

Есте­ствен­но, что ему за­да­чи даю на уровне "на­пи­ши мне фук­цию что бы что-​то было так и так", т.е. делю за­да­чу на этапы. 

Еще он умеет в оно­си­тель­но ред­кие вещи, на­при­мер ко­дить php для modx, знает вся­кие пла­ги­ны для того же modx, в том числе на­пи­сан­ные в ру­не­те. Т.е. им можно поль­зо­вать­ся, по­лу­ча­ет­ся быст­рее чем смот­реть син­так­сис ко­манд в спра­воч­ни­ках. 

Еще ему можно ки­дать лог файлы, дает цен­ные со­ве­ты по по­ис­ку оши­бок

Аватар пользователя Pol Alex
Pol Alex (7 лет 5 месяцев)

Так и с че­ло­ве­ка­ми также, толь­ко очень огра­ни­чен­ный про­цент может и оце­нить верно за­да­чу, и вы­пол­нить как надо и в срок. Опи­сан­ные недо­стат­ки ИИ в ре­аль­но­сти очень че­ло­веч­ны. 

Аватар пользователя Omni
Omni (12 лет 9 месяцев)

Пе­ре­не­сти ин­кап­су­ля­цию и на­сле­до­ва­ние ввиду труд­но­стей знать что и от­ку­да нужно на и-​идиота не вышло.

Аватар пользователя al.lastor
al.lastor (9 лет 1 месяц)

Ис­то­рия раз­ви­тия про­грам­ми­ро­ва­ния -- это ис­то­рия раз­ви­тия язы­ков и ком­пи­ля­то­ров. Чест­но го­во­ря, я уже даже не уве­рен какое на дан­ный мо­мент по­ко­ле­ние ис­поль­зу­ет­ся.

Так на­зы­ва­е­мый ИИ, когда его до­пи­лят, не со­здаст ни­че­го прин­ци­пи­аль­но но­во­го, а про­сто ста­нет оче­ред­ным ком­пи­ля­то­ром.

Пред­по­ло­жу, что ито­гом ста­нет либо ком­пи­ля­ция из файла до­ку­мен­та­ции, либо ком­пи­ля­ция из файла тех­ни­че­ско­го за­да­ния. Воз­мож­но с какими-​то уточ­ня­ю­щи­ми ком­мен­та­ри­я­ми, нуж­ны­ми, чтобы на­пра­вить про­грам­му по нуж­но­му пути.

Но когда мы при­бу­дем в эту точку со­вер­шен­но непо­нят­но.

Аватар пользователя Pol Alex
Pol Alex (7 лет 5 месяцев)

Ни­ко­гда не при­бу­дем. 
Про­дукт и ТЗ пи­шут­ся од­но­вре­мен­но, часто уже внед­ре­ние идет, а ТЗ ещё не под­пи­са­но, толь­ко пред­ва­ри­тель­ное ску­пое опи­са­ние. Прям ре­гу­ляр­но акт о при­ем­ке этапа под­пи­сан, счёт-​фактура и опла­та про­шли, а ТЗ нет.

Аватар пользователя gelotus
gelotus (12 лет 4 месяца)

Когда по­явил­ся язык 1с (1c77), он был силь­но упро­щен. Ста­ра­лись сде­лать все как можно проще. Идея была в том что про­грам­му будут до­пи­сы­вать и из­ме­нять сами бух­гал­те­ра... По­это­му и про­грам­ма была про­стой и язык очень про­стой.

Но ни­че­го из этого не по­лу­чи­лось. Чтобы из­ме­нять про­грам­му (даже силь­но упро­щен­ную) все равно при­гла­ша­ли про­грам­ми­ста. И уже в 1с8 от­ка­за­лись от этой идеи. Про­грам­мы стали более слож­ные, рас­счи­тан­ные на то что их из­ме­нять будет про­фес­си­о­наль­ный про­грам­мист.

тут тоже самое. Идея в том чтобы ком­пи­ля­тор брал не про­грам­му на­пи­сан­ную на языке про­грам­ми­ро­ва­ния, а брал за­да­чу, ана­ли­зи­ро­вал ее и сам писал ал­го­ритм и ком­пи­ли­ро­вал его. 

Вот толь­ко те­перь чтобы пра­виль­но на­пи­сать за­да­чу, чтоб ее понял ИИ нужно при­гла­шать опять про­грам­ми­ста. И он будет по спе­ци­аль­но­му ал­го­рит­му пра­виль­но со­став­лять за­да­чу. Этому будут учить в ин­сти­ту­тах по про­грам­ми­ро­ва­нию. Во­об­щем все тоже самое, толь­ко на более вы­со­ком уровне.

Аватар пользователя al.lastor
al.lastor (9 лет 1 месяц)

Имен­но! В точку. Кста­ти, ровно такая же ис­то­рия как с 1c была с sql, ре­зуль­тат один в один!

Аватар пользователя Pablo666
Pablo666 (2 года 1 неделя)

Пффф, не умеют в мар­ке­тинг: целых 15% - всего один, а 6 штук уже 90% оси­лят!  Ну а 10 ИИ про­грам­ми­стов во­об­ще все 147%.

 Ну и в при­да­чу про­дать ИИ-​тестера, тогда и у про­грам­ми­ста вы­рас­тет про­цент успеш­ных задач:)

Аватар пользователя Бендер Задунайский

Ша­ришь! smile9.gif

Аватар пользователя Ути-пути
Ути-пути (1 год 10 месяцев)

Как раз тесты пи­сать ней­ро­се­ти умеют непло­хо, за ними часто даже пра­вить не надо. Тут дело в том, что боль­шин­ство те­стов до­нель­зя шаб­лон­ные и тупые, с неболь­шой ва­ри­а­тив­но­стью, та­ко­му сетки хо­ро­шо учат­ся.

Аватар пользователя don_spec
don_spec (1 год 9 месяцев)

Про­сто ИИ-​программисту нужен ИИ-​менеджер(эф­фек­тив­ный), ко­то­рый будет об­щать­ся с за­каз­чи­ка­ми, обе­щать зо­ло­тые горы " вот-​вот, почти сде­ла­ли, по­тря­са­ю­щий про­дукт и т. д." 

Аватар пользователя eprst
eprst (13 лет 1 месяц)

Ну так они это сде­ла­ли, за­каз­чи­ки при­шли, но ни хрена не по­лу­чи­ли за свои день­ги.

Аватар пользователя БК 0010
БК 0010 (7 лет 8 месяцев)

Это под­став­ные за­каз­чи­ки. Вме­сто них надо было ин­ду­сам про­ве­рять, ко­то­рые для Бо­е­инг ра­бо­та­ют.

Скрытый комментарий Повелитель Ботов (без обсуждения)
Аватар пользователя Сударь
Сударь (9 лет 3 недели)

Ле­бе­ди­ная песня по­гро­ми­стов...

Аватар пользователя jamaze
jamaze (13 лет 4 месяца)

Я для себя такой вывод и сде­лал: для ин­же­нер­ных задач ней­ро­се­ти прин­ци­пи­аль­но не под­хо­дят, по край­ней мере пока.

В хо­ро­ших спе­ци­а­ли­зи­ро­ван­ных ней­ро­се­тях точ­ность по­ряд­ка 95%. В общих LLM - 85%. Т.е. это, грубо го­во­ря, на­деж­ность, с ко­то­рой будет ра­бо­тать та часть устрой­ства/про­грам­мы, ко­то­рую спро­ек­ти­ри­ру­ет ней­ро­сеть. Но даже для про­дук­та в целом это непри­ем­ле­мо - 5% и уж тем более 15% от­ка­зов. А если про­дукт слож­ный и со­сто­ит из десятков-​сотен ком­по­нент? Он же во­об­ще не будет ра­бо­тать с таким под­хо­дом.

ИИ дол­жен иметь на­деж­ность (точ­ность) 99,99% Хотя бы. Чтобы ре­аль­но на него можно было сгру­жать за­да­чи по раз­ра­бот­ке ком­по­нент. Для каких-​нибудь про­стых и некри­тич­ных ре­ше­ний. А это недо­сти­жи­мо с по­мо­щью ны­неш­них ар­хи­тек­тур ней­ро­се­тей.

Аватар пользователя BlopAngin7
BlopAngin7 (10 лет 2 месяца)

Если не знать про­грам­ми­ро­ва­ние, то и "ИИ" не по­мо­жет про­грам­му на­пи­сать

Аватар пользователя buzuk
buzuk (7 лет 1 месяц)

Самое слож­ное - по­ста­нов­ка за­да­чи. А когда че­ло­ве­ку в точ­но­сти по­нят­но, что надо де­лать, так он и сам быст­рень­ко и с удо­воль­стви­ем сде­ла­ет. Так что надо де­лать не ИИ-​программиста, а ИИ-​помощника, типа под­сказ­ки в IDEA.

Ти­пич­ный тикет в джире обыч­но со­сто­ит из одной фразы, где под­ра­зу­ме­ва­ет­ся ги­гант­ский кон­текст. Тут человек-​то не сразу раз­бе­рет­ся.