Появилась заметка от Сбера про их медицинский ИИ. Мол, все взрослые поликлиники Москвы, уже поставлены диагнозы десяткам миллионов пациентов, «95 наиболее часто встречающихся и значимых диагнозов», "3 наиболее вероятных диагноза из 256 наиболее частых", и прочие успехи на сберовских бюджетах. Но поскольку, в отличие от чат-гопоты, про медИИ особо не пишут, кроме разработчиков Сбера о самих себе, попробую восполнить тему.
Начнём с того, что медицина при капитализме весьма нажористый бизнес, одна только фарма (глобальный рынок около 2 триллионов долларов) обходит торговлю оружием (в пределах триллиона). Поэтому западный ИТ-крупняк не мог пройти мимо медицинских приложений. В тот или иной момент о разработке медИИ заявляли IBM, Микрософт, Амазон, и Гугл.
Но, в отличие от Сбера, крупняк об успехах не отчитывался. Хотя первые медицинские интеллектуальные системы известны с начала 70-ых годов прошлого века, а разрабатывались, соответственно, с конца 60-ых (MYCIN, Internist). Более того, IBM вместо победных реляций несколько лет назад списал в многомиллиардные долларовые убытки свой общедиагностический медИИ, оставшись только в сегменте медицинских изображений (по ссылке один из некрологов https://qz.com/2129025/where-did-ibm-go-wrong-with-watson-health).
Постановка задачи
При этом ответ на вопрос, зачем врачам медИИ, ну или в капиталистических терминах — за что клиент должен платить — особо не сформулирован. Впрочем, это не специфика медИИ, ту же чат-гопоту похоже, разрабатывали ради того, чтобы пройти тест Тьюринга. А то, что получили бредогенератор (оценка Игоря Ашманова), так соответствие информации на выходе реалу не прописано в техническом задании не только у ИИ, но и у барышень, когда они "включают блондинку". Но то, что и "блондинки", и чат-гопота проходят тест Тьюринга, не отменяет вопрос — ну а платить-то клиенту за что? Если с "блондинками" понятно — с ними веселей, то бредогенератор в медицине - это весело?
Поэтому сначала сформулируем, в чем может быть выигрыш медиков от использования ИИ, а потом посмотрим, насколько известные системы, в том числе Сбер медИИ, способны это обеспечить.
Ограниченность мозга против арифмометров можно описать в терминах DIF-анализа (Difficulty – Importance – Frequency, Сложность - Важность — Частота). Попросту, человек хорошо работает с тем, с чем встречается часто, и провисает с тем, что для него редко. На эту тему народная медицинская мудрость гласит, что аппендицит надо вырезать в районной больничке, там на этом рука набита, а не в центре кардиохирургии. Про то же русское народное "сделаешь раз сто - будет просто", и западная буржуйская "learing curve" ("кривая обучения") - снижение затрат в среднем на 13% при удвоении производства 1-2-4-8-16-32...
Соответственно участковые тётки в полубессознательном состоянии после 50+ пациентов за смену
на автопилоте диагностируют массовые ОРВИ/острый бронхит/ХОБЛ/пневмонию - но могут пропустить жизнеугрожающую деструктивную пневмонию, с которой встретятся пару раз за жизнь. И тем более им сложно сходу заподозрить муковисцидоз (если не было скрининга в роддоме), у которого частота примерно один пациент на 10 педиатрических участков, т. е. один случай на несколько поликлиник, а до взрослого состояния с такой болезнью доживает ещё меньше.
То есть, исходя из DIF-анализа, общедиагностические арифмометры для первичного звена здравоохранения надо накачивать тем, что важно (жизнеугрожающие/инвалидизирующие патологии), но редко. Благо, память у железяк хорошая, может вместить 11+ тысяч диагнозов МКБ-10/11, и 50+ пациентов за смену им мозги не вскипятят.
В идеале фельдшер Вася у подножия Хамардабана, потыкав омозолелым от колки дров и вскопки огорода пальцем в экран планшета, должен немедленно прям тут и сейчас ставить диагнозы любой редкости, сложности и важности на уровне топовых экспертов страны по всем разделам медицины. В пределах имеющихся у него методов диагностики - потому что даже в столичных навороченных медцентрах результаты анализов и инструментального обследования в большинстве случаев известны после, а не до первичного приёма врача. Поэтому для медИИ работа с неполной информацией это штатный режим.
Ограничение систем на частотности
А теперь смотрим, по какой колее покатилась фактическая разработка медИИ.
- В упомянутой в первом абзаце заметке от команды СберИИ фигурируют десятки миллионов пациентов, т. е. речь идёт о «больших данных» из взрослых поликлиник Москвы. Но из этих миллионов пациентов вытащили две с половиной сотни «наиболее часто встречающихся и значимых диагнозов», с которыми имеют дело участковые врачи - из 11+ тысяч диагнозов МКБ-10/11. Вместо требуемых по DIF-анализу редких важных патологий. Ну и? За что платить? За то, что участковые тётки без арифмометров с зашкваренным за смену мозгом на автопилоте диагностируют?
- У китайцев ситуация сходная, несколько лет назад была публикация, что обучили железяку пятидесяти наиболее частым диагнозам на всю педиатрию.
- В патенте IBM подбор похожих фрагментов в базе историй болезни на основании частотности, т.е. всё те же «большие данные», из которых вместо редкого и важного вытаскивали наиболее частое.
- Отечественный MEDAI это интернет-вариация системы Нейлора 80-ых годов на частотности.
- Самый первый былинный MYCIN конца 60-ых? Частотность плюс экспертные правила. Причём ещё тогда выяснили, что медицинские эксперты ни частотности не говорят, ни правила не формализуют. Но доблестные ИТ-шники креативно преодолели трудности, обусловленные косностью и жадностью медиков, которые не желали делиться знаниями, и придумали «нечёткую логику» с некими суррогатными «коэффициентами убеждённости» вместо частоты симптоматики. Тогда и родилось знаменитое британское «хайли лайкли».
Т.е. разработка медИИ с самого начала шла на основе столь любимой бриташками со времён вест-индских галеонов байесовщины, когда страховщики оценивали вероятность рисков по цепочке «пожар в порту отбытия — гибель в шторм — захват пиратами — пожар в порту прибытия». Причём риски можно рассчитать ретроспективно, и они не совмещены — утонувшему не суждено ни сгореть, ни быть повешенным. Утрированный пример — любит не любит 50 на 50, плюнет поцелует 50 на 50, даст не даст 50 на 50, итого с вероятностью 87,5% гандон на первое свидание брать не надо.
А дальше всплывают ограничения частотности. Например, статистику собирали на популяции малолеток раннего пубертатного возраста, а рекомендации выданы поручику Ржевскому при визите к мадам «Да, ужас. Но ведь не ужас-ужас-ужас!!!».
Или вылезшее ещё при разработке MYCINа отсутствие статистики — например, какая частота пневмоний у ДЧБД (длительно и часто болеющие дети) из семей с низкими доходами, посещающих дошкольные учреждения за Полярным кругом? Или при болезнях органов дыхания наиболее частая причина повышения температуры это ОРВИ - хотя у конкретного пациента перед врачом аспирационная пневмония.
Да и вообще, откуда статистика по редкой патологии, если она редкая? Вон, в "большой фарме" при клинических испытаниях лекарств от редкой патологии пациентов годами по всему глобусу набирают.
А ведь ещё есть сочетанная патология. Даже без экстрима в виде политравмы берём банальную хронь у населения среднего/старшего возраста из артериальной гипертензии, стенокардии, аритмии, ХОБЛ (хронический бронхит с астматическим компонентом), гастрита, сахарного диабета, мочекаменной и желчекаменной болезни, заболеваний суставов.
КОЭФФИЦИЕНТЫ СМЕРТНОСТИ НАСЕЛЕНИЯ, на 100 000 населения в 2016 г. |
Возраст, 40-44 года |
Возраст, 60-64 года |
Изменение, %% |
|
Общая смертность | 548,0 | 1 905,9 | 348% |
Новообразования | 58,1 | 490,0 | 843% |
Эндокринные заболевания и нарушение обмена веществ | 3,3 | 39,1 | 1185% |
Заболевания нервной системы | 10,7 | 45,6 | 426% |
Болезни органов кровообращения | 137,6 | 862,5 | 627% |
Ишемическая болезнь сердца, инфаркты миокарда | 46,9 | 485,9 | 1036% |
Болезни органов дыхания | 26,7 | 82,8 | 310% |
Болезни органов пищеварения | 63,3 | 129,5 | 205% |
Заболевания мочеполовой системы | 3,5 | 19,2 | 549% |
На это накладываются острые состояния и обострения/осложнения. То же ОРВИ на фоне ХОБЛ может спровоцировать пневмонию, и далее гипоксия потянет утяжеление стенокардии вплоть до инфаркта и/или тяжёлых аритмий, с прилагающейся острой сердечной недостаточностью, и отёком легкого. С чем пациента загрузят в реанимацию, там в подключичку поставят пластиковый катетер, на него сядет полирезистентный стафилококк (ну, живёт он там, нравится ему пластик, стандартный термин «полимер-ассоциированные инфекции»), который далее поплывёт по кровотоку, образуя вторичные очаги гнойной деструкции то ли в легких, то ли в почках. В общем, поверх хрони накладывается всё что угодно, от онкологии и сифилиса до перитонита, менингита и туберкулёза с эхинококкозом — причём везде будет повышение температуры, как при ОРВИ.
А теперь считаем по минимуму. Допустим, "букет" из 3-х патологий, и вопреки DIF-анализу работаем как Сбер медИИ только с наиболее частыми 256 амбулаторными диагнозами, забыв про МКБ-10/11 с 11+ тысячами. Открываем комбинаторику, число сочетаний, без повторов и порядок не имеет значения, формула С=n!/((n-k)!*k!), С=256!/((256-3)!*3!), итого надо знать вероятности/частоту для 2763520 комбинаций (ещё раз, медленно, прописью - больше двух миллионов вариантов). Если не 3, а 5 из 256, то 7+ миллиардов комбинаций. 5 из 1000 — 8+ триллионов. А если 7 из 11+ тысяч? Название для таких чисел есть, не говоря про вычислительные мощности? Причём эти цифры позволяют только оценить количество комбинаций, для которых надо рассчитать вероятности - про собственно постановку диагнозов и речи не идёт. Однако, «факториальный вычислительный взрыв».
Что объясняет, почему ещё при разработке MYCINа вылезло, что у медиков нет ни вероятностей, ни правил. И почему Сбер медИИ рапортует об успехах «3 наиболее вероятных диагноза из 256", а не о сочетанной патологии из 3-х диагнозов из МКБ-10/11. Байесовщина и частотность попросту не тот математический аппарат, который обрабатывает комбинации.
Ещё одна характеристика медицины (впрочем, и других предметных областей) связана с дифференциальной диагностикой. Например, обучаем медИИ диагностике пневмонии. Но пневмония похожа на острый бронхит, на обострение хронического, на застойные явления в лёгких при сердечной недостаточности и на отеки лёгких разной природы на фоне любой лихорадки, на ателектазы и туберкулёз, на онкологию и тромбоэмболию лёгочной артерии. Внутри собственно пневмоний бывают вирусные, от сцинтиовируса до ковидлы, грибковые, бактериальные, паразитарные. Бактериальные пневмонии с деструкцией и без неё, деструкция стафилококковая и клебсиеллёзная, внутри стафилокковых деструкций есть вызванные золотистым стафилококком, и есть — эпидермальным. Такая детализация не абстрактна, потому что всё требует разного лечения, что-то амбулаторного, что-то в реанимации, одни антибиотики против клебсиеллы, другие против золотистого стафилококка, третьи против стафилококка эпидермального. Т.е. одна только пульмонология с дифференциальной диагностикой тянет за собой свыше полсотни диагнозов, которые должен фильтровать медИИ. Сколько там у Сбера? 3 наиболее вероятных диагноза из 256 наиболее частых? На всю медицину, от неотложных состояний до дерматовенерологии (многие патологии, от коллагенозов и менингита до чумы, имеют кожную симптоматику). С дифференциальной диагностикой редких-важных, да?
А как оно там, промеж ушей?
А как же ставят диагнозы участковые тётки? У одного пациента может быть несколько основных диагнозов, для каждого осложнения, плюс сопутствующие диагнозы. Ещё для диагнозов есть клинические формы, стадии, активность процессов, типы течения. Под диагнозами подложка из симптомов и синдромов с их локализацией, интенсивностью, длительностью и динамикой, анамнез и факторы риска… Врачи что, на массовом приёме для всего этого вероятности высчитывают?
Это же элементарно, Ватсон! Смотрим на картинку, и без всякого знания частотностей и вычисления вероятностей понимаем, что вот это собачка, это котик, а вот то мерин и фурункулёз шеи, потому что «златая цепь на дубе том».
То же самое и участковые тётки, смотрят на то, что перед ними, и без частотностей и вероятностей понимают — вот то сопли, вот это бронхит, а тут фурункулёз шеи, потому что цепком натёрло.
Оказывается, кроме вероятностей есть и другой математический аппарат, который называется "линейный классификатор/сепаратор". Если на пальцах, без абстрактных математических функций и не влезая в развесовку коэффициентов, то это табличка с признаками, которые описывают объекты.
Зрачок |
Покров |
Когти |
|
Кошечка | вертикальный | шерсть | втягиваются |
Собачка | круглый | шерсть | не втягиваются |
Рыбка | круглый | чешуя | не применимо |
Насекомое |
неприменимо, фасетчатый глаз |
хитин | не применимо |
-
Во-первых, такая математика работает со множеством объектов, оно же с сочетанной патологией.
-
Во-вторых, для неё нужна не частотность из «больших данных», а уникальные признаки, пусть даже в единственном экземпляре (для того, чтобы научиться не совать пальцы в розетку, достаточно разового непередаваемого ощущения). Ну или уникальное сочетание не уникальных признаков - как круглый зрачок и шёрстка у собачки.
-
В-третьих, при наличии уникальных признаков можно работать с неполной информацией (что актуально для первичного медицинского приёма) — если определили вертикальный зрачок, то можно без шкурки и когтей. А отсутствие когтей позволяет исключить кошечку с собачкой, и далее прицельно дообследовать - то ли посмотреть в глазки, то ли погладить спинку/почесать животик, и поставить окончательный диагноз, кто из них пиранья, а кто скорпион. В медицине это называется «патогномоничные симптомы/синдромы».
- В-четвёртых, «В начале было слово», систему можно обучать как студентов на знании, кристаллизованном в символьно-абстрактном виде - вместо показа эксабайтов и зетабайтов сырых данных в виде картинок с котиками, собачками и фурункулами.
-
В-пятых, сочетание пунктов 2 и 4 позволяет реализовать такие системы на минимальном железе в кратчайшие сроки за счёт тех самых экспертных знаний, которых так жаждет фельдшер Вася у подножия Хамардабана.
"Это факап, бро", или то, что надо?
Исходя из пункта 5, системы на линейном классификаторе можно делать практически в режиме хобби - из своего кармана и во время, свободное от добывания хлеба насущного. По ссылке пример системы, в которой набита пульмонология от острого бронхита до патологии грудного лимфатического протока с обработкой сочетанной патологии, с дифференциальной диагностикой при неполной информации, с наложением троичных логик "Есть/Отсутствует/ХЗ" и "Плохо/Хорошо/ХЗ".
И тут возникает когнитивный диссонас. А чо, те ребята, которые на сберовском бюджете за несколько лет вытащили "3 наиболее вероятных из 256 наиболее частых" из миллионов московских историй болезней не знают о существовании линейного классификатора? Вообще-то о нём отечественным студентам отечественные преподаватели лекции читают. А то, что перед разработкой надо оценить предметную область, вдруг там вычислительный взрыв, неполная информация и дифференциальная диагностика - это секретное знание для тайных посвящённых высших степеней? Ну, в 80-ых годах прошлого века на первой же лекции по базам данных слушателям объясняли, что проектирование системы начинается с моделирования предметной области.
Поскольку у Сбера мощная кадровая служба с опытом рекрутинга 10 тысяч программистов, то вряд ли компетенции оценивали йуные эйчарочки после психфаков и пединститутов на основании "уверенности соискателя в себе". Поэтому логично предположить, что слова про линейный классификатор, вычислительный взрыв и неполную информацию разработчики Сбер медИИ слышали.
Так что вляпывание в частотности и вероятности может быть результатом банального следования модным трендам "все бегут":
Да и карго-культ никто не отменял, у Грефа то "тупицца тим" с аджайлом и скрумингом на 10 тысяч сберовских программистов, то Даня Милохин лицо современной российской молодежи прям как у всего прогрессивного человечества.
В общем, не занимаясь гаданиями кто что почём, итоги разработки медИИ пока можно подвести следующим образом. Первый раз Путин лично публично заслушал о разработке медИИ на заседании Совета по Нацпроектам весной 2015 года. А осенью 2023 года система на бюджете Сбера выдаёт "3 наиболее вероятных из 256 наиболее частых" - при 11+ тысячах диагнозов в МКБ-10/11, без сочетанной патологии, и без дифференциальной диагностики, покрывающей "важно-редко". За это же время пара человек в режиме хобби сделали систему, которая работает с сочетанной патологией при неполной информации с дифференциальной диагностикой, и которую можно наращивать в среднем темпе "один раздел медицины за 2 недели на одного к.м.н".
Управление инновациями, когда через 8 с половиной лет под приглядом Государя у одних бапки без годного продукта, а у других работающий продукт без бапок для масштабирования, можно охарактеризовать по модному, по заграничному: "Это факап, бро". Ну, просто чтобы оставаться в нормативной области великого и могучего.
Правда, это если оценивать от подножия Хамардабана вместо "пиар/навар" для "своих да наших"тм. А если наоборот, без фельдшера Васи и его пациентов, то с инновациями всё хорошо - и с бюджетом придворных не обижают, и картинка "миллионы пациентов" красивая. Однако, свобода выбора логик для принятия решений.
"Пойди туда, не знаю куда, принеси то, не знаю что"
Можно предложить и третий вариант оценки управления инновациями на примере медИИ. Для этого приведём одну из классификаций инноваций:
В качестве иллюстрации - был в истории России Государь Иосиф Грозный, который как-то собрал товарищей учёных, и сказал им: "Хочу бомбу, как те, которые американцы сбросили на Хиросиму и Нагасаки. И ещё хочу беспилотные самолёты, как те, которыми немцы Лондон бомбили. А как вы это сделаете, вы расскажете товарищу Берии, он вас внимательно выслушает". На картинке это соответствует полю с номером 3 - известно, что нужно на выходе, но непонятно, как это сделать.
Для того, чтобы выполнить хотелки Государя, из лагерей вытащили Сергея Павловича Королёва. Который в молодости начитался Цандера с Циолковским, на планерах парил аки птица, и в ГИРДе что-то зачем-то запускал, то ли на Марс хотел, то ли просто враг народа, и потому шарахнул ракетой по блиндажу с проверочной комиссией. В общем, Сергей Павлович до призыва в ракетно-ядерный проект шарился в зоне номер 2, где всякие Кулибины и Левши нечто делают, а какая с этого общественная польза, непонятно.
А ещё для выполнения хотелок Государя из поля с номером 4 вытащили отмороженных на всю башку ботанов. Которые удовлетворяли за чужой счёт собственное любопытство "ой, а чойтотам такое черненькое белеется?", и в столовке рисовали на салфетках формулы про строение ядра, которого даже в микроскоп не видно, не то что пощупать.
И под чутким взглядом Лаврентия Палыча вольнопарящие аки птицы из зоны 2 и интеллектуальные беспредельщики-ботаны из сектора 4 сделали атомную бомбу и запустили человека в космос. И теперь Россия по завету хруща кукурузного лепит ракеты как сосиски, чтобы всем хватило, и никто из радетелей за свободу и демократию не ушёл не обиженным Империей Зла (сектор 1, связка прикладные НИОКР/производство, федеральные проекты по микроэлектронике, станкостроению, Уралвагонзавод, Коломна, Комсомольск-на-Амуре и прочие места трудовой славы на необъятных просторах нашей бескрайней Родины).
А теперь позиционируем разработку медИИ в такой классификации инноваций.
Сказать, что не известны методы построения ИИ некорректно. Теорема Байеса это 1763 год, а Ллойд отметился на страховании британского пиратства и работорговли ещё раньше, с 1693 года. Тот же медИИ от Нейлора это 80-ые годы прошлого века - и в рамках загруженной в него частотности оно работало.
Линейный классификатор это одно из приложений линейной алгебры, на которой ещё в 19 веке в Российской Империи межотраслевые балансы начали разрабатывать, и на методах оптимизации во Вторую Мировую рассчитывали бомбовую нагрузку авиации. Так что поле 4 отпадает по причине понимания того, как можно сделать.
Скорее, речь идёт о непонимании того, что надо от разработки, т.е. медИИ находится в поле 2. В котором методом тыка прикручивают к предметной области то, кто что умеет. Бриташки умеют в частотность с байесовщиной - в MYCINе и системе Нейлора её и прикрутили. Те, кто умеет в линейный классификатор - приспособили его к распознаванию изображений, в том числе медицинских. IBM научился по частотности предсказывать следующие слова - стали подбирать похожие куски в массиве историй болезни. Герман Греф почётный каргокультист России - получили копипасту западоидных систем на частотности в виде Сбер медИИ. Кто-то с опытом в медицине опухел от частотности: "А чо, участковые тётки вероятности высчитывают? Да не, бред какой-то!" - и прикрутил линейный классификатор к медицинским экспертным знаниям, представленным в абстрактно-символьном виде. Т.е. в наличии типичный для поля 2 рабочий хаос "пойди туда - не знаю куда, принеси то, не знаю что".
Управленческие методы работы с неопределённостью в полях 2 и 4 известны. Российские Государи посылали небольшие казачьи команды в направлении восходящего солнца за Урал "под российским небесным флагом нас вывозит Авось!". Иосиф Грозный содержал шараги, в которых небольшие группы параллельно работали над сходными проектами. Нынешние транснацики финансируют рой небольших университетских лабораторий. Западоидные инвесторы вкладываются в рой небольших стартапов. Т.е. во всех случаях речь идёт о множестве относительно дешёвых независимых групп, для каждой из которых успех не гарантирован, но расчёт на то, что кто-то из роя сделает прорыв. И только потом можно со всей госдуревой/транснациковой дури ломиться в уже открытую дверь (поля 3 и 1) .
Т.е. c управленческой точки зрения ошибка IBM и отечественного государства в лице Сбер ИТ не в том, что они вляпались в частотность - пока не сделаешь, не узнаешь, что заработает, а что нет, это не прикладные НИОКР из сектора 1. А в том, что для работы с неопределённостью вместо роя из мелочи были вброшены массивные ресурсы в единственный вариант, как будто уже имелись гарантии успеха, как у Сталина, который знал об успешной реализации ФАУ и атомной бомбы. Есть и вторая ошибка, уже только Сбера - там, где IBM честно сказал "ну не шмогла я, не шмогла", и списал миллиарды зеленью в убытки, Сбер рисует радужную картинку "3 наиболее вероятных из 256 наиболее частых" с миллионами пациентов.
А при чём тут Рикардо и демография?
Можно взглянуть на ИИ в целом, и медИИ в частности с точки зрения общего развития человечества. Ешё до Маркса был такой Рикардо, который писал об аккумуляции предыдущего труда в орудиях производства. Один объем труда аккумулирован в топоре, другой в бензопиле, третий в лесоповальном комбайне.
Причём чем дальше, тем больше аккумулируется интеллектуальный труд. Знания для производства топоров передаются внутри кузни, а знания для массового производства бензопил уже имеют под собой пирамиды из подготовки спецов от геологоразведки до сопромата и логистики - Сфера знаний и технологий имеет степенные функции по поверхности и объему:
Что напрямую отражается на демографии. Там, где раньше профессионально коровку доили и сено скирдовали в 15 годков, и, соответственно, выходили на уровень экономической самодостаточности, теперь на уровень среднего профессионализма выходят к 25 - 30 годам.
Механизмы аккумуляции интеллектуального труда в обществе, будь то книгопечатание или образование от детсадов до формирования научно-инженерно-технологических школ позволяет человечеству наращивать доступную для него Сферу. При таком взгляде ИИ это логичное развитие систем аккумуляции и распространения предыдущего интеллектуального труда. Которое позволяет меньшим количеством народа работать с нарастающими специализированными знаниями, передавая их от единичных экспертов штучной выделки широкому слою пользователей, в том числе фельдшеру Васе у подножия Хамардабана.
Так что развитие ИИ относится к стратегическим направлениям для успеха страны вдолгую.
А как это делать, пусть думают государевы люди, они деньги за это получают. Может, надо дополнительно 100 миллиардов Сберу выделить на развитие ИИ? Может, пусть ВТБ, Сбер и Мэрия Москвы организуют хакатон на базе Сколково для разработчиков медИИ с общим призовым фондом в один миллион рублей для пяти лучших команд? Может, ещё какие идеи есть, или появятся в будущем?
Комментарии
Фельдшеру Васе доступны те же физикальные методы обследования (послушать, постучать, помять) плюс поговорить о жалобах и анамнезе, что и столичному эксперту. Плюс у фельдшера Васи есть нечто вроде переносного кардиографа "Малыш". Так что с большинством патологий он разберётся с помощью арифмометра, а с чем не разберётся, так и столичный эксперт на анализы и инструментальную диагностику посылает.
Перспективный чат детектед! Сим повелеваю - внести запись в реестр самых обсуждаемых за последние 4 часа.
все болезни от нервов)
Кроме тех, которые от удовольствия - но удовольствие оно тоже нервы.
судя по тому, что пишет ТС про медИИ Сбера, у них просто обученная база маловата;
её надо на несколько порядков увеличить, тогда и вменяемые результаты появятся
(кстати, Хамардабан правильно пишется Хамар-Дабан)
Что увеличение базы сделает с факториальным вычислительным взрывом и пробелами в симптоматике на первичном приёме? И сколько лет и с какой географией надо набирать частотность по редкой-важной патологии - чтобы потом всё равно вляпаться в факториальный взрыв и пробелы в симптоматике на первичном приёме?
а это не важно
сравнение GPT-1 и GPT-4 ясно это показывает
вычислительный взрыв в данном контексте - ни о чём
судя по показанному уровню прекогнистики, эти чудики из сбера даже до gpt-1 ещё не добрались
А ИБМ, Микрософт, Амазон и Гугл добрались до запуска медИИ в контексте без вычислительного взрыва на сочетанной патологии?
Не, меня терзают смутные сомненья, что в итоге за счёт дробления выборок до такой степени, что исчезает частотность в пользу уникальности, они наконец добрались до того, что делает линейный классификатор, который можно реализовать на счётах с костяшками.
"Однако есть нюанс".
да кто ж их знает, я не в теме работ ИБМ, Микрософт, Амазон и Гугла в плане медИИ
Я в тексте указывал - ИБМ свой общедиагностический уже списал в мусорку.
Про Микрософт последний раз слышал несколько лет назад, они тогда тестировали на соответствие диагностики от железяки официальным руководствам - и с тех пор пропали из публичного поля.
Амазон и Гугл заявили, что "все бегут" - и молчок.
возможно
никогда не доводилось сравнивать "ИИ" на базе экспертных систем, созданных с привлечением высококлассных специалистов, с нейросетями, натренированными на куче разнородных данных
хотя моё личное мнение - нейросети перспективнее;
это как сравнение аналоговых компьютеров и цифровых - аналоговый действует быстрее и точнее, зато цифровой более универсален
Да уже про чат-гопоту прошло, что "синтетические данные". Как бы не всё та же экспертная чистка вручную, чтобы избавиться от бредогенерации.
Что в одном случае экспертам башлять, что в другом - "однако есть нюанс".
возможно
"бредогенерация" - это точно про чатжпт
хотя, судя по тому, что некоторую информацию начали скрывать и перестали публиковать материалы о дальнейшем развитии, и даже стали выступать с требованиями запретить "искусственный интеллект" - некоторых персонажей эта тема заинтересовала, будут в неё бабло вливать не по-детски
"Бредогенерация" - это Ашманов. Проблема в том, что говорящего попугая обучал на интернет-помойке пьяный боцман.
И оно даже весело - пока не выходить с этим в профессиональную область, где могут судебный иск влепить. И тут появились "синтетические данные", подозреваю, что экспертные, а ИБМ несколько лет назад от греха подальше срыл в тину, наплевав на клочки с ободранной шкуры.
и всё-таки это некорректно, сравнивать экспертную систему с нейросетью (и тем более называть их ИИ)
упомянутый "редактор по переводу неструктурированного вербального экспертного знания в формат вычислительного ядра" - экспертная система, созданная квалифицированными специалистами
структура типа ЧатГпт - конструкция, которую могут создать блондинки за клавиатурой, которым поручили выискивать в интернете примерно соответствующую тематике информацию и скармливать её системе
самое смешное - оба этих механизма рабочие, просто в первом случае требуются специалисты, а во втором - много времени и места в памяти компа
По большому счёту частотность и линейный классификатор друг друга не исключают, а дополняют.
Те же медицинские эксперты берут свои знания из клинических исследований со статистической обработкой. Мы в своё время обсчитывали одну московскую больничку на предмет клинической микробиологии и антибиотикотерапии, так это была моя мечта, чтобы на сырые данные натравить арифмометр, который сам будет корреляции вытаскивать.
Тут речь о том, что заменять выверенные экспертные знания на бредогенератор весело до тех пор, пока с этим не выходишь в профессиональную область с юридической ответственностью. Тогда, сначала вбухав "много времени и места в памяти компа ", потом всё равно вводят экспертную верификацию.
Пардон за очередное повторение, "Однако есть нюанс" - ценой в годы и миллиарды.
А важность того или иного симптома как нейросетке указать? Если такое возможно, тогда да - обучаемая специалистом на некоей выборке сетка может оказаться универсальнее. А если приоритетность не указать... ИМХО, пальцем в небо получится.
Причём засада вот в чём. Если ЭС выдаёт след своего логического вывода, то насчёт нейронки я не уверен.
Ну, развесовку коэффициентов линейный классификатор при обучении сам прокручивает.
"Экспертность" заключается в том, чтобы подготовить корректные эталоны болячек, и изложить их редакторе, который переведёт их в формат вычислительного ядра.
Собственно, справочник симптомов и справочники диагнозов - набиваются на вполне человеческом языке. Насколько это возможно в случае медиков - глядя на их почерк, начинаешь сомневаться ;)
В очень большой степени такая литература бесполезна для системы на линейном классификаторе по причине того, что в ней не прописаны уникальные дифференцирующие признаки, как вертикальный зрачок у кошечки. Та же дерматология для врача общей практики "всё красное всё чешется", и прочее "цианоз-понос-одышка, пульса нет - больному крышка".
Так что надо платить бапки экспертам, чат-гопота не поможет.
"Хамардабан" так оно загадошнее и экзотишнее выглядит, мне тоже так больше нравится.
:)
Никогда за все время работы гос в медицине я не видел корректно работающий медицинский софт. И за это никому ничего не было. У нас область на месяц встала из-за рухнувшей при обновлении миц, физические карточки уничтожены, электронную заполнить нельзя. Кого наказали? Больницы которые не могли принимать пациентов.
Я никогда не поверю что в гос секторе возможно создание хоть сколько-нибудь рабочих программных решений. Если бы я так работал в мед солужбе как они программируют, я бы уже сидел.
А кто их там знает, про что конкретное цифровое решение? То ли "пиар-навар/свои да наши", то ли про пациентов?
Это вы зря, посмотрите внимательно на работу личных кабинетов ФНС
Смотрю решили написать о наболевшем? И снова: "а почему денег не дают на поисковый НИР?". :)))
Да потому. :)))
И я смотрю вы пришли к идеям описания задачи языком линейной алгебры и нелинейного программирования? Прогресс однако. :)))
Не в инструментах, а в материальной культуре вообще. Не не аккумулируется, а "отражается". Более точно будет: "результаты интеллектуального труда материализуются в материальной культуре общества". И вообще, вам к понятию "социальная материя".:))) Сложнее объяснять не будут, устал уже объяснять. :)))
Не сферу, а структуру и систему. А сфера у вас получается потому что вы все сваливаете в одну кучу без понимания системы и структуры. Еще раз перечитайте статью "отбор по функции". Но в части демографии вы правы, но не потому что "сфера больше", а потому что абстракции выше и выше системная сложность. Еще раз, системная сложность выше, а не объем знаний. Знания относительны, могут быть актуальны а может и нет. Не все "функции одинаково ценны". :))) Технологические знания изготовления топора и бензопилы это совсем разные знания. Требования системности знаний ведет к увеличению возраста специалиста. Мальчишку можно заставить выучить, но понимать он начнет и применять адекватно когда у него будет системное понимание. Вот таки и получается специалист только после 35 лет. Не так просто усвоить "функцию" высокого уровня отбора или понять ее смысл адекватно. :)))
Да это банальное структурирование знаний. И одного ИИ очень мало.
Не угадали. :))) Но про "аргументацию" логики посредством ИИ уже тут писал. Так что все наоборот. ИИ позволяет задействовать в одном проекте значительно больше специалистов чем это было ранее принципиально возможно. Или кто-то себе мог вообразить. А распространение практических ИИ позволяет над решением проблемы задействовать буквально миллионы специалистов. Это не меньше, а очень больше.
Используйте ноды. Давно вам про это сказал. Ноды + специализированные ИИ. Но это будет совсем не классификатор, а среда. И не ИИ в конечном итоге, а "медицинская операционная система". И сразу начинайте с открытого кода, не пытайтесь деньги заработать, так такое системы не работаю.
Спасибо, что поделились вашей точкой зрения.
Простые алгоритмы не могут разработать, роботы-операторы в больших сервисах, полный отстой, ни ответить, по делу, ни проблему решить. Это говорит о том, что разрабатывали их не отягощенные знаниями темы полудурки. Человечки-операторы тоже умом и сообразительностью не блещут. У них уровень 5 класса, может быть на нем и остановили свое развитие. Первое, это достоверная информационная база, предполагаю, что у нынешней достоверность процентов 50. Из г.на, торт не получится.
Проблема достоверной выборки не ходит одна, рядом с ней ещё есть серьёзнейшая проблема формализации самого критерия распознавания заболевания.
Помнится, несколько лет назад, ещё до пришествия ковида, проскочила на АШ статейка о очередных успехах британских (если ничего не путаю) учёных. Они тогда сумели научить искусственный интеллект, опознавать онкологию по рентгеновскому снимку (хотя может и не по рентгену, а по томограмме - не в этом суть). На обучении системы ИИ и последующих испытаниях, брались снимки от ближайших клиник: одной специализировавшейся на онкологиях, а другой обычной. Там был достигнут почти стопроцентный результат в распознании опухолей. Правда закончилось всё очень плохо - при непосредственной работе с пациентами без ранее подтверждённых диагнозов, система безбожно врала, даже на явно очевидных случаях.
В результате тщательного расследования выяснилось, что в онко клинике, был только один врач, делавший эти снимки и подписывавший их своей подписью... Гадская,
хитрожопаяслишком умная система ИИ, научилась распознавать подпись этого врача и выдавала положительный диагноз на онкологию, каждый раз, когда опознавала его подпись, соответственно, снимки без этой подписи, шли как снимки здоровых людей.Да, я тоже слышал эту байку, правда, там фигурировала не подпись врача, а штамп с номером больницы. Ну, что совой об пень, что пнём об сову.
Так что сырые данные без тщательно отслеживаемых протоколов с критериями включения в исследование и исключения из него это как раз про медИИ, обученный оч.умелыми ручками ИТшников на миллионах историй болезни от участковых тёток с очередью под дверью. Так сказать, "миллионы участковых тёток не могут ошибаться, это действительно диагностика и лечение уровня участковых тёток".
А что такое доказательная медицина, и как и откуда для неё берутся доказательства, про то ИТшникам не рассказывали.
Фармацевтика, медицина, здравоохранение не спешат внедрять ИИ, все больше на слуху да на виду речь идет о внедрении узкоспециализированных ИТ-систем. Вот тут подборка интеграторов айти-проектов в здравоохранение, медицину и фармацевтику, никто про ИИ не заикается.
Греф со своей командой реформаторов это не про облегчение труда медиков и уж тем более не про логику и семиотику постановки диагнозов, ...
"Лучше пиво в руке, чем девица вдалеке". Нафуа гра интеграторам блудняк "пойди туда, не знаю куда, принеси то, не знаю что" за свой счёт? В такое единицы могут.
Ага, беда коль сапоги начнет тачать пирожник, ортопед не для того учился шесть лет и стажировался еще пару лет минимум, чтобы ТЗ составлять для ИТ-пирожника. Поэтому айтишники в медицину заходят с осторожностью и предлагают только то что где-то в других областях знания хорошо работает, как то - статистический анализ, оценка информативности показателей, моделирование динамики показателей, сбор и анализ первичных данных и т.д.
Уловить в чем тут подвох, в этом выстраивании отношений ИТ- спецов и медиков, легко. Достаточно вспомнить из какой области переносится аналогия предлагаемого изучения объекта (явления, процесса) и почему это справедливо в области переноса, и почти не работает в медицине.
Теоретически правильно, а практически надругательство над медициной со времён MYCINа начала 70-ых годов прошлого века.
Отличный текст.
Вот вы сами пишете, что МЗ выложил методику, которую вы разнесли в пух и прах. МЗ - идиоты?
Сбер МедИИ - идиоты? Или хабальщики?
И как идиоты + хабальщики смогут создать цифрового ассистента для помощи в диагностике? Они АШ не читают.
Какова ваша личная уверенность в прогрессивности всей системы? А российской медицины в целом? Вот на фоне этого и надо выруливать, с этим всем надо разобраться.
Учитывая многообразие факторов, медИИ возможен только в виде мега-поисковика по огромным массивам данных, который выводит the right way. Т.е. в зависимости от ответа на какие-то вопросы отсекает неправильные, заведомо ложные пути поиска. Как это делать при дифф-диагностике? Только в формате цифрового помощника, который поможет пройтись по чеклисту и проследит, чтобы врач по нему прошелся, выписав пи*юлей, если врач этого не сделает. Плюс все это в облаке, на автомате, в ситуации выявления "сложных случаев" автоматом дается уведомление врачам, которые соберут комиссию, или сразу завернет на "консультацию с Москвой", не дав отправить пациента домой "с анальгином". Т.е. чтобы цифровой ассистент пресекал попытки врача дать диагноз на основе неполных данных или некомпетентности (по принципу "ну вроде похоже на ангину, ее и запишем, а там как пойдет").
Потому что, по моему опыту общения с клиниками как пациента, а опыт у меня большой, как по госам, так и по частным, именно из-за идиотизма врача порой не ставятся очевидные диагнозы, либо же наоборот - очевидные диагнозы лепятся везде где ни попадя (с соответствующими профилями лечения). "Ухо все еще не слышит? ну мы вам промывали неделю, а теперь идите, надо просто подождать....". Вот ТАКОГО быть не должно и цифровой ассистент должен это пресекать на всех этапах, до которых дотянется. Да, система строгая, что-то вроде цифрового концлагеря, но потом все привыкнут, особенно если рублем стимулировать. Пару раз премий лишить - переучатся и будут "взаимодействовать", а не шлёпать однотипные диагнозы. Не хочешь слышать пациента - будешь слышать цифрового надсмотрщика, который тебя быстро рублём научит, как пациента любить.
Ну зачем же сразу идиоты? Просто ИТщники не знают медицины, а медики не знают ИТ. В своих-то предметных областях люди вполне разбираются.
Но вы же сами пишете, что в простую логику уже на описанном случае они не умеют. Профзнания тут ни при чем, здравого смысла нет, и в госах я это наблюдаю очень часто. В частных получше, особенно если "знать места".
Анафероны, эргофероны разве не Скворцова бенефициар? Или это все злые языки придумали? Вот это мне не нравится.
Видимо, операторы техподдержки, разных сервисов, не утруждают себя мыслительной деятельностью, набирают обезьян, показывают им как работать с тупым роботом, в результате чего, они, "мозгами" робота, несут бред. Им говоришь, "у Вас баг в программе", а они "такая программа, мы не можем ни чего сделать". После чего, посылаешь привет полудуркам программистам, которые делат то, не зная что.
Это тоже не идиотизм, это "пиар-навар для своих да наших".
Мы привыкли говорить об этом как о чем-то само собой разумеющемся. Но ведь именно это неправильно!
Именно это и убивает всю систему. Вместо времени, которое могло быть потрачено на обдумывание проблем и путей их решения, тратится время на обдумывание схем. И "чего кому и сколько".
Отсюда и образ сберовского медИИ, которое вы уже в статье сразу заподозрили не как инновацию, а как средство "нахапать денег". Да оно и выглядит так. Факап, бро.
Вообще им не ИИ нужен, а система предиктивного ввода. Когда я вижу, как эти доктора вносят свои записи.....одним пальцем левой руки. Лучше этого не видеть, орать хочется от этого. 3-5 минут на осмотр и 15 минут он воюет с компьютером. Это просто бардак.
Мне всегда казалось, что банк должен заниматься финансами. Грефу бабки текут рекой и он уже просто не знает, куда бы их выкинуть. Вот и кидает их в какие-то бесполезные затеи. Это как дурачка деревенского привезли в город, и он тут же бросился скупать всё подряд по магазинам, с радостью разбрасывая какие-то бумажные разноцветные фантики, не считая и не заморачиваясь.
Ну а чё считать-то? Проценты лошадиные всё покроют, все хотелки, а там как оно работать будет - вообще не вопрос.
И да, чтобы машина диагностировала по анализам, надо на планшет поссать или каким способом там яйцеглист и энтеробиоз сдавать?
Разные системы - работа с первичными данными, и с обработанными знаниями в вербальной форме "кошечка зрачок вертикальный, собачка круглый".
В данном случае обсуждается диагностика на вербалике.
Кмк, эту статью можно отправить в качестве "электроннного письма Президенту РФ".
Ведь контингент читателей АШ в государстве ничего не решает...
Они в курсе, ответ был "Администрация Президента не является органом исполнительной власти".
Автор смело путает кислое с пресным и видимо давно не был ни в больницах, ни в поликлиниках. Да, ИИ пока далёк от совершенства и может выполнять лишь вспомогательную роль, однако современная медицина в ещё глубже в анусе, нежели ИИ. Проблем несколько.
1. Вместо описанных в статье опытных бабуль, которые с лёту могут пощупать лобик (провести первичный осмотр), сейчас в рабочекрестьянских поликлиниках делают вид что работают всякого рода Джамшуты, которые не только плохо говорят по русски, не только имеют весьма зыбкое представление о своей работе, так как скорее покупали дипломы за бакшиш, нежели честно учась, но и теперь во всю торгуют талонами на приём к врачу, торгуют справками и рецептами, просто не выполняют свою работу, ставя диагноз от балды, даже "лобик не пощупав". И если выбирать между ИИ и этой черно...ой фауной в халатах, мне лучше с ИИ, на него хоть в техподдержку нажаловаться можно и есть шанс, что его доработают.
2. Оставшиеся хорошие врачи нынче "знают себе цену" настолько, что могут выкинуть человека из больницы, если человек попытается лечиться по полису без бакшиша. В этом году выгнали инсультника в Костомукше, он в результате умер, в прошлом году выгнали больного из больницы в Новом Рогачике. Посмотрите в инете, таких историй много. А если послушаете разговоры в больницах про то, какому врачу сколько положить на лапу надо, чтобы он прооперировал по полису, становится совсем грустно, так как каждого 2-го эскулапа к стенке ставить надо, а уж врачей, которые делают побольше абортов, чтобы продать неродившегося ребёнка за 25 тыс$, так как это источник стволовых клеток для дорогих препаратов.
3. В силу "нехватки врачей" приёма к специалисту можно не получить месяцами, а дождавшись приёма не стоит рассчитывать на адекватное лечение так как "нет возможности" ни провести анализ, ни лечить. Правительство же ничего положительного не делает, чтобы поправить ситуацию с врачами и ресурсами медучреждений.
Если диагноз будет ставить ИИ, то если ручками не править его выводы, обязательное лечение он тебе пропишет невзирая на "отсутствие возможности" в местной больнице. И деваться главврачу будет некуда, так как если у него по бумагам стоит прибор, то на него придёт пациент и держать прибор в собранном виде в подвале, ожидая окончания гарантийного срока, чтобы списать в частную клинику по остаточной стоимости, не получится. Да и Джамшуты из поликлиник слава Богу уйдут обратно улицы мести.
Кхм... а чо, автор где-то против медИИ?
Автор вроде как начинает с того, что медИИ должен закрывать те дыры по DIF, которые есть хоть у доктора Джамшута, хоть у фельдшера Васи, хоть у участковой тётки Елены Ивановны, у которой мозги зашкварены после 50+ пациентов за смену.
И вся остальная статья не про то, что медИИ не нужен, а про то, как сделать эффективный медИИ, а не как у китайцев с 50-ю диагнозами на всю педиатрию, или как у Сбера "3 наиболее вероятных из 256 наиболее частых" на 11+ тысяч диагнозов из МКБ.
А заканчивает автор тем, что в целом ИИ продолжает магистральное направление, в рамках которого развивается человечество - аккумуляция предыдущего труда в орудиях производства. От топора, в котором преимущественно аккумулировался физический труд, до ИИ, аккумулирующих интеллектуальный труд экспертов.
Странно, а создалось ощущение, что автор считает ИИ в медицине дурной затеей. Видимо количество критики переросло в качество, когда вместе с водой начинают и ребёнка выплёскивать.
Нарушение ощущений требует дифференциальной диагностики с ковид, побочными эффектами фторхинолонов и очень нервными болезнями.
Страницы