Прошу помощи.
Ставим мысленный эксперимент: имеется некий прибор дающий качественный замер некоего фактора ( по принципу есть/нет). При этом известно, что погрешность выдачи результата равна M. Нет, М - много, возьмем N. Итак имеется некий прибор, выдающий в N случаях неверный результат. Неважно, ложно-положительный или ложно-отрицательный.
Подскажите, как рассчитать количество замеров, позволяющее более-менее достоверно (с вероятностью хотя бы 99,5%) определить наличие данного фактора. Желательно - формулу, и не слишком сложную, доступную пониманию человека, не имеющего технического или математического образования. Рассуждения о том, что за прибор и какой фактор измеряет, совершенно не нужны и будут убираться из дискуссии.
Комментарии
N случаев из скольких?
Само-собой из 100. Типа в процентах.
Тогда минимальное кол-во замеров=100/N
Тесть, если прибор врет в 50% случаев, надо делать 2 замера, а если в 20% - 5 замеров? Как-то не логично....
Данных недостаточно. Формулы будут разные, в зависимости от внутренней структуры измерителя. Если "измеритель" подбрасывает монетку, то вероятность правильного результата будет 50%, вне зависимости от количества измерений.
Если же измеритель устроен так, что правильный результат суммируется с неким случайным процессом, то соотношение правильный/неправильный будет улучшаться в корень из числа измерений.
Ответ:
Количество измерений необходимое для достоверности 99,5 при ошибке N определяется по формуле:
D = 200*N
На заведомо известных тестировать надо. 10 раз на +, 10 раз на -. А там оно покажет N
Типа уже протестировано. N - известно.
Ну, попробуйте так ( (100-N) / N )*(100-N)
Например N=30%, то ( 70/30 ) * 70 = 163,333 %
Значит из 17 (16,3) тестов 10 дадут верный ответ.
Это понятно. НО! Прибор уже есть и задача состоит в том. чтобы определить, сколько надо сделать замеров данным прибором для получения относительно достоверного результата. 2? 3? 10? 50?
Из примера 17 замеров, превалирующий результат тестирования будет верен.
И да, как сказали, при условии, что прибор определяет больше половины тестов верно. N>50.
Попытаюсь объяснить еще раз на ваших цифрах. Если мы делает одно измерение - вероятность достоверного результата - 70%. этого мало. 2 - измерения - вероятность получения достоверного результата увеличится, допустим до 85%. Нам нужна достоверность получения результата 99%. Сколько нужно сделать замеров?
Числа из пример те же
70/30= 2,333
30/2,333 = 12,85
12,85/2,333= 5,51
5,51/2,33 = 2,36
2,36/ 2,33 = 1,01
1,01 / 2,33 = 0,43
По количеству делений 6 до получения результата меньше 0,5.
Не знаю, может здесь есть логическая ошибка.
Получается, что нужно 5 измерений до получения достоверного результата с вероятностью примерно 99%, и 6 измерений для получения достоверного результата с вероятность в 99,5%?
всё таки 6, первый тоже учитывается.
А не всё ли равно - сколько? Делайте столько сколько надо.
При таком количестве конкретики сказать что-то затруднительно.
Но. Если надо мерять по принципу "да-нет", то чтобы увеличить вероятность надо увеличить количество средств измерения. Десять датчиков вместо одного, к примеру. Если бы меряли заготовку детали, то необходимое количество замеров для получения нужного процента, в рамках заданной точности измерения, рассчитать можно.
То есть. Если есть постоянная - деталь, то варьируем количество измерений.
У вас я так понимаю надо произвести измерение "процесса" или "явления", что само по себе штука не постоянная. Так что здесь - только увеличивать количество приборов которыми измеряете.
ещё таблицу можно составить, где если вдруг 7 из 7 одинаковых, или там 8 из 9, и т.д., то тестирование можно заканчивать.
Это вы так косвенно наезжаете на точность тестов на ковид?
На самом деле верхней границы количества измерений нет. Это вероятностный закон больших чисел (частота события приближается к его вероятности при бесконечном росте количества попыток). Вероятность 99,5% означает, что большинство приборов этого вида врут в 0,5% случаев, но конкретный прибор может врать чаще. Просто разработчики и пользователи прибора пришли к совместному выводу, что ложные 0,5% не столь критичны, чтобы ради них вымучивать технику.
Очевидно, при большой величине N (например, 30%) даже 100 измерений не дадут точной картины. Что скажет результат 50 на 50%? Или даже если будет 70 на 30%, опять-таки основная часть измерений даже при таком количестве замеров может попасть в "зону N".
Технически для получения достоверного результата при большой величине N применяются другие способы. Например, резервирование результатов при помощи замеров альтернативными приборами.
И ещё. Для оценки этих самых 99,5% надо провести испытания прибора на образцах, чьи свойства достоверно известны заранее. То есть, образцы должны быть поверены другими более точными приборами, точность которых уже установлена. В случае, на который вы, видимо, намекаете, сделать это невозможно -нет "калибрующего" прибора.
Если есть прибор, то перво, что нужно сделать - почитать инструкцию, на предмет его аттестации в Госреестре средств измерений и на какую методику измерений он аттестован. В методике есть ответы на все Ваши вопросы. Если прибор не аттестован, то первый вопрос: а зачем Вы измеряете?? Если для выдачи результатов на сторону (в т.ч. сертификация продаваемого товара / услуги) Вы не имеете права его использовать в любом случае. Если "для себя" - то вспоминаем универский курс матстатистики. Для достижения достоверности 99,5 % n должно быть не менее 30 (таблички к коэффициенту Стьюдента) и далее по тексту. Но по сути, Вам нужно найти или разработать собственную методику измерений. Я бы первым делом обратился за ней к разработчику прибора . И вообще у Вас метролог есть? его хлеб.
Ну да, на заведомо известных покажет наличие дефекта с вероятностью 100%
На заведомо известных протестируй 1000 раз для получения нужной размерности результата.
Уже протестировано, N- знаем. Теперь вопрос в том, сколько замеров нужно сделать для получения относительно достоверного результата, когда не знаем, есть фактор или нет.
Без знания закона распределения выпадения вашего фактора, определить количество замеров невозможно
Чем тебе нормальное распределение не угодило?
Тем что бывают и другие?
То есть да, если нам известно, что то, что мы мерем имеет какое-то распределение — можно что-то считать.
Но с теми данными, что у автора статьи — данных недостаточно.
P.S. А дальше, если уж вы произнесёте слова “нормальное распределением” и “интеграл”, то, я боюсь, автор статьи вас пошлёт. Ему ж формула нужна такая, чтобы без математики…
А если известно распределение - то бери формулу и вперед
А если не известно, то изучай. Иначе применение нормального может привести к непоправимым последствиям
Дык, известно:
1 или 0. Распределение Бернулли. Веперёд!
Вот здесь https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%BE%D0%B2%D0%B5%D1%80%D0%BA...
Обожаю тех, кто дает подобные советы. Еще, если бы вы ответили на вопрос, какую из приведенных там формул взять, было бы совсем хорошо....
Надо поискать решение задач - примеры проверки статистических гипотез.
Есть даже онлайн расчеты https://math.semestr.ru/group/hypothesis.php
Какой смысл дублировать википедию?
Вы мне напоминаете какого-нибудь деревенского жителя, который пытается выяснить у шофёра — откуда он знает сколько ему нужно бензина, чтобы до города доехать и почему до Задрищенска нужно 20 литров, а до Уробоинска 10, хотя Задрищенск ближе.
Да, представьте себе, на ваш “простой” вопрос простого ответа нет и существует целая дисциплина, которая всем этим занимается.
Без неё ни самолёт, ни Крымский мост не построишь — но она несколько сложнее, чем то, что можно впихнуть в комментарий на AfterShock.
Её азы как раз статья в Wikipedia и покрывает…
Прибор с достоверностью 30% прибором не является. Нужно менять средство диагностики.
Если N > 0,5, то задача принципиально нерешаема.
N заведомо меньше 0,5. Например, 0,1.
Если N меньше, чем 0.5, то просто делать не один замер/испытание/анализ, а серию. Резко растет ВЕРОЯТНОСТЬ соответствия результатов тестирования.
Вот тут обратите внимание на задачу про серию бросания монеты (формула Бернулли)
https://www.matburo.ru/tvart_sub.php?p=art_tv
Это несколько не то. Вероятность получения достоверного результата нам уже известна. Это=100-N. Вопрос в том, чтобы получить достоверный результат в серии с минимальным возможным количеством измерений. Я понимаю, что минимум измерений больше единицы. Но сколько?
Всё просто. Делаете 1 замер и инвертируете результат.
Это как? Все положительные результаты считаем отрицательными? Не пойдет...
А в вашем случае нет другого пути.
Задаете необходимую точность. Подставляете N. И с помощью этой формулы вычисляете какая серия нужна для получения заданной точности.
Так контроль параметров не работает
Это называется, мерять пока размер не получится нужный.
Им, я так понимаю, не нужно точно все, по ГОСТ. Некий упрощенный вариант.
Если надо все по взрослому, то вот в какую сторону смотреть.
https://www.bookasutp.ru/Chapter4_2.aspx
Я уже догадался, что без конкретики не разобраться. Тут еще вопрос возникает: а будет ли результат с увеличением количества измерений признан как соответствующий требованиям? Для внутреннего контроля сойдет, а вот для докащательства третьей стороне результат может быть отклонен, как несоответствующий требованиям стандарта.
Да, если нужен, назовем так, официальный результат, то там еще возникают вопросы случайности и систематичности ошибок, наличие промахов и их распределения и их подтвержденность.
А если просто для себя, то, как правило, народная мудрость "семь раз замерь" вполне уместна на обычных бытовых примерах.
В какую формулу подставлять?
Я чуть выше ссылку привел как это по науке и ГОСТ считается. Это не совсем формула 2х2.
:)
Обычно принимается размер выборки в 2000 опросов, погрешность будет порядка 2%
Если Вы про тесты на Ковид, то обратитесь к тому, кто формулу для спортлото придумывал) Ибо, нужно задействовать такие показатели как возраст и хронические заболевания как минимум)
Во избежания срача, запись сверну и дальнейшее продолжение данной темы не приветствуется.
Хорошо!)
Страницы