Я есть данные для 2000 человек, которые мне стоит около $ 8500. И проблема в том, что я не могу проверить каждый и каждый по одному на подлинность.
Ну, я думал о случайном выборе номера «х» данных и их проверки. Что должно быть минимальным «х» для данных 2000? И какой процент «х» должны быть подлинными, чтобы пройти тест?
Пример: Х = 20. Я принимаю случайным образом 30 данных и проверить его. И если более 10, являются поддельными, что означает, что 1000 являются поддельными в соответствии с простой вероятностью.
Таким образом, я должен решить, что «х» должно быть и какой процент «х» должны быть подлинными, чтобы пройти тест.
Другой вопрос- можно выбирать данные из случайного т.е. 1-2000? Или разделить их в пазе 100 или 200 затем выбрать несколько случайных выборок так что конкретная партия на подлинность?
Какой должна быть моя стратегия?
Ну, это не про тест. Я был взволнован вопросом и математикой за потому, что когда-то я Read-, если взять 100 случайных выборок, и если 90% из них верно, то в соответствии с вероятностью 92% будет достоверной в партии 1.00.000.