Статистические тесты

из "Аналитическая химия Том 2"

Р-распределение лежит в основе статистических тестов для случайных величин, имеющих х -распределение. Формулу функщ и плотности вероятности для Р-распределения с VI и У2 степенями свободы ( ы.ьз) можно найти в специальной литературе. Примеры таких функций приведены на рис. 12.1-5,в. [c.428]
Очень редко анализу подвергают весь исследуемый материал (т. е. генеральную совокупность ). Предположим, мы хотим определить содержание фосфатов в почве. Для этого, как правило, случайным образом отбирают несколько проб (см. разд. 12.1.3). Иными словами, мы извлекаем из генеральной совокупности некоторую случайную выборку и используем ее для оценки параметров всей генеральной совокупности в целом. При этом предполагается, что выборка представительна, т. е. информация, содержащаяся в ней, отражает информацию о всей генеральной совокупности. [c.429]
Степень возможной близости оценки Т к генеральному (неизвестному) параметру т можно выразить количественно, если найти вероятность того, что значение Т лежит в некотором интервале т к, где к — некоторая константа. Заметим, что вероятность того, что Т принадлежит интервалу т /с, такая же, как и вероятность того, что т принадлежит интервалу Т к. Интервал Т к случайный (поскольку Т —случайная величина). Каждая отдельная реализация этого интервала называется доверительным интервалом, а его граничные значения — доверительными пределами. Вероятность Р = (1 — а) того, что (случайный) доверительный интервал содержит т, называется доверительной вероятностью, а величина а — уровнем значимости. Как правило, а полагают равным 0,05, реже 0,01 и еще реже 0,001. Таким образом, если а = 0,05, это означает, что с вероятностью 95% интервал Т /с содержит значение т. Чем выше доверительная вероятность, тем шире соответствующий ей доверительный интервал. При Р — 1 доверительный интервал расширяется неограниченно. [c.429]
Разумеется, доверительный интервал несет в себе больше информации, чем просто значение оценки. Ширина доверительного интервала, определяемая выбранной доверительной вероятностью, характеризует степень возможной близости оценки к неизвестному параметру генеральной совокупности. Очевидно, что при заданном значении а ширина доверительного интервала уменьшается с ростом объема выборки. Однако поскольку скорость этого уменьшения невелика (в соответствии с зависимостью 1/ /п), на практике увеличение объема выборки сверх разумных пределов нецелесообразно достигнутое сужение доверительного интервала может не компенсировать затрат времени и средств, необходимых для выполнения дополнительных анализов . [c.431]
Здесь (1-а/2),п-1 есть (1 - а/2)-квантиль -распределения с п - 1 степенями свободы ( -коэффициент), т. е. такое значение , для которого площадь под кривой соответствующего распределения в пределах от —оо до равна (1—а/2). [c.432]
В образце воды определяли содержание свинца методом инверсионной вольтам-перометрии. Получена следующая серия значений (мкг/л) 1,2, 1,8, 1,4, 1,6, 1,3, 1,5, 1,4, 1,3, 1,7, 1,4. Рассчитайте доверительные границы для содержания свинца при доверительной вероятности, равной 95% и 99%. [c.432]
Аналитику необходимо определить содержание свинца в партии фруктового сока. Заказчик предполагает, что искомое содержание составляет порядка 100 мкг/кг (100 млрд ). Требуемая заказчиком точность должна составлять 5 мкг/кг при доверительной вероятности 95%. Рассчитайте, сколько параллельных определений необходимо выполнить, если для данного диапазона концентраций стандартное отклонение методики составляет 8 мкг/кг. [c.433]
Точностные требования заказчика означают, что значение должно лежать в пределах X 1,96(т/у , где и = 8 и l,96o-/v = 5. Отсюда, /п = (1,96 8)/5 = 3,14 и п 10. Чтобы удовлетворить требованиям заказчика, необходимо проанализировать 10 аликвот. Заметьте, однако, что требуемая точность может быть при этом достигнута лишь в том случае, если используемая методика не содержит систематической погрешности. [c.433]
Как отмечено в разд. 2.4, существует много источников систематических погрешностей. Среди них — методические, связанные с загрязнениями пробы, влиянием посторонних компонентов, потерями определяемого компонента вследствие неадекватной пробоподготовки, неполным промьшанием осадка в ходе гравиметрического анализа, индикаторными погрешностями в титримет-рии и т. д. инструментальные, вызванные неправильной градуировкой приборов субъективные, связанные с личными особенностями аналитика недостатками зрения, привычкой предпочитать четные или нечетные значения измеренных величин и т. д. Систематические погрешности могут быть постоянными, не зависящими от концентраций компонентов, и пропорциональными, концентрационно зависимыми. Например, постоянная систематическая погрешность может возникнуть вследствие загрязнения реагентов, а пропорциональная — из-за неправильной градуировки прибора. Разумеется, они могут присутствовать и одновременно. [c.433]
Однако стандартный образец требуемого состава может быть труднодоступен или не существовать вовсе. В этих случаях проверку правильности можно осуществить (также используя статистические методы для сравнения результатов) путем независимого анализа данного образца с помощью стандартной методики] она должна быть свободна от методической и лабораторной систематических погрешностей. Как следует из обсуждения проблем правильности в разд. 2.4, последнее допущение может оказаться довольно рискованным. Поэтому окончательное заключение о правильности методики лучше всего делать на основании межлабораторных испытаний. Если при сравнении результатов испытуемой и стандартной методик используется лишь един образец то вывод о правильности испытуемой методики, строго говоря, может относиться только к этому образцу. Следовательно, для обнщости выводов необходимо проанализировать множество разных образцов. Чрезвычайно важно, чтобы содержание определяемого компонента в этих образцах покрывало весь диапазон концентраций, для которых испытуемая методика предназнаг чена. Данные, полученные с помощью обеих методик, необходимо сравнить статистическими методами (например, i-критерия или регрессионного анализа), чтобы установить, является ли различие между результатами значимым или незначимым (т. е. таким, которое можно отнести лишь на счет случайных погрешностей). [c.434]
В частности, для ответа на последний вопрос можно проанализировать с помощью испытуемой методики стандартный образец, содержание определяемого компонента в котором известно с высокой точностью. Различие между аттестованным и найденным (как среднее из нескольких параллельных определений) значениями может быть вызвано как случайными, так и системаг тическими (если они есть) погрешностями испытуемой методики. Поскольку случайных погрешностей избежать нельзя, найденное значение всегда будет отличаться от аттестованного, даже если систематические погрешности отсутствуют. Поэтому в подобной ситуации необходимо установить, значимо или нет различие полученных результатов, т. е. может или нет оно быть объяснено только наличием случайных погрешностей. Такое решение может быть принято на основании статистических критериев значимости критериев проверки гипотез). Понятно, что статистические методы, позволяющие принять или отвергнуть ту или иную гипотезу, имеют фундаментальное значение для правильной интерпретации аналитических данных. Главные этапы статистической проверки любой гипотезы перечислены на рис. 12.1-8. В их основе лежат следующие идеи. [c.435]
Здесь Т — неизвестный параметр, характеризующий распределение экспериментальных данных, а То —заранее выбранная константа. В зависимости от формулировки альтернативной гипотезы различают двусторонние (Н1 Т ф То) и односторонние (Н1 Т То либо Нх Т То) тесты. [c.436]
Чтобы отвергнуть/принять Но (т. е. принять/отвергнуть Н1), необходимо решить, является ли со статистической точки зрения значение Т настолько отличным от То (соответственно, настолько большим или малым по сравнению с То —в зависимости от формулировки Нх), чтобы это различие можно было считать не случайным. Необходимо иметь в виду, что решение приходится принимать в условиях дефицита информации, так как объем выборки аналитических данных обычно мал. Следует заранее задать уровень значимости а, характеризующий вероятность отвергнуть гипотезу Но, когда на самом деле она верна. Это соответствует случаю, когда реализация t величины Т попадает в заштрихованную область рис. 12.1-9. [c.436]
Значение [3 соответствует вероятности ошибки второго рода. Величина 8 равна (Т — То)/(с/л/й) отсюда следует, что если Т То, то /3 — 1 — о. [c.438]
Кривые, обозначенные как Но и Нх, отображают функции плотности вероятности для соответствующих гипотез (т. е. для случаев, когда верна нуль-гипотеза либо альтернативная гипотеза). [c.438]
Аналогично, принятие гипотезы Но, когда она неверна (или отклонение Нх, когда она верна), называется ошибкой второго рода. Ее вероятность (/3) равна площади заштрихованного участка на рис. 12.1-10. Обратите внимание, что с уменьшением а вероятность ошибки первого рода уменьшается, а второго рода — возрастает. Вероятность ошибки второго рода /3 зависит также от разности Т и То чем она больше, тем /3 меньше. При Т = То величина /3 достигает максимального значения, равного 1 — а. Рис. 12.2-11 иллюстрирует возможные варианты принятия-отклонения гипотезы Но (Н1). Во избежание недоразумения следует подчеркнуть, что для любого статистического теста уровень значимости а (например, 5%) характеризует вероятность (1 — а в данном случае 95%) принятия нуль-гипотезы лишь в тех случаях, когда она действительно верна. В общем случае принятие нуль-гипотезы не означает, что ее вероятность равна 1 — а (95%, в нашем примере). [c.438]
При а = 0,05 критическое значение равно 20,975 = 1,96 (формулировка Н1 требует двустороннего теста). [c.439]
Отсюда видно, что в зависимости от выбранного уровня значимости можно прийти к различным выводам гипотеза Но была отвергнута в первом случае и принята во втором. Заметьте, однако, что оба этих вывода справедливы В действительности, конечно, утверждение производителя (Но) либо верно, либо нет, но, к сожалению, истинное положение дел нам неизвестно (в противном случае прибегать к статистическим тестам не было бы необходимости). Таким образом, мы можем лишь обсуждать вероятность отклонения Но в случаях, когда она верна или неверна. При а = 0,05 Но была отвергнута. Следовательно, если Но на самом деле верна, существует 5%-ная вероятность ошибки первого рода если же Но неверна, то сделанное нами заключение было правильным. При а = 0,01 Но была принята. В этом случае мы не можем совершить ошибку первого рода, однако если в действительности Но неверна, мы совершаем ошибку второго рода. Вероятность этой ошибки Р(П) мы оценить не можем, поскольку значение генерального среднего неизвестно (в противном случае, опять же, необходимость в проведении теста отпала бы). Очевидно, что с увеличением а вероятность ошибки первого рода Р(1) уменьшается, поскольку диапазон допустимых значений выборочного среднего расширяется. При этом соответственно возрастает вероятность ошибки второго рода (при уменьшении а возрастает 0). Таким образом, при выборе уровня значимости необходимо руководствоваться ценой ошибки первого рода (см. также следующий пример). [c.440]

Вернуться к основной статье

Справочник химика 21

Химия и химическая технология