Если изучаемая случайная величина является непрерывной, то ранжирование и группировка наблюдаемых значений зачастую не позволяют выделить характерные черты варьирования ее значений. Это объясняется тем, что отдельные значения случайной величины могут как угодно мало отличаться друг от друга и поэтому в совокупности наблюдаемых данных одинаковые значения величины могут встречаться редко, а частоты вариантов мало отличаются друг от друга. Нецелесообразно также построение дискретного ряда для дискретной случайной величины, число возможных значений которой велико. В подобных случаях следует строить интервальный вариационный ряд распределения. Для построения такого ряда весь интервал варьирования наблюдаемых значений случайной величины разбивают на ряд частичных интервалов и подсчитывают частоту попадания значений величины в каждый частичный интервал. Интервальным вариационным рядом называют упорядоченную совокупность интервалов варьирования значений случайной величины с соответствующими частотами или относительными частотами попаданий в каждый из них значений величины. Для построения интервального ряда необходимо: - определить величину частичных интервалов;
- определить ширину интервалов;
- установить для каждого интервала его верхнюю и нижнюю границы;
- сгруппировать результаты наблюдении.
1. Вопрос о выборе числа и ширины интервалов группировки приходится решать в каждом конкретном случае исходя из целей исследования, объема выборки и степени варьирования признака в выборке. Приблизительно число интервалов k можно оценить исходя только из объема выборки n одним из следующих способов: - по формуле Стержеса: k = 1 + 3,32·lg n;
- с помощью таблицы 1.
Таблица 1
Объем выборки, n | 25-40 | 40-60 | 60-100 | 100-200 | Больше 200 | Число интервалов, k | 5-6 | 6-8 | 7-10 | 8-12 | 10-15 |
2. Обычно предпочтительны интервалы одинаковой ширины. Для определения ширины интервалов h вычисляют: 3. Нижняя граница первого интервала xh1 выбирается так, чтобы минимальная варианта выборки xmin попадала примерно в середину этого интервала: xh1 = xmin - 0,5·h . Промежуточные интервалы получают прибавляя к концу предыдущего интервала длину частичного интервала h: xhi = xhi-1 +h . Построение шкалы интервалов на основе вычисления границ интервалов продолжается до тех пор, пока величина xhi удовлетворяет соотношению: xhi < xmax + 0,5·h . 4. В соответствии со шкалой интервалов производится группирование значений признака - для каждого частичного интервала вычисляется сумма частот niвариант, попавших в i-й интервал. При этом в интервал включают значения случайной величины, большие или равные нижней границе и меньшие верхней границы интервала.
Источник: http://qo.do.am |