Высшая Mатематика Решение задач - OnLine
./ Главная /Обработка ряда абсолютных частот, ШАГ-1/Пример >

Пример обработки статистического ряда абсолютных частот нашим сервисом:
(полигоны частот, гистограмма, функция распределения, математическое ожидание, дисперсия)



Заметьте! Решение вашей конкретной задачи будет выглядеть аналогично данному примеру, включая все таблицы и поясняющие тексты, представленные ниже, но с учетом ваших исходных данных…


Задача:
Задан группированный статистический ряд абсолютных частот:

xk*    0.09073   0.27118   0.45163   0.63208   0.81253   0.99298   1.17343
nk* 76  51  39  36  21  18  9 

xk*    1.35388   1.53433   1.71478   1.89523   2.07568   2.25613   2.43658
nk* 7  6  6  4  2  0  1 

xk*    2.61703   2.79748   2.97793   3.15838   3.33883   3.51928   3.69973
nk* 0  1  1  0  0  0  2 



Требуется построить (вычислить):
   - группированный статистический ряд относительных частот из 21 члена(ов);
   - полигон абсолютных частот;
   - полигон относительных частот;
   - гистограмму относительных частот;
   - эмпирическую функцию распределения;
   - выборочное среднее (Оценку математического ожидания);
   - выборочную дисперсию (Оценку дисперсии);



РЕШЕНИЕ:

1. Строим группированный статистический ряд относительных частот.

Группированным статистическим рядом относительных частот называется последовательность пар чисел
(x1* , n1*/n) ,  (x2* , n2*/n) ,…,  (xm* , nm*/n)
где nk*/n — относительные частоты и n - объем выборки.



1.1. По группированному статистическому ряду абсолютных частот находим объем выборки n, просто суммируя абсолютные частоты:
76+51+ ... +2 = 280

1.2. Вычисляем относительные частоты nk*/n, как отношения абсолютных частот к объему выборки. результат представим в виде таблицы:
Номер Интервала
k
Центр Интервала
xk*
nk*nk*/n
1 0.0907376 0.27143
2 0.2711851 0.18214
3 0.4516339 0.13929
4 0.6320836 0.12857
5 0.8125321 0.07500
6 0.9929818 0.06429
7 1.173439 0.03214
8 1.353887 0.02500
9 1.534336 0.02143
10 1.714786 0.02143
11 1.895234 0.01429
12 2.075682 0.00714
13 2.256130 0.00000
14 2.436581 0.00357
15 2.617030 0.00000
16 2.797481 0.00357
17 2.977931 0.00357
18 3.158380 0.00000
19 3.338830 0.00000
20 3.519280 0.00000
21 3.699732 0.00714

1.3. Убеждаемся, что сумма всех относительных частот nk*/n равна единице. (допускается небольшое отличие от единицы в рамках погрешности вычислений)
0.27143+ 0.18214+ ... + 0.00714 = 1.00000

ОТВЕТ. Группированный статистический ряд относительных частот имеет вид:

xk*    0.09073   0.27118   0.45163   0.63208   0.81253   0.99298   1.17343
nk*/n  0.27143   0.18214   0.13929   0.12857   0.07500   0.06429   0.03214 

xk*    1.35388   1.53433   1.71478   1.89523   2.07568   2.25613   2.43658
nk*/n  0.02500   0.02143   0.02143   0.01429   0.00714   0.00000   0.00357 

xk*    2.61703   2.79748   2.97793   3.15838   3.33883   3.51928   3.69973
nk*/n  0.00000   0.00357   0.00357   0.00000   0.00000   0.00000   0.00714 

2. Строим полигон абсолютных частот.

Полигон абсолютных частот группированного статистического ряда абсолютных частот — это ломаная с вершинами в точках (xk* , nk* ). Полигон является одним из графических представлений выборки. Следует тщательно выбрать масштабы и начальные точки на осях, чтобы полигон был максимально наглядным.

2.1. На оси абсцисс выбираем начальную точку чуть левее точки x1* =  0.09073, и такой масштаб, чтобы на оси поместился интервал [x1* , x21* ] = [ 0.09073 ,  3.69973] и отчетливо различались точки xk*.

2.2. На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы на оси поместился интервал
[min{n1*,…,n21* },max{n1*,…,n21* }] = [0 , 76] и отчетливо различались точки nk*.

2.3. На оси абсцисс размещаем значения xk*, а на оси ординат значения nk*.

2.4. Наносим точки (x1*n1* ), (x2*n2* ),…,(x21*n21* ) на координатную плоскость и последовательно соединяем их отрезками. Получаем полигон, изображенный на рисунке ниже.

Полигон абсолютных частот

3. Строим полигон относительных частот.

Полигон относительных частот группированного статистического ряда относительных частот — это ломаная с вершинами в точках (xk* , nk*/n ). Полигон является одним из графических представлений выборки. Следует тщательно выбрать масштабы и начальные точки на осях, чтобы полигон был максимально наглядным.

3.1. На оси абсцисс выбираем начальную точку чуть левее точки x1* =  0.09073, и такой масштаб, чтобы на оси поместился интервал [x1* , x21* ] = [ 0.09073 ,  3.69973] и отчетливо различались точки xk*.

3.2. На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы на оси поместился интервал
[min{n1*/n,…,n21*/n},max{n1*/n,…,n21*/n}] = [ 0.00000 ,  0.27143] и отчетливо различались точки nk*/n.

3.3. На оси абсцисс размещаем значения xk*, а на оси ординат значения nk*/n.

3.4. Наносим точки (x1*n1*/n ), (x2*n2*/n ),…,(x21*n21*/n ) на координатную плоскость и последовательно соединяем их отрезками. Получаем полигон, изображенный на рисунке ниже.

Полигон относительных частот

4. Строим гистограмму относительных частот.

Гистограмма относительных частот — это фигура, состоящая из m прямоугольников, опирающихся на интервалы группировки. Площадь к-ro прямоугольника полагают равной nk*/n, т.е. относительной частоте данного интервала.
Для построения гистограммы нам необходимо получить границы интервалов группировки, для этого:

4.1. Вычисляем полуширину интервала группировки:
d = (x2*- x1* )/2 =…= (x*m+1- xm* )/2  = (0.27118 - 0.09073)/2 = 0.090225
4.2. Находим xmin = x1*-d = 0.09073-0.090225 = 0.00050500000000002 и xmax = x21*+d = 3.69973+0.090225 = 3.789955

4.3. Находим границы интервалов группировки по формуле xk-1 = xk*-d  k = 1…21
Номер Интервала
k
Центр Интервала
xk*
Границы Интервала
[xk-1 , xk ]
nk*/nHk
1 0.09073 0.00051... 0.18095 0.27143 1.50418
2 0.27118 0.18095... 0.36140 0.18214 1.00938
3 0.45163 0.36140... 0.54185 0.13929 0.77188
4 0.63208 0.54185... 0.72230 0.12857 0.71250
5 0.81253 0.72230... 0.90275 0.07500 0.41563
6 0.99298 0.90275... 1.08320 0.06429 0.35625
7 1.17343 1.08320... 1.26365 0.03214 0.17813
8 1.35388 1.26365... 1.44410 0.02500 0.13854
9 1.53433 1.44410... 1.62455 0.02143 0.11875
10 1.71478 1.62455... 1.80500 0.02143 0.11875
11 1.89523 1.80500... 1.98545 0.01429 0.07917
12 2.07568 1.98545... 2.16590 0.00714 0.03958
13 2.25613 2.16590... 2.34635 0.00000 0.00000
14 2.43658 2.34635... 2.52680 0.00357 0.01979
15 2.61703 2.52680... 2.70725 0.00000 0.00000
16 2.79748 2.70725... 2.88770 0.00357 0.01979
17 2.97793 2.88770... 3.06815 0.00357 0.01979
18 3.15838 3.06815... 3.24860 0.00000 0.00000
19 3.33883 3.24860... 3.42905 0.00000 0.00000
20 3.51928 3.42905... 3.60950 0.00000 0.00000
21 3.69973 3.60950... 3.78995 0.00714 0.03958

4.4. Убеждаемся, что сумма всех высот Hk , умноженная на h, равна единице. (допускается небольшое отличие от единицы в рамках погрешности вычислений)

1.50418+ 1.00938+ ... + 0.03958 = 5.54170 ;   5.54170* 0.18045 =  1.00000

4.5. На оси абсцисс выбираем начальную точку чуть левее точки x1 =  0.18095, и такой масштаб, чтобы на оси поместился интервал [x1 , x21 ] = [ 0.18095 ,  3.78995] и отчетливо различались точки xk.

4.6. На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы отчетливо различались Hk

4.7. Для построения гистограммы относительных частот на ось абсцисс наносим интервалы [xk-1 , xk] и, используя каждый из них как основание, строим прямоугольник с соответствующей высотой Hk.
Получаем гистограмму, изображенную на рисунке ниже.

Гистограмма относительных частот

5. Строим эмпирическую функцию распределения.

Эмпирической функцией распределения называется функция F*(x), определенная для всех х от —  до ; таких, что:
1) F*(x) = 0,   для всех x < x*1;.
2) F*(x) = (n1*/n)+(n2*/n)+…+(nk*/n)  для всех x удовлетворяющих условию:  хk*≤ x < х*k+1;
3) F*(x) = 1,   для всех x ≥ x*m;.

5.1. Для построения функции заполним таблицу (см.ниже), в колонку F*(x) будем записывать накопленные относительные частоты
F*(x1*) = n1*/n
F*(x2*) = (n1*/n)+(n2*/n)
F*(x3*) = (n1*/n)+(n2*/n)+(n3*/n)  и т.д.

Номер Интервала
k
Центр Интервала
xk*
nk*/nF*(xk*)
1 0.09073 0.27143 0.27143
2 0.27118 0.18214 0.45357
3 0.45163 0.13929 0.59286
4 0.63208 0.12857 0.72143
5 0.81253 0.07500 0.79643
6 0.99298 0.06429 0.86071
7 1.17343 0.03214 0.89286
8 1.35388 0.02500 0.91786
9 1.53433 0.02143 0.93929
10 1.71478 0.02143 0.96071
11 1.89523 0.01429 0.97500
12 2.07568 0.00714 0.98214
13 2.25613 0.00000 0.98214
14 2.43658 0.00357 0.98571
15 2.61703 0.00000 0.98571
16 2.79748 0.00357 0.98929
17 2.97793 0.00357 0.99286
18 3.15838 0.00000 0.99286
19 3.33883 0.00000 0.99286
20 3.51928 0.00000 0.99286
21 3.69973 0.00714 1.00000

5.2. На оси абсцисс выбираем начальную точку чуть левее точки x1* =  0.09073, и такой масштаб, чтобы на оси поместился интервал [x1* , x21* ] = [ 0.09073 ,  3.69973] и отчетливо различались точки xk*.

5.3. На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы на оси поместился интервал
[0 , 1] и отчетливо различались точки nk*/n.

5.4. Для построения графика эмпирической функции распределения наносим на ось абсцисс интервалы [xk* , xk+1*] и над каждым из них на высоте F*(xk* ) строим горизонтальные отрезки. В правом конце отрезка помещаем стрелку, чтобы показать, что F*(xk* ) в точке x*k+1 делает прыжок в высоту на F*(x*k+1 ) — F*(xk* ) = n*k+1 /n.
Получаем график эмпирической функции распределения, изображенный на рисунке ниже.

Эмпирическая функция распределения

6. Вычислим оценку математического ожидания (выборочное среднее) исходного ряда абсолютных частот.

Выборочное среднее группированного статистического ряда абсолютных частот определяется формулой
M* = 
m
Σ
k = 1
xk*(nk*/n)
где n = n1* + ... + nm* — объем выборки.
Чтобы упростить вычисления и уменьшить погрешность округления, используем так называемый метод произведений. Заметим, что если c — центр того интервала группировки, который находится примерно в середине статистического ряда и h — длина интервала группировки, то величины
yk* = 
xk* - c
h
— целые числа. Поэтому величина
Y* = 
1
n
m
Σ
k = 1
yk*nk*
вычисляется очень просто. Искомое выборочное среднее M* выражается через Y* по формуле
M* = Y*h + c        (6.1)

Реализовать данный метод удобно с помощью таблицы (см. ниже)

6.1. Вычисляем длину интервала группировки
h = x2*- x1*  =…= x*m+1- xm*   = 0.27118 - 0.09073 = 0.18045

6.2. Выбираем c = x11* = 1.89523 (середина ряда)

6.3. Заполняем 4-й столбец величинами yk*. В строке с x11* = c пишем 0, вверх записываем последовательно — 1, —2, и т.д., а вниз — последовательно 1, 2, и т.д.

6.4. Заполняем 5-й столбец величинами yk*nk*. Таблица принимает вид

Номер Интервала
k
Центр Интервала
xk*
nk* yk* yk*nk*
1 0.0907376-10-760
2 0.2711851-9-459
3 0.4516339-8-312
4 0.6320836-7-252
5 0.8125321-6-126
6 0.9929818-5-90
7 1.173439-4-36
8 1.353887-3-21
9 1.534336-2-12
10 1.714786-1-6
11 1.89523400
12 2.07568212
13 2.25613020
14 2.43658133
15 2.61703040
16 2.79748155
17 2.97793166
18 3.15838070
19 3.33883080
20 3.51928090
21 3.6997321020


6.5. Суммируем частоты nk* в 3-м столбце и получаем объем выборки =  280.

6.6. Суммируем числа yk*nk*, в 5-м столбце. Получаем -2038.
      Делим этот результат на n = 280 и получаем величину Y* =  -7.27857.

6.7. По формуле (6.1) вычисляем искомое выборочное среднее:

M* = Y*h + c =  -7.27857 •0.18045 + 1.89523 =  0.58181.


ОТВЕТ.
Оценка математического ожидания (выборочное среднее) исходного ряда составляет: 0.581812

7. Вычислим оценку дисперсии (выборочную дисперсию) исходного ряда абсолютных частот.

Оценка дисперсии группированного статистического ряда абсолютных частот определяется формулой
Dx* = 
(x1*- M* )2n1* + (x2*- M* )2n2* + ... + (xm*- M* )2nm*
n-1
 = 
1
n - 1
m
Σ
k = 1
(xn*- M* )2nk*,
где n = n1* + ... + nm* — объем выборки.

Чтобы упростить вычисления и уменьшить погрешность округления, используем так называемый метод произведений.
Заметим, что выборочная дисперсия D* не изменится, если из каждой величины хk* вычесть одно и то же число с. Пусть c — центр того интервала группировки, который находится примерно в середине статистического ряда и h — длина интервала группировки, то величины
yk* = 
xk* - c
h
— целые числа. Поэтому величина
Dy* = 
1
n-1
m
Σ
k = 1
(yk* - Y*)2 nk* = 
1
n ( n-1)
[n
m
Σ
k = 1
y*2k nk* - (
m
Σ
k = 1
y*k nk*)2]        (7.1)
вычисляется очень просто. Искомое выборочная дисперсия Dx* выражается через Dy* по формуле
Dx* = h2 Dy*        (7.2)

Реализовать данный метод удобно с помощью таблицы (см. ниже)

7.1. Вычисляем длину интервала группировки
h = x2*- x1*  =…= x*m+1- xm*   = 0.27118 - 0.09073 = 0.18045

7.2. Выбираем c = x11* = 1.89523 (середина ряда)

7.3. Заполняем 4-й столбец величинами yk*. В строке с x11* = c пишем 0, вверх записываем последовательно — 1, —2, и т.д., а вниз — последовательно 1, 2, и т.д.

7.4. Заполняем 5-й столбец величинами yk*nk*.

7.5. Заполняем 6-й столбец величинами yk*2. В строке с x11* = c пишем 0, вверх записываем последовательно квадраты натуральных чисел 1, 4, 9, 16, 25 и т.д., и вниз также последовательно 1, 4, 9, 16, 25 и т.д.


7.6. Заполняем 7-й столбец величинами ( yk* )2nk*. Таблица принимает вид

Номер Интервала
k
Центр Интервала
xk*
nk* yk* yk*nk* yk*2 yk*2nk*
1 0.0907376-10-7601007600
2 0.2711851-9-459814131
3 0.4516339-8-312642496
4 0.6320836-7-252491764
5 0.8125321-6-12636756
6 0.9929818-5-9025450
7 1.173439-4-3616144
8 1.353887-3-21963
9 1.534336-2-12424
10 1.714786-1-616
11 1.8952340000
12 2.0756821212
13 2.2561302040
14 2.4365813399
15 2.61703040160
16 2.797481552525
17 2.977931663636
18 3.15838070490
19 3.33883080640
20 3.51928090810
21 3.6997321020100200


7.5. Суммируем частоты nk* в 3-м столбце и получаем объем выборки =  280.

7.6. Суммируем числа yk*nk*, в 5-м столбце. Получаем -2038.
      Возводим это число в квадрат и получаем 4153444.

7.7. Суммируем числа yk*2nk*, в 7-м столбце. Получаем 17706.

7.8. По формуле (7.1) вычисляем D*y:
D*y = 
1
280 • 279
[280 • 17706 - 4153444] ≈ 10.294880
.

7.9. По формуле (7.2) вычисляем D*x:
Dx* = h2 Dy* = 0.180452 • 10.294880 ≈ 0.335224


ОТВЕТ.
Оценка дисперсии (выборочная дисперсия) исходного ряда составляет: 0.335224



см. пример обработки не сгруппированной выборки...

решить мою задачу...
на ввод условия...

к списку решаемых задач...
Яндекс цитирования Ramblers Top100 Союз образовательных сайтов