Высшая Mатематика Решение задач - OnLine
./ Главная /Статистическая обработка выборки, ШАГ-1/Пример >

Пример статистической обработки выборки нашим сервисом:
(статистические ряды, полигоны частот, гистограмма, функция распределения, математическое ожидание, дисперсия)



Заметьте! Решение вашей конкретной задачи будет выглядеть аналогично данному примеру, включая все таблицы и поясняющие тексты, представленные ниже, но с учетом ваших исходных данных…


Задача:
Дана выборка из 280 элементов (x1 x2 … x280):

0.34140001   0.05440002   0.56650003   0.57290004   0.52210005   1.04810006   0.20630007   0.42330008   0.07650009   0.69720010   0.51630011   0.88180012   0.18650013   0.17910014   0.94680015   0.10720016   1.56170017   1.18700018   0.15530019   0.44800020   0.58210021   0.98180022   1.06170023   0.06520024   3.71570025   1.83440026   0.74580027   0.75400028   0.01070029   0.20800030   0.57070031   0.03530032   0.09610033   1.77040034   0.24730035   0.48910036   0.11720037   0.60370038   1.02790039   0.69480040   0.23940041   0.60250042   0.23990043   0.57440044   0.01050045   0.80140046   1.80420047   0.45470048   0.15940049   0.73040050   0.23850051   0.13130052   0.46850053   0.20880054   0.31420055   0.24770056   0.05900057   0.87010058   0.47430059   0.10350060   0.04240061   0.46400062   0.19730063   1.24520064   0.68120065   0.23910066   0.60180067   0.13840068   0.38420069   1.90740070   0.83350071   0.11280072   0.42200073   0.73350074   0.13840075   0.51900076   1.00300077   1.25200078   0.18680079   0.12190080   0.10840081   1.23420082   0.04550083   0.14260084   2.07120085   0.04350086   0.24320087   1.48300088   1.34630089   0.15510090   0.10510091   0.19470092   0.49450093   0.14890094   0.03000095   1.96870096   0.24590097   0.24110098   0.07860099   0.17040100   0.05170101   0.30010102   0.18810103   0.39890104   0.36360105   0.49060106   0.56150107   0.23070108   0.05980109   0.30590110   0.46180111   0.66180112   0.64310113   0.71810114   0.19270115   0.23410116   0.84410117   0.06660118   0.58140119   0.46690120   0.07060121   0.38720122   0.31620123   0.02930124   0.36350125   0.67080126   0.91150127   0.21490128   0.13790129   0.02400130   0.23680131   3.06680132   0.59520133   0.96000134   0.76500135   0.02660136   0.19710137   0.24530138   0.28170139   0.54820140   1.00750141   0.90340142   0.15310143   1.54070144   0.37120145   0.43050146   0.69890147   1.34170148   1.08660149   0.56810150   0.37560151   0.95970152   0.79060153   0.10070154   0.53980155   0.44890156   0.16000157   0.00090158   0.02790159   0.17460160   0.11380161   0.41970162   0.74430163   0.25430164   1.04000165   0.17370166   0.61060167   0.05110168   0.28370169   0.64040170   0.83040171   0.21860172   0.41190173   0.14630174   0.36070175   0.14910176   0.07130177   0.58140178   2.80450179   1.30630180   0.11380181   0.03430182   0.15600183   0.07780184   0.04720185   0.27490186   0.32990187   1.49980188   1.64030189   0.00240190   0.02500191   0.44240192   1.54460193   0.94420194   0.64160195   1.09490196   0.30040197   0.04130198   0.76200199   0.75770200   0.35380201   0.60520202   0.31540203   0.32420204   0.13910205   0.61200206   0.02160207   0.13700208   1.61860209   0.23100210   0.83140211   1.28080212   0.87310213   0.06160214   0.34510215   0.94480216   0.74920217   0.77610218   0.02140219   0.41200220   0.09400221   0.16230222   0.63930223   0.12660224   1.72260225   1.67580226   0.37480227   0.54880228   0.08420229   0.91460230   1.07240231   1.67460232   0.39210233   1.21220234   0.35260235   0.02640236   0.46800237   0.78170238   0.33670239   1.24490240   0.03980241   1.28270242   0.41340243   0.04290244   0.69580245   0.64100246   0.98060247   2.50540248   0.48580249   0.22810250   2.15280251   0.67250252   3.79000253   0.00050254   0.37570255   0.67270256   0.42080257   1.86630258   0.26490259   0.28020260   1.15880261   0.13390262   0.01460263   0.49410264   0.88260265   0.33200266   0.28140267   0.27690268   0.66070269   1.29850270   0.96480271   0.53880272   0.32880273   0.50510274   0.65110275   0.15950276   0.02530277   1.36220278   0.14050279   0.69730280  

Требуется построить (вычислить):
   - группированный статистический ряд абсолютных частот из 21 члена(ов);
   - группированный статистический ряд относительных частот из 21 члена(ов);
   - полигон абсолютных частот;
   - полигон относительных частот;
   - гистограмму относительных частот;
   - эмпирическую функцию распределения;
   - выборочное среднее (Оценку математического ожидания);
   - выборочную дисперсию (Оценку дисперсии);



РЕШЕНИЕ:

1. Строим группированный статистический ряд абсолютных частот.

Группированным статистическим рядом абсолютных частот называется последовательность пар чисел
(x1* , n1*) ,  (x2* , n2*) ,…,  (xm* , nm*)
где xk* — центр k-го интервала группировки и n1* — число элементов выборки, попавших в k-й интервал.
Числа  nk*   ( k = 1,…,m ) называются абсолютными частотами.



1.1. Находим минимальный и максимальный элемент выборки, это 254-й и 253-й элементы соответственно, xmin =  0.00050 и xmax =  3.79000.

1.2. Находим длину интервала группировки h = (xmax - xmin) / m =  ( 3.79000 -  0.00050) / 21  =  0.18045.
Здесь m = 21 -  число интервалов группировки.

1.3. Находим правые границы интервалов группировки: xk = xmin + kh   (к = 1,..., 21).
Получаем

0.18095   0.36140   0.54186   0.72231   0.90276   1.08321   1.26367   1.44412   1.62457   1.80502   1.98548   2.16593   2.34638   2.52683   2.70729   2.88774   3.06819   3.24864   3.42910   3.60955   3.79000  

1.4. Находим центры x*k интервалов группировки по формуле: x*k = xk - h/2   (к = 1,..., 21).
Получаем

0.09073   0.27118   0.45163   0.63208   0.81254   0.99299   1.17344   1.35389   1.53435   1.71480   1.89525   2.07570   2.25615   2.43661   2.61706   2.79751   2.97796   3.15842   3.33887   3.51932   3.69977  

1.5. Для каждого интервала группировки (xk-1 , xk) находим число nk* элементов выборки, попавших в этот интервал. Важно чтобы каждый элемент выборки был отнесен к одному и только к одному интервалу, а если значение элемента попадает на границу интервала, то будем относить его к интервалу с младшим номером. Минимальный элемент всегда относим к первому интервалу, максимальный к последнему. Для облегчения работы воспользуемся приведенной ниже таблицей

Номер Интервала
k
Центр Интервала
xk*
Границы ИнтервалаПопало в Интервал
nk*
Номера элементов попавших в интервал
1 0.09073 0.00050... 0.1809576 2 9 14 16 19 24 29 32 33 37 45 49 52 57 60 61 68 72 75 80 81 83 84 86 90 91 94 95 99 100 101 109 118 121 124 129 130 136 143 154 157 158 159 160 161 166 168 174 176 177 181 182 183 184 185 190 191 198 205 207 208 214 219 221 222 224 229 236 241 244 254 262 263 276 277 279
2 0.27118 0.18095... 0.3614051 1 7 13 30 35 41 43 51 54 55 56 63 66 79 87 92 97 98 102 103 108 110 115 116 123 128 131 137 138 139 164 169 172 175 186 187 197 201 203 204 210 215 235 239 250 259 260 266 267 268 273
3 0.45163 0.36140... 0.5418639 5 8 11 20 36 48 53 59 62 69 73 76 93 104 105 106 111 120 122 125 145 146 151 155 156 162 173 192 220 227 233 237 243 249 255 257 264 272 274
4 0.63208 0.54186... 0.7223136 3 4 10 21 31 38 40 42 44 65 67 107 112 113 114 119 126 133 140 147 150 167 170 178 195 202 206 223 228 245 246 252 256 269 275 280
5 0.81254 0.72231... 0.9027621 12 27 28 46 50 58 71 74 117 135 153 163 171 199 200 211 213 217 218 238 265
6 0.99299 0.90276... 1.0832118 6 15 22 23 39 77 127 134 141 142 152 165 194 216 230 231 247 271
7 1.17344 1.08321... 1.263679 18 64 78 82 149 196 234 240 261
8 1.35389 1.26367... 1.444127 89 148 180 212 242 270 278
9 1.53435 1.44412... 1.624576 17 88 144 188 193 209
10 1.71480 1.62457... 1.805026 34 47 189 225 226 232
11 1.89525 1.80502... 1.985484 26 70 96 258
12 2.07570 1.98548... 2.165932 85 251
13 2.25615 2.16593... 2.346380 
14 2.43661 2.34638... 2.526831 248
15 2.61706 2.52683... 2.707290 
16 2.79751 2.70729... 2.887741 179
17 2.97796 2.88774... 3.068191 132
18 3.15842 3.06819... 3.248640 
19 3.33887 3.24864... 3.429100 
20 3.51932 3.42910... 3.609550 
21 3.69977 3.60955... 3.790002 25 253

1.6. Убеждаемся, что сумма всех абсолютных частот nk* равна объему выборки 280.
76+51+ ... +2 = 280

ОТВЕТ. Группированный статистический ряд абсолютных частот имеет вид:

xk*    0.09073   0.27118   0.45163   0.63208   0.81254   0.99299   1.17344
nk* 76  51  39  36  21  18  9 

xk*    1.35389   1.53435   1.71480   1.89525   2.07570   2.25615   2.43661
nk* 7  6  6  4  2  0  1 

xk*    2.61706   2.79751   2.97796   3.15842   3.33887   3.51932   3.69977
nk* 0  1  1  0  0  0  2 

2. Строим группированный статистический ряд относительных частот.

Группированным статистическим рядом относительных частот называется последовательность пар чисел
(x1* , n1*/n) ,  (x2* , n2*/n) ,…,  (xm* , nm*/n)
где nk*/n — относительные частоты и n - объем выборки.



2.1. Вычисляем относительные частоты nk*/n, как отношения абсолютных частот к объему выборки. результат представим в виде таблицы:
Номер Интервала
k
Центр Интервала
xk*
nk*nk*/n
1 0.0907376 0.27143
2 0.2711851 0.18214
3 0.4516339 0.13929
4 0.6320836 0.12857
5 0.8125421 0.07500
6 0.9929918 0.06429
7 1.173449 0.03214
8 1.353897 0.02500
9 1.534356 0.02143
10 1.714806 0.02143
11 1.895254 0.01429
12 2.075702 0.00714
13 2.256150 0.00000
14 2.436611 0.00357
15 2.617060 0.00000
16 2.797511 0.00357
17 2.977961 0.00357
18 3.158420 0.00000
19 3.338870 0.00000
20 3.519320 0.00000
21 3.699772 0.00714

2.2. Убеждаемся, что сумма всех относительных частот nk*/n равна единице. (допускается небольшое отличие от единицы в рамках погрешности вычислений)
0.27143+ 0.18214+ ... + 0.00714 = 1.00000

ОТВЕТ. Группированный статистический ряд относительных частот имеет вид:

xk*    0.09073   0.27118   0.45163   0.63208   0.81254   0.99299   1.17344
nk*/n  0.27143   0.18214   0.13929   0.12857   0.07500   0.06429   0.03214 

xk*    1.35389   1.53435   1.71480   1.89525   2.07570   2.25615   2.43661
nk*/n  0.02500   0.02143   0.02143   0.01429   0.00714   0.00000   0.00357 

xk*    2.61706   2.79751   2.97796   3.15842   3.33887   3.51932   3.69977
nk*/n  0.00000   0.00357   0.00357   0.00000   0.00000   0.00000   0.00714 

3. Строим полигон абсолютных частот.

Полигон абсолютных частот группированного статистического ряда абсолютных частот — это ломаная с вершинами в точках (xk* , nk* ). Полигон является одним из графических представлений выборки. Следует тщательно выбрать масштабы и начальные точки на осях, чтобы полигон был максимально наглядным.

3.1. На оси абсцисс выбираем начальную точку чуть левее точки x1* =  0.09073, и такой масштаб, чтобы на оси поместился интервал [x1* , x21* ] = [ 0.09073 ,  3.69977] и отчетливо различались точки xk*.

3.2. На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы на оси поместился интервал
[min{n1*,…,n21* },max{n1*,…,n21* }] = [0 , 76] и отчетливо различались точки nk*.

3.3. На оси абсцисс размещаем значения xk*, а на оси ординат значения nk*.

3.4. Наносим точки (x1*n1* ), (x2*n2* ),…,(x21*n21* ) на координатную плоскость и последовательно соединяем их отрезками. Получаем полигон, изображенный на рисунке ниже.

Полигон абсолютных частот

4. Строим полигон относительных частот.

Полигон относительных частот группированного статистического ряда относительных частот — это ломаная с вершинами в точках (xk* , nk*/n ). Полигон является одним из графических представлений выборки. Следует тщательно выбрать масштабы и начальные точки на осях, чтобы полигон был максимально наглядным.

4.1. На оси абсцисс выбираем начальную точку чуть левее точки x1* =  0.09073, и такой масштаб, чтобы на оси поместился интервал [x1* , x21* ] = [ 0.09073 ,  3.69977] и отчетливо различались точки xk*.

4.2. На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы на оси поместился интервал
[min{n1*/n,…,n21*/n},max{n1*/n,…,n21*/n}] = [ 0.00000 ,  0.27143] и отчетливо различались точки nk*/n.

4.3. На оси абсцисс размещаем значения xk*, а на оси ординат значения nk*/n.

4.4. Наносим точки (x1*n1*/n ), (x2*n2*/n ),…,(x21*n21*/n ) на координатную плоскость и последовательно соединяем их отрезками. Получаем полигон, изображенный на рисунке ниже.

Полигон относительных частот

5. Строим гистограмму относительных частот.

Гистограмма относительных частот — это фигура, состоящая из m прямоугольников, опирающихся на интервалы группировки. Площадь к-ro прямоугольника полагают равной nk*/n, т.е. относительной частоте данного интервала.

5.1. Для построения гистограммы заполним таблицу (см.ниже). Для ее заполнения воспользуемся уже известными значениями границ интервалов и относительных частот представленных в предыдущих двух таблицах, а значения для нового столбца Hk (высота k-го прямоугольника) рассчитаем по формуле: Hk = (nk*/n)/h

Номер Интервала
k
Центр Интервала
xk*
Границы Интервала
[xk-1 , xk ]
nk*/nHk
1 0.09073 0.00050... 0.18095 0.27143 1.50416
2 0.27118 0.18095... 0.36140 0.18214 1.00937
3 0.45163 0.36140... 0.54186 0.13929 0.77187
4 0.63208 0.54186... 0.72231 0.12857 0.71250
5 0.81254 0.72231... 0.90276 0.07500 0.41562
6 0.99299 0.90276... 1.08321 0.06429 0.35625
7 1.17344 1.08321... 1.26367 0.03214 0.17812
8 1.35389 1.26367... 1.44412 0.02500 0.13854
9 1.53435 1.44412... 1.62457 0.02143 0.11875
10 1.71480 1.62457... 1.80502 0.02143 0.11875
11 1.89525 1.80502... 1.98548 0.01429 0.07917
12 2.07570 1.98548... 2.16593 0.00714 0.03958
13 2.25615 2.16593... 2.34638 0.00000 0.00000
14 2.43661 2.34638... 2.52683 0.00357 0.01979
15 2.61706 2.52683... 2.70729 0.00000 0.00000
16 2.79751 2.70729... 2.88774 0.00357 0.01979
17 2.97796 2.88774... 3.06819 0.00357 0.01979
18 3.15842 3.06819... 3.24864 0.00000 0.00000
19 3.33887 3.24864... 3.42910 0.00000 0.00000
20 3.51932 3.42910... 3.60955 0.00000 0.00000
21 3.69977 3.60955... 3.79000 0.00714 0.03958

5.2. Убеждаемся, что сумма всех высот Hk , умноженная на h, равна единице. (допускается небольшое отличие от единицы в рамках погрешности вычислений)

1.50416+ 1.00937+ ... + 0.03958 = 5.54163 ;   5.54163* 0.18045 =  1.00000

5.3. На оси абсцисс выбираем начальную точку чуть левее точки x1 =  0.18095, и такой масштаб, чтобы на оси поместился интервал [x1 , x21 ] = [ 0.18095 ,  3.79000] и отчетливо различались точки xk.

5.4. На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы отчетливо различались Hk

5.5. Для построения гистограммы относительных частот на ось абсцисс наносим интервалы [xk-1 , xk] и, используя каждый из них как основание, строим прямоугольник с соответствующей высотой Hk.
Получаем гистограмму, изображенную на рисунке ниже.

Гистограмма относительных частот

6. Строим эмпирическую функцию распределения.

Эмпирической функцией распределения называется функция F*(x), определенная для всех х от —  до ; таких, что:
1) F*(x) = 0,   для всех x < x*1;.
2) F*(x) = (n1*/n)+(n2*/n)+…+(nk*/n)  для всех x удовлетворяющих условию:  хk*≤ x < х*k+1;
3) F*(x) = 1,   для всех x ≥ x*m;.

6.1. Для построения функции заполним таблицу (см.ниже), в колонку F*(x) будем записывать накопленные относительные частоты
F*(x1*) = n1*/n
F*(x2*) = (n1*/n)+(n2*/n)
F*(x3*) = (n1*/n)+(n2*/n)+(n3*/n)  и т.д.

Номер Интервала
k
Центр Интервала
xk*
nk*/nF*(xk*)
1 0.09073 0.27143 0.27143
2 0.27118 0.18214 0.45357
3 0.45163 0.13929 0.59286
4 0.63208 0.12857 0.72143
5 0.81254 0.07500 0.79643
6 0.99299 0.06429 0.86071
7 1.17344 0.03214 0.89286
8 1.35389 0.02500 0.91786
9 1.53435 0.02143 0.93929
10 1.71480 0.02143 0.96071
11 1.89525 0.01429 0.97500
12 2.07570 0.00714 0.98214
13 2.25615 0.00000 0.98214
14 2.43661 0.00357 0.98571
15 2.61706 0.00000 0.98571
16 2.79751 0.00357 0.98929
17 2.97796 0.00357 0.99286
18 3.15842 0.00000 0.99286
19 3.33887 0.00000 0.99286
20 3.51932 0.00000 0.99286
21 3.69977 0.00714 1.00000

6.2. На оси абсцисс выбираем начальную точку чуть левее точки x1* =  0.09073, и такой масштаб, чтобы на оси поместился интервал [x1* , x21* ] = [ 0.09073 ,  3.69977] и отчетливо различались точки xk*.

6.3. На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы на оси поместился интервал
[0 , 1] и отчетливо различались точки nk*/n.

6.4. Для построения графика эмпирической функции распределения наносим на ось абсцисс интервалы [xk* , xk+1*] и над каждым из них на высоте F*(xk* ) строим горизонтальные отрезки. В правом конце отрезка помещаем стрелку, чтобы показать, что F*(xk* ) в точке x*k+1 делает прыжок в высоту на F*(x*k+1 ) — F*(xk* ) = n*k+1 /n.
Получаем график эмпирической функции распределения, изображенный на рисунке ниже.

Эмпирическая функция распределения

7. Вычислим оценку математического ожидания (выборочное среднее) исходной выборки.

Оценка математического ожидания (выборочное среднее) не сгруппированной выборки (x1 x2 … x280) вычисляется по формуле:
M* = 
x1 + x2 + ... + xn
n
 = 
1
n
n
Σ
k = 1
xk
При больших объемах выборки числитель и знаменатель дроби могут принимать большие значения, что, в свою очередь, может привести к потере точности. Поэтому при практических вычислениях лучше избегать суммирования большого числа слагаемых. В нашем случае объем выборки n = 280, и поэтому лучше суммировать по 10 элементов:

S1 = x1 +…+ x10,
S2 = x11 +…+ x20,
- - - - - - - - - - - 
S28 = x271 +…+ x280,

Затем делим S1, S2,..., S28 на 10.
В дробях  s1 = 
S1
10
,  s2 = 
S2
10
,  s28 
S28
10
числитель и знаменатель не столь велики, как в исходной формуле
затем вычисляем
M* = 
s1 + s2 + ... + s28
28

7.1. Складывая последовательно по десять элементов выборки получим следующие значения для Sk :

   4.50870   6.16970   9.95940   5.65250   5.61680   3.11590   5.90100
   5.32290   6.87300   3.67790   2.95090   4.87060   3.12590   6.92270
   8.10170   3.57870   4.33160   6.88050   4.17640   6.55410   4.35790
   6.29550   6.34300   7.56160   7.31550   10.49640   5.53350   5.37340

7.2. Каждое из чисел S1, S2,…, S28 делим на 10. Получаем 28 чисел sk = Sk/10 :

   0.45087   0.61697   0.99594   0.56525   0.56168   0.31159   0.59010
   0.53229   0.68730   0.36779   0.29509   0.48706   0.31259   0.69227
   0.81017   0.35787   0.43316   0.68805   0.41764   0.65541   0.43579
   0.62955   0.63430   0.75616   0.73155   1.04964   0.55335   0.53734

7.3. Искомая оценка математического ожидания есть
M* = 
s1 + s2 + ... + s28
28
 = 
16.15677
28
 =  0.577027.


ОТВЕТ.
Оценка математического ожидания (выборочное среднее) исходной выборки составляет: 0.577027

8. Вычислим оценку дисперсии (выборочную дисперсию) исходной выборки.

Оценка дисперсии, не сгруппированной выборки (x1 x2 … x280) вычисляется по формуле:
D* = 
(x1- M* )2 + (x2- M* )2 + ... + (xn- M* )2
n-1
 = 
1
n - 1
n
Σ
k = 1
(xn- M* )2,
где M*— оценка математического ожидания (выборочное среднее).
Вычисляем выборочную дисперсию по указанной формуле с n = 280. Получаем

D* = 
(0.3414- 0.577027)2 + (0.0544- 0.577027)2 + ... + (0.6973- 0.577027)2
279
 =  0.343907



ОТВЕТ.
Оценка дисперсии исходной выборки составляет : 0.343907



см. пример обработки ряда абсолютных частот...

решить мою задачу...
на ввод условия...

к списку решаемых задач...
Яндекс цитирования Ramblers Top100 Союз образовательных сайтов