Полигон частот
Пусть нам дан ряд распределения, записанный с помощью таблицы:
Рисунок 1.
Определение 1
Полигон частот -- ломанная, которая соединяет точки $(x_m,n_m)$ ($m=1,2,\dots ,m)$.
То есть, для построения полигона частот необходимо на оси абсцисс откладывают значения вариант, а по оси ординат соответствующие частоты. Полученные точки соединяют ломанной:
Рисунок 2. Полигон частот.
Помимо обычной частоты существует еще понятие относительной частоты.
Получаем следующую таблицу распределения относительных частот:
Рисунок 3.
Определение 2
Полигон относительных частот -- ломанная, которая соединяет точки $(x_m,W_m)$ ($m=1,2,\dots ,m)$.
То есть, для построения полигона частот необходимо на оси абсцисс откладывают значения вариант, а по оси ординат соответствующие относительные частоты. Полученные точки соединяют ломанной:
Рисунок 4. Полигон относительных частот.
Гистограмма частот
Помимо понятия полинома для непрерывных значений существует понятие гистограммы.
Заметим, что площадь одного такого прямоугольника $\frac{n_ih}{h}=n_i$. Следовательно, площадь всей фигуры равна $\sum{n_i}=n$, то есть равна объему выборки.
Определение 4
Гистограмма относительных частот -- ступенчатая фигура, состоящая из прямоугольников с основанием -- частичными интервалами длины $h$ и высотами $\frac{W_i}{h}$:
Рисунок 6. Гистограмма относительных частот.
Заметим, что площадь одного такого прямоугольника $\frac{W_ih}{h}=W_i$. Следовательно, площадь всей фигуры равна $\sum{W_i}=W=1$.
Примеры задачи на построение полигона и гистограммы
Пример 1
Пусть распределение частот имеет вид:
Рисунок 7.
Построить полигон относительных частот.
Построим сначала ряд распределения относительных частот по формуле $W_i=\frac{n_i}{n}$
Пусть из генеральной совокупности извлечена выборка, причем х 1 наблюдалось п 1 раз, х 2 - п 2 раз, х к - п к раз и - объем выборки. Наблюдаемые значения х 1 называют вариантами, а последовательность вариант, записанных в возрастающем порядке - вариационным рядом .
Число наблюдений варианты называют частотой, а ее отношение к объему выборки - относительной частотой .
Определение. Статистическим (эмпирическим) законом распределения выборки, или просто статистическим распределением выборки называют последовательность вариант и соответствующих им частот п i или относительных частот .
Статистическое распределение выборки удобно представлять в форме таблицы распределения частот, называемой статистическим дискретным рядом распределения:
(сумма всех относительных частот равна единице ).
Пример 1 . При измерениях в однородных группах обследуемых получены следующие выборки: 71, 72, 74, 70, 70, 72, 71, 74, 71, 72, 71, 73, 72, 72, 72, 74, 72, 73, 72,74 (частота пульса). Составить по этим результатам статистический ряд распределения частот и относительных частот.
Решение. 1) Статистический ряд распределения частот:
Контроль: 0,1 + 0,2 + 0,4 + 0,1 + 0,2 = 1.
Полигоном частот называют ломаную, отрезки, которой соединяют точки Для построения полигона частот на оси абсцисс откладывают варианты х 2 , а на оси ординат - соответствующие им частоты п i . Точки соединяют отрезками и получают полигон частот.
Полигоном относительных частот называют ломаную, отрезки, которой соединяют точки . Для построения полигона относительных частот на оси абсцисс откладывают варианты х i , а на оси ординат соответствующие им частоты w i . Точки соединяют отрезками и получают полигон относительных частот
Пример 2. Постройте полигон частот и полигон относительных частот по данным примера 1.
Решение: Используя дискретный статистический ряд распределения, составленный в примере 1 построим полигон частот и полигон относительных частот:
2. Статистический интервальный ряд распределения. Гистограмма .
Статистическим дискретным рядом (или эмпирической функцией распределения) обычно пользуются в том случае, когда отличных друг от друга вариант в выборке не слишком много, или тогда, когда дискретность по тем или иным причинам существенна для исследователя. Если же интерисующий нас признак генеральной совокупности Х распределен непрерывно или его дискретность нецелесообразно (или невозможно) учитывать, то варианты группируются в интервалы.
Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (в качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал).
1. R(размах) = X max -X min
2. k- число групп
3. (формула Стерджеса)
4. a = x min , b = x max
Полученную группировку удобно представить в форме частотной таблицы, которая носит название статистический интервальный ряд распределения:
Интервалы группировки | ... | ||||
Частоты | ... |
Аналогическую таблицу можно образовать, заменяя частоты n i относительными частотами.
В результате обработки и систематизации первичных статистических материалов получаются ряды цифровых статистических показателей, которые характеризуют отдельные стороны изучаемых явлений. Эти ряды называются статистическими.
Статистические ряды бывают двух видов: ряды распределения и ряды динамики (рис. 1).
Статистические ряды
Ряды распределения Ряды динамики
Атрибутивные Вариационные
Дискретные Непрерывные
(Интервальные)
Рисунок 1 – Виды рядов распределения
Ряды распределения – это ряды, которые характеризуют распределение единиц совокупности по какому-либо признаку (например, распределение производственного оборудования по видам и срокам службы). Ряд распределения состоит из двух элементов: вариант – значений группировочного признака и частот – число повторений отдельных вариантов значений признака.
Ряд распределения – группировка, в которой для характеристики групп, упорядоченно расположенных по значению признака, применяется только один показатель - численность групп.
Частоты, представленные в относительном выражении, называют частостями и обозначают .
Например, вместо абсолютного числа рабочих, имеющих определённый разряд, можно установить долю рабочих этого разряда. Частости могут быть выражены в долях единицы или в процентах. Замена частот частостями позволяет сопоставить вариационные ряды с различным числом наблюдений.
По характеру вариации различают дискретные и непрерывные признаки. Дискретные признаки отличаются друг от друга на некоторую конечную величину, то есть даны в виде прерывных чисел. Например, тарифный разряд рабочих, количество детей в семье, число рабочих на предприятии. Непрерывные признаки могут отличаться один от другого на сколь угодно малую величину и в определённых границах принимать любые значения. Например, заработная плата рабочих, стоимость основных фондов предприятия.
Атрибутивный ряд распределения образуется по качественному признаку (распределение рабочих по профессиям, машин – по маркам). Вариационный ряд распределения образуется по количественному признаку. Он состоит из вариант и частот. В дискретном ряде распределения отдельные варианты имеют определённые значения (распределение рабочих по разрядам). В тех случаях, когда число вариантов дискретного признака достаточно велико, а также при анализе вариации непрерывного признака, когда значения этого признака у отдельных единиц могут вообще не повторяться, строятся интервальные ряды распределения. Интервал указывает определённые пределы значений варьирующего признака и обозначается верхней и нижней границей интервала.
Различают ряды распределения с абсолютными, относительными и накопленными частотами. Накопленные частоты называют кумулятивными.
Если приведён вариационный ряд с неравными интервалами, то для правильного представления о характере распределения необходимо рассчитать плотность распределения. Плотность распределения – это количество единиц совокупности, приходящихся на единицу величины интервала группировочного признака. Различают абсолютную () и относительную () плотность:
где – частота;
– удельный вес;
– размер интервала.
По форме ряды распределения бывают одно- двух- и многовершинными. Среди одновершинных распределений есть симметричные и асимметричные (скошенные), остро- и плосковершинные.
Графическое изображение рядов распределения облегчает их анализ и позволяет судить о форме распределения.
Для графического изображения дискретного ряда применяют полигон распределения. Полигон чаще всего используют для изображения дискретных рядов. Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами (xi,mi) , где xi – варианты выборки и mi – соответствующие им частоты. Если полигон строят по данным интервального ряда, то в качестве абсцисс точек берут середины соответствующих интервалов.
Для построения полигона в прямоугольной системе координат в произвольно выбранном масштабе на оси абсцисс откладывают значения аргумента (варианты), а на оси ординат – значения частот. Масштаб выбирают такой, чтобы была обеспечена необходимая наглядность и желательный размер рисунка. Далее строят точки с координатами (xi,mi) и последовательно соединяют их отрезками прямой.
Рисунок 2 – Полигон распределения
Для графического изображения интервальных вариационных рядов применяются гистограммы. Она строится так: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади которых пропорциональны частотам (или частностям) интервала.
Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединяются отрезками прямых. Две крайние точки прямоугольников замыкаются по оси абсцисс на середины интервалов, в которых частоты (частности) равны нулю. При построении гистограммы для вариационного ряда с неравными интервалами следует по оси ординат наносить показатели плотности интервалов (абсолютные или относительные). В этом случае высоты прямоугольников гистограммы будут соответствовать величине плотности распределения.
Рисунок 3 – Гистограмма
При увеличении числа наблюдений из одной и той же совокупности увеличивается число групп интервального ряда, что приводит к уменьшению величины интервала. При этом ломанная линия имеет тенденцию превращения в плавную кривую, которую называют кривой распределения. Кривая распределения характеризует в обобщенном виде вариацию признака и закономерности распределения частот внутри однокачественной совокупности.
Кумулята или кривая накопленных частот в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат – накопленные частоты или частости (рисунок 4).
Накопленной частоты, т. е. число значений, которые попали в этот интервал и все предшествующие.
Рисунок 4 – Кумулята (кривая накопленных частот)
Следует отметить, что кривая накопленных частот не убывает ни на одном участке.
Пример построения группировки рассмотрим в примерах 1 и 2.
Пример 1
Оборот и издержки обращения тридцати торговых предприятий за отчетный период составили (тыс. руб.):
Магазины, № п/п | Оборот | Издержки обращения |
Для выявления зависимости между размером оборота и издержками обращения произведите группировку магазинов по размеру оборота, образовав пять групп магазинов с равными интервалами. В каждой группе и в целом подсчитайте:
1) число магазинов;
2) размер оборота – всего и в среднем на один магазин;
3) издержки обращения – всего и в среднем на один магазин;
4) структуру товарооборота по группам и структуру издержек обращения;
5) уровень издержек обращения
У ИО = | Издержки обращения | ×100%. |
Товарооборот |
6) Решение оформите в разработочной и групповой таблицах. Сделайте выводы, укажите вид группировки. Постройте гистограмму и преобразуйте её в полигон. Постройте кумуляту (кривую накопленных частот).
Решение:
Составим вариационный ряд распределения, упорядочив магазины по товарообороту от большего к меньшему.
Магазины, № п/п | Оборот | Издержки обращения | Магазины, № п/п | Оборот | Издержки обращения |
7 | 341 | 160 | |||
11 | 456 | 242 | 19 | 1199 | 635 |
5 | 1326 | 623 | |||
Определим величину интервала:
, где
i – величина интервала;
Xmax, Xmin – максимальное и минимальное значение признака (1700 и 341 соответственно).
Величина интервала составит:
Определим границы интервалов:
Разнесем по выделенным интервалам предприятия (разработочная таблица):
Определим в каждой группе и в целом объем оборота – всего и в среднем на один магазин и издержки – всего и в среднем на один магазин, для чего составим группировочную таблицу:
Группы предприятий по величине оборота | Число предприятий в группе | Суммарный товарооборот в группе | Средний товарооборот по группе | Суммарные издержки обращения по группе | Средние издержки обращения по группе | Уровень издержек обращения по группе, % |
А | (1) | (2) | (3)=(2)/(1) | (4) | (5)=(4)/(1) | (6)=(4)/(2)*100 |
341-612,8 | 398,5 | 50,44 | ||||
612,8-884,6 | 744,5 | 345,5 | 46,41 | |||
884,6-1156,4 | 998,75 | 482,625 | 48,32 | |||
1156,4-1428,2 | 1262,5 | 49,82 | ||||
1428,2-1700 | 687,417 | 43,65 | ||||
Итого | 34679/30= 1155,97 | 15843/30= 528,1 | 528,1/1155,97*100 = 45,68 |
На основании проведенных расчетов построим гистограмму и полигон.
При построении гистограммы по оси Х откладывают значения признака (границы интервалов), а по оси Y – частоты. Для соответствующего интервала строиться прямоугольник, высота которого соответствует частоте признака (рисунок 5).
Рисунок 5 – Гистограмма
Гистограмма может быть преобразована в полигон, если середины верхних граней прямоугольника соединить прямой линией (рисунок 6).
Рисунок 6 – Полигон распределения
Также построим кумуляту или кривую накопленных частот. В этом случае по оси Х откладываем интервалы признака, а по оси Y – накопленные частоты (это количество единиц совокупности, имеющие значения признака меньше указанного) . Накопленные частоты рассчитаны в таблице.
Кривая накопленных частот представлена на рисунке 7.
Рисунок 7 – Кривая накопленных частот
Вывод: Суммарный товарооборот в первой группе 797 тыс. руб., во второй – 4467 тыс. руб., в третьей – 7990 тыс. руб., в четвертой – 2525 тыс. руб., в пятой – 18900 тыс. руб. Средний товарооборот на один магазин в первой группе 398,5 тыс. руб., во второй – 744,5 тыс. руб., в третьей – 998,75 тыс. руб., в четвертой – 1262,5 тыс. руб., в пятой – 1575 тыс. руб.
Суммарные издержки обращения в первой группе 402 тыс. руб., во второй – 2073 тыс. руб., в третьей – 3861 тыс. руб., в четвертой – 1258 тыс. руб., в пятой – 8249 тыс. руб. Средний издержки обращения в первой группе 201 тыс. руб., во второй – 345,5 тыс. руб., в третьей – 482,625 тыс. руб., в четвертой – 629 тыс. руб., в пятой – 687,417 тыс. руб.
На основании полученных значений можно сделать вывод о прямой зависимости между размером оборота и средними издержек обращения: при росте размера оборота средние издержки обращения увеличиваются. На основании анализа уровня издержек обращения можно сделать вывод, что наиболее конкурентны предприятия пятой группы, поскольку у них уровень издержек ниже среднего.
Пример 2
По данным таблицы постройте ряды распределения домохозяйств, рассчитав число домохозяйств, входящих в те или иные группы:
а) по числу совместно проживающих человек (1,2,3,4 и более)
б) по среднему размеру доходов на душу населения в месяц (образовав 5 групп с равными интервалами)
в) по статусу занятости главы семьи.
№ п/п | Число членов в семье | Статус главы семьи по месту в занятости | |
1. | Самозанятость | ||
2. | По найму | ||
3. | По найму | ||
4. | По найму | ||
5. | По найму | ||
6. | Нет работы | ||
7. | Нет работы | ||
8. | Самозанятость | ||
9. | Нет работы | ||
10. | По найму | ||
11. | По найму | ||
12. | По найму | ||
13. | Самозанятость | ||
14. | По найму | ||
15. | По найму | ||
16. | По найму | ||
17. | По найму | ||
18. | Нет работы | ||
19. | Нет работы | ||
20. | Самозанятость | ||
21. | Нет работы | ||
22. | По найму | ||
23. | По найму | ||
24. | По найму | ||
25. | По найму | ||
26. | По найму | ||
27. | Самозанятость | ||
28. | Нет работы | ||
29. | По найму | ||
30. | По найму | ||
Итого | - | - |
Решение:
Построим ряды распределения домохозяйств, рассчитав число домохозяйств, входящих в те или иные группы:
Общее число семей, имеющих разный статус глав семей по месту в занятости, представлено в таблице. В этом случае группировка строиться по качественному признаку. Число групп совпадает с числом признаков: самозанятость, по найму, нет работы.
Общее число глав семей, имеющих разный статус по месту в занятости (са Общее число семей, имеющих разный статус глав семей по месту в занятости, представлено в таблице. В этом случае группировка строиться по качественному признаку. Число групп совпадает с числом признаков: самозанятость, по найму, нет работы.
Группировка по числу совместно проживающих человек (1,2,3,4 и более), представлено в таблице. В этом случае группировка строиться по количественному дискретному признаку.
Таким образом, 33% всех обследованных семей состоят из трех человек. 13% семей состоят из 4 и более человек. Доли семей, состоящих из 1 человека – 17%, из 2 человек – 37%.
Построим группировку по среднему размеру доходов на душу населения в месяц (образовав 5 групп с равными интервалами);
На начальном этапе проранжируем ряд от меньшего к большему:
Номер домохозяйства | Среднемесячный доход на душу, руб. | Номер домохозяйства | Среднемесячный доход на душу, руб. |
Определим величину интервала по формуле:
, где
i – величина интервала;
n – число групп (в данной задаче 5 группы);
Xmax, Xmin – максимальное и минимальное значение признака.
Величина интервала составит:
Разнесем по выделенным интервалам домашние хозяйства:
Это и будет интервальный ряд распределения.
Рисунок 8 – Гистограмма распределения
Таким образом, в 50% всех обследуемых домашних хозяйствах среднедушевой доход составляет от 4800 рублей до 7460 рублей на человека. Доход от 2140 до 4800 рублей на человека наблюдается в 16% всех семей. Доход от 7460 до 10120 рублей на человека наблюдается в 20% всех обследованных семей. Доля семей, где среднедушевой доход составляет от 10120 до 12780, а также от 12780 до 15440 рублей, равна 7%.
Вопросы для самопроверки
Представляются в виде рядов распределения и оформляются в виде .
Ряд распределния является одним из видов группировок.
Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.
В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:
- Атрибутивными — называют ряды распределения, построенные по качественными признакам.
- Ряды распределения, построенные в порядке возрастания или убывания значений количественного признака называются вариационными .
В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами
и обозначаются . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд.
Во втором столбце содержится количество конкретных вариант
, выраженное через частоты или частости:
Частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака, которые обозначают . Сумма всех частот равна должна быть равна численности единиц всей совокупности.
Частости () — это частоты выраженные в процентах к итогу. Сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.
Графическое изображение рядов распределения
Наглядно ряды распределения представляются при помощи графических изображений.
Ряды распределения изображаются в виде:- Полигона
- Гистограммы
- Кумуляты
- Огивы
Полигон
При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.
Полигон на рис. 6.1 построен по данным микропереписи населения России в 1994 г.
6.1. Распределение домохозяйств по размеруУсловие
: Приводятся данные о распределении 25 работников одного из предприятий по тарифным разрядам:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача
: Построить дискретный вариационный ряд и изобразить его графически в виде полигона распределения.
Решение
:
В данном примере вариантами является тарифный разряд работника. Для определения частот необходимо рассчитать число работников, имеющих соответствующий тарифный разряд.
Полигон используется для дискретных вариационных рядов.
Для построения полигона распределения (рис 1) по оси абсцисс (X) откладываем количественные значения варьирующего признака — варианты, а по оси ординат — частоты или частости.
Если значения признака выражены в виде интервалов, то такой ряд называется интервальным.
Интервальные ряды
распределения изображают графически в виде гистограммы, кумуляты или огивы.
Статистическая таблица
Условие
: Приведены данные о размерах вкладов 20 физических лиц в одном банке (тыс.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Задача
: Построить интервальный вариационный ряд с равными интервалами.
Решение
:
- Исходная совокупность состоит из 20 единиц (N = 20).
- По формуле Стерджесса определим необходимое количество используемых групп: n=1+3,322*lg20=5
- Вычислим величину равного интервала: i=(152 — 2) /5 = 30 тыс.руб
- Расчленим исходную совокупность на 5 групп с величиной интервала в 30 тыс.руб.
- Результаты группировки представим в таблице:
При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), то эта величина относится к той группе, где эта величина выступает в роли верхней границы.
Гистограмма
Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).
На рис. 6.2. изображена гистограмма распределения населения России в 1997 г. по возрастным группам.
Рис. 6.2. Распределение населения России по возрастным группамУсловие : Приводится распределение 30 работников фирмы по размеру месячной заработной платы
Задача
: Изобразить интервальный вариационный ряд графически в виде гистограммы и кумуляты.
Решение
:
- Неизвестная граница открытого (первого) интервала определяется по величине второго интервала: 7000 — 5000 = 2000 руб. С той же величиной находим нижнюю границу первого интервала: 5000 — 2000 = 3000 руб.
- Для построения гистограммы в прямоугольной системе координат по оси абсцисс откладываем отрезки, величины которых соответствуют интервалам варицонного ряда.
Эти отрезки служат нижним основанием, а соответствующая частота (частость) — высотой образуемых прямоугольников. - Построим гистограмму:
Для построения кумуляты необходимо рассчитать накопленные частоты (частости). Они определяются путем последовательного суммирования частот (частостей) предшествующих интервалов и обозначаются S. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое.
Кумулята
Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.
Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат — накопленные частоты или частости (рис. 6.3).
Рис. 6.3. Кумулята распределения домохозяйств по размеру4. Рассчитаем накопленные частоты:
Наколенная частота первого интервала рассчитывается следующим образом: 0 + 4 = 4, для второго: 4 + 12 = 16; для третьего: 4 + 12 + 8 = 24 и т.д.
При построении кумуляты накопленная частота (частость) соответствующего интервала присваивается его верхней границе:
Огива
Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака — на оси ординат.
Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат — накопленные значения доли (в процентах) по объему признака.
Равномерному распределению признака соответствует на графике диагональ квадрата (рис. 6.4). При неравномерном распределении график представляет собой вогнутую кривую в зависимости от уровня концентрации признака.
6.4. Кривая концентрацииДля наглядности строят различные графики статистического распределения, и, в частности, полигон и гистограмму.
Полигон
Полигоном частот называют ломаную, отрезки которой соединяют точки . Для построения полигона частот на оси абсцисс откладывают варианты , а на оси ординат – соответствующие им частоты . Такие точки соединяют отрезками прямых и получают полигон частот.
Полигоном относительных частот называют ломаную, отрезки которой соединяют точки . Для построения полигона относительных частот на оси абсцисс откладывают варианты , а на оси ординат – соответствующие им относительные частоты (частости) . Такие точки соединяют отрезками прямых и получают полигон частот.
Пример 1
Построить полигон частот и полигон относительных частот (частостей):
2 | 7 | 8 | 15 | 16 | 17 | 15 | 35 | 64 | 55 | 21 | 10 |
Вычислим относительные частоты (частости):
Относительные частоты, | 2 | 15 | 0.075 | 7 | 35 | 0.175 | 8 | 64 | 0.320 | 15 | 55 | 0.275 | 16 | 21 | 0.105 | 17 | 10 | 0.050 | Итого | 200 | 1.000 |
Полигон частот
Полигон относительных частот
В случае интервального ряда для построения полигона в качестве берутся середины интервалов.
- К оглавлению решебника по
- Теории вероятностей и математической статистике 〉〉
- Статистике 〉〉
Гистограмма
В случае интервального статистического распределения целесообразно построить гистограмму.
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною , а высоты (в случае равных интервалов) должны быть пропорциональны частотам. При построении гистограммы с неравными интервалами по оси ординат наносят не частоты, а плотность частоты . Это необходимо сделать для устранения влияния величины интервала на распределение и иметь возможность сравнивать частоты.
В случае построения гистограммы относительных частот (гистограммы частостей) высоты в случае равных интегралов должны быть пропорциональны относительной частоте , а в случае неравных интервалов высота равна плотности относительной частоты .
Пример 2
Построить гистограмму частот и относительных частот (частостей)
2-5 | 5-8 | 8-11 | 11-14 | 14-17 | 17-20 | 15 | 35 | 64 | 55 | 21 | 10 |
Вычислим относительные частоты:
Интервалы, | Относительные частоты, | 2 – 5 | 15 | 0.075 | 5 – 8 | 35 | 0.175 | 8 – 11 | 64 | 0.320 | 11 – 14 | 55 | 0.275 | 14 – 17 | 21 | 0.105 | 17 – 20 | 10 | 0.050 | Итого | 200 | 1.000 |
Гистограмма частот
Гистограмма относительных частот
Пример 3
Построить гистограмму частот (случай неравных интервалов).
2-4 | 4-8 | 8-13 | 13-15 | 15-17 | 17-20 | 15 | 35 | 64 | 55 | 21 | 10 |
Вычислим плотности частоты:
Интервалы, | Длина интервала, | Плотность частоты, | 2 – 4 | 15 | 2 | 7.500 | 4 – 8 | 35 | 4 | 8.750 | 8 – 13 | 64 | 5 | 12.800 | 13 – 15 | 55 | 2 | 27.500 | 15 – 17 | 21 | 2 | 10.500 | 17 – 20 | 10 | 3 | 3.333 | Итого | 200 | -- | -- |
Гистограмма частот