Построить вариационный ряд размер обуви примеры. Построение интервального вариационного ряда для непрерывных количественных данных

Ряды, построенные по количественному признаку , называются вариационным .

Ряды распределений состоят из вариантов (значений признака) и частот (численности групп). Частоты, выраженные в виде относительных величин (долей, процентов) называются частостями . Сумма всех частот называется объёмом ряда распределения.

По виду ряды распределения делятся на дискретные (построены по прерывным значениям признака) и интервальные (построены на непрерывных значениях признака).

Вариационный ряд представляет собой две колонки (или строки); в одной из которых приводятся отдельные значения варьирующего признака, именуемые вариантами и обозначаемые Х; а в другой – абсолютные числа, показывающие сколько раз (как часто) встречается каждый вариант. Показатели второй колонки называются частотами и условно обозначают через f. Еще раз заметим, что во второй колонке могут использоваться и относительные показатели, характеризующие долю частоты отдельных вариантов в общей сумме частот. Эти относительные показатели именуются частостями и условно обозначают через ω Сумма всех частостей в этом случае равна единице. Однако частоты можно выражать и в процентах, и тогда сумма всех частостей дает 100%.

Если варианты вариационного ряда выражены в виде дискретных величин, то такой вариационный ряд именуют дискретным.

Для непрерывных признаков вариационные ряды строятся как интервальные , то есть значения признака в них выражаются «от… до …». При этом минимальны значения признака в таком интервале именуют нижней границей интервала, а максимальное – верхней границей.

Интервальные вариационные ряды строят и для дискретных признаков, варьирующих в большом диапазоне. Интервальные ряды могут быть с равными и неравными интервалами.

Рассмотрим как определяется величина равных интервалов. Введем следующие обозначения:

i – величина интервала;

- максимальное значение признака у единиц совокупности;

– минимальное значение признака у единиц совокупности;

n – число выделяемых групп.

, если n известно.

Если число выделяемых групп трудно заранее определить, то для расчета оптимальной величины интервала при достаточном объеме совокупности может быть рекомендована формула, предложенная Стерджессом в 1926 году:

n = 1+ 3.322 lg N, где N – число единиц в совокупности.

Величина неравных интервалов определяется в каждом отдельном случае с учетом особенностей объекта изучения.

Статистическим распределением выборки называют перечень ва­риант и соответствующих им частот (или относительных частот).

Статистическое распределение выборки можно задать в виде таблицы, в первой графе которой располагаются варианты, а во второй - соот­ветствующие этим вариантам частоты ni , или относительные частоты Pi .

Статистическое распределение выборки

Интервальными называются вариационные ряды, в которых значе­ния признаков, положенных в основу их образования, выражены в определенных пределах (интервалах). Частоты в этом случае относятся, не к отдельным значениям признака, а ко всему интервалу.

Интервальные ряды распределения строятся по непрерывным количе­ственным признакам, а также по дискретным признакам, варьирующим в значительных пределах.

Интервальный ряд можно представить статистическим распределени­ем выборки с указанием интервалов и соответствующих им частот. При этом в качестве частоты интервала принимают сумму частот вариант, по­павших в этот интервал.

При группировке по количественным непрерывным признакам важ­ное значение имеет определение размера интервала.

Кроме выборочной средней и выборочной дисперсии применяются и другие характеристики вариационного ряда.

Модой называют варианту, которая имеет наибольшую частоту.

  • Вводный урок бесплатно ;
  • Большое число опытных преподавателей (нейтивов и русскоязычных);
  • Курсы НЕ на определенный срок (месяц, полгода, год), а на конкретное количество занятий (5, 10, 20, 50);
  • Более 10 000 довольных клиентов.
  • Стоимость одного занятия с русскоязычным преподавателем - от 600 рублей , с носителем языка - от 1500 рублей

Понятие вариационного ряда. Первым шагом систематизации материалов статистического наблюдения является подсчет числа единиц, обладающих тем или иным признаком. Расположив единицы в порядке возрастания или убывания их количественного признака и подсчитав число единиц с конкретным значением признака, получаем вариационный ряд. Вариационный ряд характеризует распределение единиц определенной статистической совокупности по какому–либо количественному признаку.

Вариационный ряд представляет собой две колонки, в левой колонке приводятся значения варьирующего признака, именуемые вариантами и обозначаемые (x), а в правой – абсолютные числа, показывающие, сколько раз встречается каждый вариант. Показатели этой колонки называются частотами и обозначаются (f).

Схематично вариационный ряд можно представить в виде табл.5.1:

Таблица 5.1

Вид вариационного ряда

Варианты (x)

Частоты (f)

В правой колонке могут использоваться и относительные показатели, характеризующие долю частоты отдельных вариантов в общей сумме частот. Эти относительные показатели именуют частостями и условно обозначают через , т.е. . Сумма всех частостей равна единице. Частости могут быть выражены и в процентах, и тогда их сумма будет равна 100%.

Варьирующие признаки могут носить разный характер. Варианты одних признаков выражаются в целых числах, например, число комнат в квартире, число изданных книг и т.д. Эти признаки именуют прерывными, или дискретными. Варианты других признаков могут принимать любые значения в определенных пределах, как, например, выполнение плановых заданий, заработная плата и др. Эти признаки называют непрерывными.

Дискретный вариационный ряд. Если варианты вариационного ряда выражены в виде дискретных величин, то такой вариационный ряд называют дискретным, его внешний вид представлен в табл. 5.2:

Таблица 5.2

Распределение студентов по оценкам, полученным на экзамене

Оценки (х)

Количество студентов (f)

В % к итогу ()

Характер распределения в дискретных рядах изображается графически в виде полигона распределения, рис.5.1.

Рис. 5.1. Распределение студентов по оценкам, полученным на экзамене.

Интервальный вариационный ряд. Для непрерывных признаков вариационные ряды строятся интервальные, т.е. значения признака в них выражаются в виде интервалов «от и до». При этом минимальное значение признака в таком интервале именуют нижней границей интервала, а максимальное – верхней границей интервала.

Интервальные вариационные ряды строят как для прерывных признаков (дискретных), так и для варьирующих в большом диапазоне. Интервальные ряды могут быть с равными и неравными интервалами. В экономической практике в большинстве своем применяются неравные интервалы, прогрессивно возрастающие или убывающие. Такая необходимость возникает особенно в тех случаях, когда колеблемость признака осуществляется неравномерно и в больших пределах.

Рассмотрим вид интервального ряда с равными интервалами, табл. 5.3:

Таблица 5.3

Распределение рабочих по выработке

Выработка, т.р. (х)

Число рабочих (f)

Кумулятивная частота (f´)

Интервальный ряд распределения графически изображается в виде гистограммы, рис.5.2.

Рис.5.2. Распределение рабочих по выработке

Накопленная (кумулятивная) частота. В практике возникает потребность в преобразовании рядов распределения в кумулятивные ряды, строящиеся по накопленным частотам. С их помощью можно определить структурные средние, которые облегчают анализ данных ряда распределения.

Накопленные частоты определяются путем последовательного прибавления к частотам (или частостям) первой группы этих показателей последующих групп ряда распределения. Для иллюстрации рядов распределения используются кумуляты и огивы. Для их построения на оси абсцисс отмечаются значения дискретного признака (или концы интервалов), а на оси ординат – нарастающие итоги частот (кумулята), рис.5.3.

Рис. 5.3. Кумулята распределения рабочих по выработке

Если шкалы частот и вариантов поменять местами, т.е. на оси абсцисс отражать накопленные частоты, а на оси ординат – значения вариантов, то кривая, характеризующая изменение частот от группы к группе, будет носит название огивы распределения, рис.5.4.

Рис. 5.4. Огива распределения рабочих по выработке

Вариационные ряды с равными интервалами обеспечивают одно из важнейших требований, предъявляемых к статистическим рядам распределения, обеспечение сравнимости их во времени и пространстве.

Плотность распределения. Однако частоты отдельных неравных интервалов в названных рядах непосредственно не сопоставимы. В подобных случаях для обеспечения необходимой сравнимости исчисляют плотность распределения, т.е. определяют, сколько единиц в каждой группе приходится на единицу величины интервала.

При построении графика распределения вариационного ряда с неравными интервалами высоту прямоугольников определяют пропорционально не частотам, а показателям плотности распределения значений изучаемого признака в соответствующих интервалах.

Составление вариационного ряда и его графическое изображение является первым шагом обработки исходных данных и первой ступенью анализа изучаемой совокупности. Следующим шагом в анализе вариационных рядов является определение основных обобщающих показателей, именуемых характеристиками ряда. Эти характеристики должны дать представление о среднем значении признака у единиц совокупности.

Средняя величина . Средняя величина представляет собой обобщенную характеристику изучаемого признака в исследуемой совокупности, отражающая ее типический уровень в расчете на единицу совокупности в конкретных условиях места и времени.

Средняя величина всегда именованная, имеет ту же размерность, что и признак у отдельных единиц совокупности.

Перед вычислением средних величин необходимо произвести группировку единиц исследуемой совокупности, выделив качественно однородные группы.

Средняя, рассчитанная по совокупности в целом называется общей средней, а для каждой группы – групповыми средними.

Существуют две разновидности средних величин: степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая); структурные (мода, медиана, квартили, децили).

Выбор средней для расчета зависит от цели.

Виды степенных средних и методы их расчета. В практике статистической обработки собранного материала возникают различные задачи, для решения которых требуются различные средние.

Математическая статистика выводит различные средние из формул степенной средней:

где средняя величина; x – отдельные варианты (значения признаков); z – показатель степени (при z = 1 – средняя арифметическая, z = 0 средняя геометрическая, z = - 1 – средняя гармоническая, z = 2 – средняя квадратическая).

Однако вопрос о том, какой вид средней необходимо применить в каждом отдельном случае, разрешается путем конкретного анализа изучаемой совокупности.

Наиболее часто встречающимся в статистике видом средних величин является средняя арифметическая . Она исчисляется в тех случаях, когда объем осредняемого признака образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности.

В зависимости от характера исходных данных средняя арифметическая определяется различными способами:

Если данные несгруппированные, то расчет ведется по формуле простой средней величины

Расчет средней арифметической в дискретном ряду происходит по формуле 3.4.

Расчет средней арифметической в интервальном ряду. В интервальном вариационном ряду, где за величину признака в каждой группе условно принимается середина интервала, средняя арифметическая может отличаться от средней, рассчитанной по несгруппированным данным. Причем, чем больше величина интервала в группах, тем больше возможные отклонения средней, вычисленной по сгруппированным данным, от средней, рассчитанной по несгруппированным данным.

При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят к их серединам. А затем рассчитывают среднюю величину по формуле средней арифметической взвешенной.

Свойства средней арифметической. Средняя арифметическая обладает некоторыми свойствами, которые позволяют упрощать вычисления, рассмотрим их.

1. Средняя арифметическая из постоянных чисел равна этому постоянному числу.

Если х = а. Тогда .

2. Если веса всех вариантов пропорционально изменить, т.е. увеличить или уменьшить в одно и то же число раз, то средняя арифметическая нового ряда от этого не изменится.

Если все веса f уменьшить в k раз, то .

3. Сумма положительных и отрицательных отклонений отдельных вариантов от средней, умноженных на веса, равна нулю, т.е.

Если , то . Отсюда .

Если все варианты уменьшить или увеличить на какое- либо число, то средняя арифметическая нового ряда уменьшится или увеличится на столько же.

Уменьшим все варианты x на a , т.е. x ´ = x a.

Тогда

Среднюю арифметическую первоначального ряда можно получить, прибавляя к уменьшенной средней ранее вычтенное из вариантов числа a , т.е. .

5. Если все варианты уменьшить или увеличить в k раз, то средняя арифметическая нового ряда уменьшится или увеличится во столько же, т.е. в k раз.

Пусть , тогда .

Отсюда , т.е. для получения средней первоначального ряда среднюю арифметическую нового ряда (с уменьшенными вариантами) надо увеличить в k раз.

Средняя гармоническая. Средняя гармоническая это величина обратная средней арифметической. Ее используют, когда статистическая информация не содержит частот по отдельным вариантам совокупности, а представлена как их произведение (М= xf). Средняя гармоническая будет рассчитываться по формуле 3.5

Практическое применение средней гармонической – для расчета некоторых индексов, в частности, индекса цен.

Средняя геометрическая. При применении средней геометрической индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста.

Средняя геометрическая величина используется также для определения равноудаленной величины от максимального и минимального значений признака. Например, страховая компания заключает договоры на оказание услуг автострахования. В зависимости конкретного страхового случая страховая выплата может колебаться от 10000 до 100000 долл. в год. Средняя сумма выплат по страховке составит долл.

Средняя геометрическая это величина, используемая как средняя из отношений или в рядах распределения, представленных в виде геометрической прогрессии, когда z = 0. Этой средней удобно пользоваться, когда уделяется внимание не абсолютным разностям, а отношениям двух чисел.

Формулы для расчета следующие

где – варианты осредняемого признака; – произведение вариантов; f – частота вариантов.

Средняя геометрическая используется в расчетах среднегодовых темпов роста.

Средняя квадратическая. Формула средней квадратической используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения. Так, при расчете показателей вариации среднюю вычисляют из квадратов отклонений индивидуальных значений признака от средней арифметической величины.

Средняя квадратическая величина рассчитывается по формуле

В экономических исследованиях средняя квадратическая в измененном виде широко используется при расчете показателей вариации признака, таких как дисперсия, среднее квадратическое отклонение.

Правило мажорантности. Между степенными средними существует следующая зависимость – чем больше показатель степени, тем больше значение средней, табл.5.4:

Таблица 5.4

Соотношение между средними величинами

Значение z

Соотношение между средними

Это соотношение называется правилом мажорантности.

Структурные средние величины. Для характеристики структуры совокупности применяются особые показатели, которые можно назвать структурными средними. К таким показателям относятся мода, медиана, квартили и децили.

Мода. Модой (Мо) называется наиболее часто встречающееся значение признака у единиц совокупности. Модой называется то значение признака, которое соответствует максимальной точке теоретической кривой распределения.

Мода широко используется в коммерческой практике при изучении покупательского спроса (при определении размеров одежды и обуви, которые пользуются широким спросом), регистрации цен. Мод в совокупности может быть несколько.

Расчет моды в дискретном ряду. В дискретном ряду мода – это варианта с наибольшей частотой. Рассмотрим нахождение моды в дискретном ряду.

Расчет моды в интервальном ряду. В интервальном вариационном ряду модой приближенно считают центральный вариант модального интервала, т.е. того интервала, который имеет наибольшую частоту (частость). В пределах интервала надо найти то значение признака, которое является модой. Для интервального ряда мода будет определяться формулой

где – нижняя граница модального интервала; – величина модального интервала; – частота, соответствующая модальному интервалу; – частота, предшествующая модальному интервалу; – частота интервала, следующего за модальным.

Медиана. Медианой () называется значение признака у средней единицы ранжированного ряда. Ранжированный ряд – это ряд, у которого значения признака записаны в порядке возрастания или убывания. Или медиана это величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значение варьирующего признака меньшие, чем средний вариант, а другая – большие.

Чтобы найти медиану, сначала определяется ее порядковый номер. Для этого при нечетном числе единиц к сумме всех частот прибавляется единица и все делится на два. При четном числе единиц медиана отыскивается как значение признака у единицы, порядковый номер который определяется по общей сумме частот, деленной на два. Зная порядковый номер медианы, легко по накопленным частотам найти ее значение.

Расчет медианы в дискретном ряду. По данным выборочного обследования получены данные о распределении семей по числу детей, табл. 5.5. Для определения медианы сначала определим ее порядковый номер

=

Затем построим ряд накопленных частот (, по порядковому номеру и накопленной частоте найдем медиану. Накопленная частота 33 показывает, что в 33 семьях количество детей не превышает 1 ребенка, но так как номермедианы 50, то медиана будет находится в промежутке с 34 по 55 семью.

Таблица 5.5

Распределение числа семей от количества детей

Число детей в семье

Количество семей, –величина медианного интервала;

Все рассмотренные формы степенной средней обладают важным свойством (в отличие от структурных средних) – в формулу определения средней входят все значения ряда т.е. на размеры средней оказывают влияние значение каждого варианта.

С одной стороны, это весьма положительное свойство т.к. в этом случае учитывается действие всех причин, воздействующих на все единицы изучаемой совокупности. С другой стороны, даже одно наблюдение, попавшее в исходные данные случайно, может существенным образом исказить представление об уровне развития изучаемого признака в рассматриваемой совокупности (особенно в коротких рядах).

Квартили и децили. По аналогии с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку единицы ранжированного ряда. Так, в частности, можно найти значение признака у единиц, делящих ряд на 4 равные части, на 10 и т.п.

Квартили. Варианты, которые делят ранжированный ряд на четыре равные части, называют квартилями.

При этом различают: нижний (или первый) квартиль (Q1) – значение признака у единицы ранжированного ряда, делящей совокупность в соотношении ¼ к ¾ и верхний (или третий) квартиль(Q3) – значение признака у единицы ранжированного ряда, делящий совокупность в соотношении ¾ к ¼.

Второй квартиль, есть медиана Q2 = Ме. Нижний и верхний квартили в интервальном ряду рассчитываются по формуле аналогично медиане.

где – нижняя граница интервала, содержащего соответственно нижний и верхний квартиль;

– накопленная частота интервала, предшествующего интервалу, содержащему нижний или верхний квартиль;

– частоты квартильных интервалов (нижнего и верхнего)

Интервалы, в которых содержатся Q1 и Q3 определяют по накопленным частотам (или частостям).

Децили. Кроме квартилей рассчитывают децили – варианты, делящие ранжированный ряд на 10 равных частей.

Обозначаются они через D, первый дециль D1 делит ряд в соотношении 1/10 и 9/10, второй D2 – 2/10 и 8/10 и т.д. Вычисляются они по той же схеме, что и медиана и квартили.

И медиана, и квартили, и децили принадлежат к так называемым порядковым статистикам, под которым понимают вариант, занимающий определенное порядковое место в ранжированном ряду.

Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определённому варьирующему признаку.
В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения .

Наличие общего признака является основой для образования статистической совокупности, которая представляет собой результаты описания или измерения общих признаков объектов исследования.

Предметом изучения в статистике являются изменяющиеся (варьирующие) признаки или статистические признаками.

Виды статистических признаков .

Атрибутивными называют ряды распределения , построенные по качественным признакам. Атрибутивный – это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).
Ряд распределения принято оформлять в виде таблиц. В табл. 2.8 приведён атрибутивный ряд распределения.
Таблица 2.8 - Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов РФ.

Вариационный ряд – это значения признака (или интервалы значений) и их частоты.
Вариационными рядами называют ряды распределения , построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот.
Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду.
Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, её объём.
Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100 %. Вариационный ряд позволяет по фактическим данным оценить форму закона распределения.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды .
Пример дискретного вариационного ряда приведен в табл. 2.9.
Таблица 2.9 - Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ.

В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй – помещены частоты вариационного ряда, в третьей – показатели частости.

Вариационный ряд

В генеральной совокупности исследуется некоторый количественный признак. Из нее случайным образом извлекается выборка объема n , то есть число элементов выборки равно n . На первом этапе статистической обработки производят ранжирование выборки, т.е. упорядочивание чисел x 1 , x 2 , …, x n по возрастанию. Каждое наблюдаемое значение x i называется вариантой . Частота m i – это число наблюдений значения x i в выборке. Относительная частота (частость) w i – это отношение частоты m i к объему выборкиn : .
При изучении вариационного ряда также используют понятия накопленной частоты и накопленной частости. Пусть x некоторое число. Тогда количество вариантов, значения которых меньше x , называется накопленной частотой: для x i n называется накопленной частостью w i max .
Признак называется дискретно варьируемым, если его отдельные значения (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число). Вариационный ряд такого признака называется дискретным вариационным рядом.

Таблица 1. Общий вид дискретного вариационного ряда частот

Значения признака x i x 1 x 2 x n
Частоты m i m 1 m 2 m n

Признак называется непрерывно варьирующим, если его значения отличаются друг от друга на сколь угодно малую величину, т.е. признак может принимать любые значения в некотором интервале. Непрерывный вариационный ряд для такого признака называется интервальным.

Таблица 2. Общий вид интервального вариационного ряда частот

Таблица 3. Графические изображения вариационного ряда

Ряд Полигон или гистограмма Эмпирическая функция распределения
Дискретный
Интервальный
Просматривая результаты проведенных наблюдений, определяют, сколько значений вариантов попало в каждый конкретный интервал. Предполагается, что каждому интервалу принадлежит один из его концов: либо во всех случаях левые (чаще), либо во всех случаях правые, а частоты или частости показывают число вариантов, заключенных в указанных границах. Разности a i – a i +1 называются частичными интервалами. Для упрощения последующих расчетов интервальный вариационный ряд можно заменить условно дискретным. В этом случае серединное значение i -го интервала принимают за вариант x i , а соответствующую интервальную частоту m i – за частоту этого интервала.
Для графического изображения вариационных рядов наиболее часто используются полигон, гистограмма, кумулятивная кривая и эмпирическая функция распределения.

В табл. 2.3 (Группировка населения России по размеру среднедушевого дохода в апреле 1994г.) представлен интервальный вариационный ряд .
Удобно ряды распределения анализировать при помощи графического изображения, позволяющего судить и о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма .
Полигон используется при изображении дискретных вариационных рядов .
Изобразим, например графически распределение жилого фонда по типу квартир, (табл. 2.10).
Таблица 2.10 - Распределение жилого фонда городского района по типу квартир (цифры условные).


Рис. Полигон распределения жилого фонда


На оси ординат могут наноситься не только значения частот, но и частостей вариационного ряда.
Гистограмма принимается для изображения интервального вариационного ряда . При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов должна быть пропорциональна частотам. Гистограмма – график, на котором ряд изображен в виде смежных друг с другом столбиков.
Изобразим графически интервальный ряд распределения, приведённый в табл. 2.11.
Таблица 2.11 - Распределение семей по размеру жилой площади, приходящейся на одного человека (цифры условные).
N п/п Группы семей по размеру жилой площади, приходящейся на одного человека Число семей с данным размером жилой площади Накопленное число семей
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ВСЕГО 115 ----


Рис. 2.2. Гистограмма распределения семей по размеру жилой площади, приходящейся на одного человека


Используя данные накопленного ряда (табл. 2.11), построим кумуляту распределения.


Рис. 2.3. Кумулята распределения семей по размеру жилой площади, приходящейся на одного человека


Изображение вариационного ряда в виде кумуляты особенно эффективно для вариационных рядов, частоты которых выражены в долях или процентах к сумме частот ряда.
Если при графическом изображении вариационного ряда в виде кумуляты оси поменять, то мы получим огиву . На рис. 2.4 приведена огива, построенная на основе данных табл. 2.11.
Гистограмма может быть преобразована в полигон распределения, если найти середины сторон прямоугольников и затем эти точки соединить прямыми линиями. Полученный полигон распределения изображён на рис. 2.2 пунктирной линией.
При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах.
Плотность распределения – это частота, рассчитанная на единицу ширины интервала, т.е. сколько единиц в каждой группе приходится на единицу величины интервала. Пример расчета плотности распределения представлен в табл. 2.12.
Таблица 2.12 - Распределение предприятий по числу занятых (цифры условные)
N п/п Группы предприятий по числу занятых, чел. Число предприятий Величина интервала, чел. Плотность распределения
А 1 2 3=1/2
1 До 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ВСЕГО 147 ---- ----

Для графического изображения вариационных рядов может также использоваться кумулятивная кривая . При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путём последовательно суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение.


Рис. 2.4. Огива распределения семей по размеру жилой площади, приходящейся на одного человека

При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат накопленные частоты.

Непрерывный вариационный ряд

Непрерывный вариационный ряд - ряд, построенный на основе количественного статистического признака . Пример . Средняя продолжительность заболеваний осужденных (дней на одного человека) в осенне-зимний период в текущем год составила:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5

Пример решения контрольной работы по математической статистике

Задача 1

Исходные данные : студенты некоторой группы, состоящей из 30 человек сдали экзамен по курсу «Информатика». Полученные студентами оценки образуют следующий ряд чисел:

I. Составим вариационный ряд

m x

w x

m x нак

w x нак

Итого:

II. Графическое представление статистических сведений.

III. Числовые характеристики выборки.

1. Среднее арифметическое

2. Среднее геометрическое

3. Мода

4. Медиана

222222333333333 | 3 34444444445555

5. Выборочная дисперсия

7. Коэффициент вариации

8. Ассиметрия

9. Коэффициент ассиметрии

10. Эксцесс

11. Коэффициент эксцесса

Задача 2

Исходные данные : студенты некоторой группы написали выпускную контрольную работу. Группа состоит из 30 человек. Набранные студентами баллы образуют следующий ряд чисел

Решение

I. Так как признак принимает много различных значений, то для него построим интервальный вариационный ряд. Для этого сначала зададим величину интервала h . Воспользуемся формулой Стэрджера

Составим шкалу интервалов. При этом за верхнюю границу первого интервала примем величину, определяемую по формуле:

Верхние границы последующих интервалов определим по следующей рекуррентной формуле:

, тогда

Построение шкалы интервалов заканчиваем, так как верхняя граница очередного интервала стала больше или равна максимальному значению выборки
.

II. Графическое отображение интервального вариационного ряда

III. Числовые характеристики выборки

Для определения числовых характеристик выборки составим вспомогательную таблицу

Сумма :

1. Среднее арифметическое

2. Среднее геометрическое

3. Мода

4. Медиана

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Выборочная дисперсия

6. Выборочное стандартное отклонение

7. Коэффициент вариации

8. Ассиметрия

9. Коэффициент ассиметрии

10. Эксцесс

11. Коэффициент эксцесса

Задача 3

Условие : цена деления шкалы амперметра равна 0,1 А. Показания округляют до ближайшего целого деления. Найти вероятность того, что при отсчете будет сделана ошибка, превышающая 0,02 А.

Решение.

Ошибку округления отсчета можно рассматривать как случайную величину Х , которая распределена равномерно в интервале между двумя соседними целыми делениями. Плотность равномерного распределения

,

где
- длина интервала, в котором заключены возможные значения Х ; вне этого интервала
В данной задаче длина интервала, в котором заключены возможные значения Х , равна 0,1, поэтому

Ошибка отсчета превысит 0,02 если она будет заключена в интервале (0,02; 0,08). Тогда

Ответ: р =0,6

Задача 4

Исходные данные: математическое ожидание и стандартное отклонение нормально распределенного признака Х соответственно равны 10 и 2. Найти вероятность того, чтов результате испытания Х примет значение, заключенное в интервале (12, 14).

Решение.

Воспользуемся формулой

И теоретическими частотами

Решение

Для Х ее математическое ожидание M(X) и дисперсию D(X). Решение . Найдем функцию распределения F(x) случайной величины... ошибка выборки). Составим вариационный ряд Ширина интервала составит : Для каждого значения ряда подсчитаем, какое количество...

  • Решение: уравнение с разделяющимися переменными

    Решение

    В виде Для нахождения частного решения неоднородного уравнения составим систему Решим полученную систему... ; +47; +61; +10; -8. Построить интервальный вариационный ряд . Дать статистические оценки среднего значения...

  • Решение: Проведем расчет цепных и базисных абсолютных приростов, темпов роста, темпов прироста. Полученные значения сведем в таблицу 1

    Решение

    Объем производства продукции. Решение : Средняя арифметическая интервального вариационного ряда вычисляется следующим образом: за... Предельная ошибка выборки с вероятностью 0,954 (t=2) составит : Δ w = t*μ = 2*0,0146 = 0,02927 Определим границы...

  • Решение. Признак

    Решение

    О трудовом стаже которых и составили выборку. Средний по выборке стаж... рабочего дня этих сотрудников и составили выборку. Средняя по выборке продолжительность... 1,16, уровень значимости α = 0,05. Решение . Вариационный ряд данной выборки имеет вид: 0,71 ...

  • Рабочая учебная программа по биологии для 10-11 классов Составитель: Поликарпова С. В

    Рабочая учебная программа

    Простейших схем скрещивания» 5 Л.р. «Решение элементарных генетических задач» 6 Л.р. «Решение элементарных генетических задач» 7 Л.р. « ... , 110, 115, 112, 110. Составьте вариационный ряд , начертите вариационную кривую, найдите среднюю величину признака...

  • Группа чисел, объединяемая каким-либо признаком, называется совокупностью.

    Как было отмечено выше, первичный статистический спортивный материал представляет собой группу разрозненных чисел, не дающих тренеру представления о существе явления или процесса. Задача заключается в том, чтобы превратить эту совокупность в систему и воспользоваться ее показателями для получения требуемой информации.

    Составление вариационного ряда как раз и представляет собой формирование определенной математической

    Пример 2. У 34 спортсменов-лыжников зарегистрировано такое время восстановления пульса после прохождения дистанции (в секундах):

    81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;

    85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;

    Как видно, данная группа цифр не несет никакой информации.

    Для составления вариационного ряда вначале производим операцию ранжирования - расположения чисел в порядке возрастания или убывания. Например, в порядке возрастания ранжирование приводит к следующему;

    78; 78; 78; 78; 78; 78;

    81; 81; 81; 81; 81; 81; 81; 81; 81;

    84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;

    В порядке убывания ранжирование приводит к такой группе чисел:

    84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;

    81; 81; 81; 81; 8!; 81: 81; 81; 81;

    78; 78; 78; 78; 78; 78;

    После проведения ранжирования становится очевидной нерациональная форма записи данной группы чисел-одни и те же числа повторяются многократно. Поэтому возникает естественная мысль преобразовать запись таким образом, чтобы указать, какое число сколько раз повторяется. Например, учитывая ранжирование в порядке возрастания:

    Здесь слева записано число, указывающее время восстановления пульса спортсмена, справа-число повторений этого показания в данной группе из 34 спортсменов.

    В соответствии с приведенными выше понятиями о математических символах рассмотренную группу измерений обозначим какой-либо буквой, например х. Учитывая возрастающий порядок чисел в данной группе: х 1 -74 с; х 2 - 78 с; х 3 - 81 с; х 4 - 84 с; х 5 - 85 с; х 6 -х n - 90 с, каждое рассмотренное число можно обозначить символом X i .

    Обозначим число повторений рассмотренных измерений буквой n. Тогда:

    n 1 =4; n 2 =6; n 3 =9; n 4 =11; n 5 =3;n 6 =n n =1, а каждое число повторений можно обозначить как n i .

    Общее число проведенных измерений, как следует из условия примера, есть 34. Это означает, что сумма всех n равна 34. Или в символическом выражении:

    Обозначим эту сумму одной буквой - n. Тогда исходные данные рассматриваемого примера можно записать в таком виде (табл. 1).

    Полученная группа чисел есть преобразованный ряд хаотически рассеянных показаний, полученных тренером в начале работы.

    Таблица 1

    х i n i
    n=34

    Такая группа представляет собой определенную систему, параметры которой характеризуют проведенные измерения. Числа, представляющие собой результаты измерений (х i), называют вариантами; n i - числа их повторений - называются частотами; n - сумма всех частот - есть объем совокупности.

    Вся полученная система называется вариационным рядом. Иногда эти ряды называются эмпирическими или статистическими.

    Нетрудно заметить, что возможен частный случай вариационного ряда, когда все частоты равны единице n i ==1, то есть каждое измерение в данной группе чисел встретилось только один раз.

    Полученный вариационный ряд, как и всякий другой, можно представить графически. Для построения графика полученного ряда, необходимо прежде всего условиться о масштабе на горизонтальной и вертикальной оси.

    В данной задаче на горизонтальной оси будем откладывать значения времени восстановления пульса (х 1) таким образом, что единице длины, избранной произвольно, соответствует значение одной секунды. Откладывать эти значения начнем с 70 секунд, условно отступая от места пересечения двух осей 0.

    На вертикальной оси отложим значения частот нашего ряда (n i), принимая масштаб: единица длины равна единице частоты.

    Подготовив таким образом условия для построения графика, приступаем к работе с полученным вариационным рядом.

    Первую пару чисел х 1 =74, n 1 =4 наносим на график так: на оси х; находим х 1 =74 и восстанавливаем перпендикуляр из этой точки, на оси n находим n 1 =4 и проводим из нее горизонтальную линию до пересечения с восстановленным прежде перпендикуляром. Обе линии-вертикаль и горизонталь-являются линиями вспомогательными и потому наносятся на рисунок пунктиром. Точка их пересечения представляет собой в масштабе данного графика соотношение Х 1 =74 и n 1 =4.

    Таким же образом наносятся все остальные точки графика. Затем они соединяются отрезками прямых. Для того чтобы график имел замкнутый вид, крайние точки соединяем отрезками с соседними точками горизонтальной оси.

    Полученная фигура есть график нашего вариационного ряда (рис. 1).

    Совершенно понятно, что каждый вариационный ряд представляется своим собственным графиком.

    Рис. 1. Графическое представление вариационного ряда.

    На рис. 1 видно:

    1) из всех обследованных наибольшую группу составили спортсмены, время восстановления пульса у которых 84 с;

    2) у многих это время 81 с;

    3) наименьшую группу составили спортсмены с малым временем восстановления пульса - 74 с и большим - 90 с.

    Таким образом, выполнив серию испытаний, следует ранжировать полученные числа и составить вариационный ряд, представляющий собой определенную математическую систему. Для наглядности вариационный ряд можно иллюстрировать графиком.

    Приведенный выше вариационный ряд называется еще дискретным рядом - таким, у которого каждый вариант выражен одним числом.

    Приведем еще несколько примеров на составление вариационных рядов.

    Пример 3. 12 стрелков, выполняя упражнение лежа из 10 выстрелов, показали такие результаты (в очках):

    94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.

    Для образования вариационного ряда произведем ранжирование данных чисел;

    94; 94; 94; 94; 94;

    После ранжирования составляем вариационный ряд (табл. 3).