Как найти среднее значение коэффициента. Абсолютные приросты, темпы роста и прироста цепные и базисные

5.1. Понятие средней величины

Средняя величина – это обобщающий показатель, характеризующий типический уровень явления. Он выражает величину признака, отнесенную к единице совокупности.

Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В отличие от средней абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака у единиц, относящихся к разным совокупностям. Так, если нужно сопоставить уровни оплаты труда работников на двух предприятиях, то нельзя сравнивать по данному признаку двух работников разных предприятий. Оплата труда выбранных для сравнения работников может быть не типичной для этих предприятий. Если же сравнивать размеры фондов оплаты труда на рассматриваемых предприятиях, то не учитывается численность работающих и, следовательно, нельзя определить, где уровень оплаты труда выше. В конечном итоге сравнить можно лишь средние показатели, т.е. сколько в среднем получает один работник на каждом предприятии. Таким образом, возникает необходимость расчета средней величины как обобщающей характеристики совокупности.

Вычисление среднего – один из распространенных приемов обобщения; средний показатель отрицает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей.

Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов.

Остановимся на некоторых общих принципах применения средних величин.
1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц.
2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц.
3. Средняя должна рассчитываться для совокупности, единицы которой находятся в нормальном, естественном состоянии.
4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя.

5.2. Виды средних и способы их вычисления

Рассмотрим теперь виды средних величин, особенности их исчисления и области применения. Средние величины делятся на два больших класса: степенные средние, структурные средние.

К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая.

В качестве структурных средних рассматриваются мода и медиана.

Остановимся на степенных средних. Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по не сгруппированным данным и имеет следующий общий вид:

где X i – варианта (значение) осредняемого признака;

n – число вариант.

Взвешенная средняя считается по сгруппированным данным и имеет общий вид

,

где X i – варианта (значение) осредняемого признака или серединное значение интервала, в котором измеряется варианта;
m – показатель степени средней;
f i – частота, показывающая, сколько раз встречается i-e значение осредняемого признака.

Приведем в качестве примера расчет среднего возраста студентов в группе из 20 человек:


Средний возраст рассчитаем по формуле простой средней:

Сгруппируем исходные данные. Получим следующий ряд распределения:

В результате группировки получаем новый показатель – частоту, указывающую число студентов в возрасте Х лет. Следовательно, средний возраст студентов группы будет рассчитываться по формуле взвешенной средней:

Общие формулы расчета степенных средних имеют показатель степени (m). В зависимости от того, какое значение он принимает, различают следующие виды степенных средних:
средняя гармоническая, если m = -1;
средняя геометрическая, если m –> 0;
средняя арифметическая, если m = 1;
средняя квадратическая, если m = 2;
средняя кубическая, если m = 3.

Формулы степенных средних приведены в табл. 4.4.

Если рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Здесь действует правило мажорантности средних: с увеличением показателя степени m увеличивается и соответствующая средняя величина:

В статистической практике чаще, чем остальные виды средних взвешенных, используются средние арифметические и средние гармонические взвешенные.

Таблица 5.1

Виды степенных средних

Вид степенной
средней
Показатель
степени (m)
Формула расчета
Простая Взвешенная
Гармоническая -1
Геометрическая 0
Арифметическая 1
Квадратическая 2
Кубическая 3

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Среднюю гармоническую применяют для расчетов тогда, когда в качестве весов используются не единицы совокупности – носители признака, а произведения этих единиц на значения признака (т.е. m = Xf). К средней гармонической простой следует прибегать в случаях определения, например, средних затрат труда, времени, материалов на единицу продукции, на одну деталь по двум (трем, четырем и т.д.) предприятиям, рабочим, занятым изготовлением одного и того же вида продукции, одной и той же детали, изделия.

Главное требование к формуле расчета среднего значения заключается в том, чтобы все этапы расчета имели реальное содержательное обоснование; полученное среднее значение должно заменить индивидуальные значения признака у каждого объекта без нарушения связи индивидуальных и сводных показателей. Иначе говоря, средняя величина должна исчисляться так, чтобы при замене каждого индивидуального значения осредняемого показателя его средней величиной оставался без изменения некоторый итоговый сводный показатель, связанный тем или другим образом с осредняемым . Этот итоговый показатель называется определяющим, поскольку характер его взаимосвязи с индивидуальными значениями определяет конкретную формулу расчета средней величины. Покажем это правило на примере средней геометрической.

Формула средней геометрической

используется чаще всего при расчете среднего значения по индивидуальным относительным величинам динамики.

Средняя геометрическая применяется, если задана последовательность цепных относительных величин динамики, указывающих, например, на рост объема производства по сравнению с уровнем предыдущего года: i 1 , i 2 , i 3 ,..., i n . Очевидно, что объем производства в последнем году определяется начальным его уровнем (q 0) и последующим наращиванием по годам:

q n =q 0 × i 1 × i 2 ×...×i n .

Приняв q n в качестве определяющего показателя и заменяя индивидуальные значения показателей динамики средними, приходим к соотношению

Отсюда

5.3. Структурные средние

Особый вид средних величин – структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен (например, если бы в рассмотренном примере отсутствовали данные и об объеме производства, и о сумме затрат по группам предприятий).

В качестве структурных средних чаще всего используют показатели моды – наиболее часто повторяющегося значения признака – и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой – не меньше его.

Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется. Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы:

,

где X Me – нижняя граница медианного интервала;
h Me – его величина;
(Sum m)/2 – половина от общего числа наблюдений или половина объема того показателя, который используется в качестве взвешивающего в формулах расчета средней величины (в абсолютном или относительном выражении);
S Me-1 – сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;
m Me – число наблюдений или объем взвешивающего признака в медианном интервале (также в абсолютном либо относительном выражении).

В нашем примере могут быть получены даже три медианных значения – исходя из признаков количества предприятий, объема продукции и общей суммы затрат на производство:

Таким образом, у половины предприятий уровень себестоимость единицы продукции превышает 125,19 тыс. руб., половина всего объема продукции производится с уровнем затрат на изделие больше 124,79 тыс. руб. и 50 % общей суммы затрат образуется при уровне себестоимости одного изделия выше 125,07 тыс. руб. Заметим также, что наблюдается некоторая тенденция к росту себестоимости, так как Ме 2 = 124,79 тыс. руб., а средний уровень равен 123,15 тыс. руб.

При расчете модального значения признака по данным интервального ряда надо обращать внимание на то, чтобы интервалы были одинаковыми, поскольку от этого зависит показатель повторяемости значений признака X. Для интервального ряда с равными интервалами величина моды определяется как

где Х Mo – нижнее значение модального интервала;
m Mo – число наблюдений или объем взвешивающего признака в модальном интервале (в абсолютном либо относительном выражении);
m Mo -1 – то же для интервала, предшествующего модальному;
m Mo+1 – то же для интервала, следующего за модальным;
h – величина интервала изменения признака в группах.

Для нашего примера можно рассчитать три модальных значения исходя из признаков числа предприятий, объема продукции и суммы затрат. Во всех трех случаях модальный интервал один и тот же, так как для одного и того же интервала оказываются наибольшими и число предприятий, и объем продукции, и общая сумма затрат на производство:

Таким образом, чаще всего встречаются предприятия с уровнем себестоимости 126,75 тыс. руб., чаще всего выпускается продукция с уровнем затрат 126,69 тыс. руб., и чаще всего затраты на производство объясняются уровнем себестоимости в 123,73 тыс. руб.

5.4. Показатели вариации

Конкретные условия, в которых находится каждый из изучаемых объектов, а также особенности их собственного развития (социальные, экономические и пр.) выражаются соответствующими числовыми уровнями статистических показателей. Таким образом, вариация, т.е. несовпадение уровней одного и того же показателя у разных объектов, имеет объективный характер и помогает познать сущность изучаемого явления.

Для измерения вариации в статистике применяют несколько способов.

Наиболее простым является расчет показателя размаха вариации Н как разницы между максимальным (X max) и минимальным (X min) наблюдаемыми значениями признака:

H=X max - X min .

Однако размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается.

Более строгими характеристиками являются показатели колеблемости относительно среднего уровня признака. Простейший показатель такого типа – среднее линейное отклонение Л как среднее арифметическое значение абсолютных отклонений признака от его среднего уровня:

При повторяемости отдельных значений Х используют формулу средней арифметической взвешенной:

(Напомним, что алгебраическая сумма отклонений от среднего уровня равна нулю.)

Показатель среднего линейного отклонения нашел широкое применение на практике. С его помощью анализируются, например, состав работающих, ритмичность производства, равномерность поставок материалов, разрабатываются системы материального стимулирования. Но, к сожалению, этот показатель усложняет расчеты вероятностного типа, затрудняет применение методов математической статистики. Поэтому в статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии.

Дисперсия признака (s 2) определяется на основе квадратической степенной средней:

.

Показатель s, равный , называется средним квадратическим отклонением.

В общей теории статистики показатель дисперсии является оценкой одноименного показателя теории вероятностей и (как сумма квадратов отклонений) оценкой дисперсии в математической статистике, что позволяет использовать положения этих теоретических дисциплин для анализа социально-экономических процессов.

Если вариация оценивается по небольшому числу наблюдений, взятых из неограниченной генеральной совокупности, то и среднее значение признака определяется с некоторой погрешностью. Расчетная величина дисперсии оказывается смещенной в сторону уменьшения. Для получения несмещенной оценки выборочную дисперсию, полученную по приведенным ранее формулам, надо умножить на величину n / (n - 1). В итоге при малом числе наблюдений (< 30) дисперсию признака рекомендуется вычислять по формуле

Обычно уже при n > (15÷20) расхождение смещенной и несмещенной оценок становится несущественным. По этой же причине обычно не учитывают смещенность и в формуле сложения дисперсий.

Если из генеральной совокупности сделать несколько выборок и каждый раз при этом определять среднее значение признака, то возникает задача оценки колеблемости средних. Оценить дисперсию среднего значения можно и на основе всего одного выборочного наблюдения по формуле

,

где n – объем выборки; s 2 – дисперсия признака, рассчитанная по данным выборки.

Величина носит название средней ошибки выборки и является характеристикой отклонения выборочного среднего значения признака Х от его истинной средней величины. Показатель средней ошибки используется при оценке достоверности результатов выборочного наблюдения.

Показатели относительного рассеивания. Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%.

1. Коэффициентом осцилляции отражает относительную колеблемость крайних значений признака вокруг средней

.

2. Относительное линейное отключение характеризует долю усредненного значения признака абсолютных отклонений от средней величины

.

3. Коэффициент вариации:

является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.

В статистике совокупности, имеющие коэффициент вариации больше 30–35 %, принято считать неоднородными.

У такого способа оценки вариации есть и существенный недостаток. Действительно, пусть, например, исходная совокупность рабочих, имеющих средний стаж 15 лет, со средним квадратическим отклонением s = 10 лет, «состарилась» еще на 15 лет. Теперь = 30 лет, а среднеквадратическое отклонение по-прежнему равно 10. Совокупность, ранее бывшая неоднородной (10/15 × 100 = 66,7%), со временем оказывается, таким образом, вполне однородной (10/30 × 100 = 33,3 %).

Боярский А.Я. Теоретические исследования по статистике: Сб. Науч. Трудов.– М.: Статистика,1974. С. 19–57.

Предыдущая

Важнейшее свойство средней заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности. Значения признака отдельных единиц совокупности варьируют под влиянием множества факторов, среди которых могут быть, как основные, так и случайные. Сущность средней в том и заключается, что в ней взаимокомпенсируются отклонения значений признака, которые обусловлены действием случайных факторов, и накапливаются (учитываются) изменения, вызванные действием основных факторов. Это позволяет средней отражать типичный уровень признака и абстрагироваться от индивидуальных особенностей, присущих отдельным единицам.

Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов.

Основные принципы применения средних величин.

1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц.

2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц.

3. Средняя должна рассчитываться для совокупности в стационарных условиях (когда влияющие факторы не меняются или меняются не значительно).

4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя.

Расчет большинства конкретных статистических показателей основан на использовании:

· средней агрегатной;

· средней степенной (гармонической, геометрической, арифметической, квадратической, кубической);

· средней хронологической (см. раздел).

Все средние, за исключением средней агрегатной, могут рассчитываться в двух вариантах - как взвешенные или невзвешенные.

Средняя агрегатная. Используется формула:

где w i = x i * f i ;

x i - i-й вариант осредняемого признака;

f i , — вес i — го варианта.

Средняя степенная. В общем виде формула для расчета:

где степень k – вид средней степенной.

Значения средних рассчитанных на основании средних степенных для одних и тех же исходных данных — не одинаковы. С увеличением показателя степени k, увеличивается и соответствующая средняя величина:

Cредняя хронологическая. Для моментного динамического ряда с равными интервалами между датами, рассчитывается по формуле:

,

где х 1 и х n значение показателя на начальную и конечную дату.

Формулы расчета степенных средних

Пример. По данным табл. 2.1 требуется рассчитать среднюю заработную плату в целом по трем предприятиям.

Таблица 2.1

Заработная плата предприятий АО

Пред приятие

Численность промышленно- производственного персонала (ППП), чел.

Месячный фонд заработной платы, руб.

Средняя заработная плата, руб.

564840

2092

332750

2750

517540

2260

Итого

1415130

Конкретная расчетная формула зависит от того, какие данные табл. 7 являются исходными. Соответственно возможны варианты: данные столбцов 1 (численность ППП) и 2 (месячный ФОТ); либо — 1 (численность ППП) и 3 (средняя ЗП); или 2 (месячный ФОТ) и 3 (средняя ЗП).

Если имеются только данные столбцов 1 и 2 . Итоги этих граф содержат необходимые величины для расчета искомой средней. Используется формула средней агрегатной:

Если имеются только данные столбцов 1 и 3 , то известен знаменатель исходного соотношения, но не известен его числитель. Однако фонд заработной платы можно получить умножением средней заработной платы на численность ППП. Поэтому общая средняя может быть рассчитана по формуле средней арифметической взвешенной :

Необходимо учитывать, что вес (f i ) в отдельных случаях может представлять собой произведение двух или даже трех значений.

Кроме того, в статистической практике находит применение и средняя арифметическая невзвешенная :

где n - объем совокупности.

Эта средняя используется тогда, когда веса (f i ) отсутствую (каждый вариант признака встречается только один раз) или равны между собой.

Если имеются только данные столбцов 2 и 3. , т. е. известен числитель исходного соотношения, но не известен его знаменатель. Численность ППП каждого предприятия можно получить делением ФОТ на среднюю ЗП. Тогда расчет средней ЗП в целом по трем предприятиям проводится по формуле средней гармонической взвешенной :

При равенстве весов (f i ) расчет среднего показателя может быть произведен по средней гармонической невзвешенной:

В нашем примере использовались разные формы средних, но получили один и тот же ответ. Это обусловлено тем, что для конкретных данных каждый раз реализовывалось одно и то же исходное соотношение средней.

Средние показатели могут рассчитываться по дискретным и интервальным вариационным рядам. При этом расчет производится по средней арифметической взвешенной. Для дискретного ряда данная формула используется так же, как и в приведенном выше примере. В интервальном же ряду для расчета определяются середины интервалов.

Пример. По данным табл. 2.2 определим величину среднедушевого денежного дохода за месяц в условном регионе.

Таблица 2.2

Исходные данные (вариационный ряд)

Среднедушевой денежный доход в среднем за месяц, х, руб. Численность населения, % к итогу/
До 400 30,2
400 — 600 24,4
600 — 800 16,7
800 — 1000 10,5
1000-1200 6,5
1200 — 1600 6,7
1600 — 2000 2,7
2000 и выше 2,3
Итого 100

Что такое среднее арифметическое

Средним арифметическим нескольких величин является отношение суммы этих величин к их количеству.

Среднее арифметическое определенного ряда чисел называется сумма всех этих чисел, поделенная на количество слагаемых. Таким образом, среднее арифметическое является средним значением числового ряда.

Чему равно среднее арифметическое нескольких чисел? А равно они сумме этих чисел, которая поделена на количество слагаемых в этой сумме.

Как найти среднее арифметическое число

В вычислении или нахождении среднего арифметического нескольких чисел, нет ничего сложного, достаточно сложить все представленные числа, а полученную сумму разделить на количество слагаемых. Полученный результат и будет средним арифметическим этих чисел.


Рассмотрим этот процесс более подробно. Что же нам нужно сделать для вычисления среднего арифметического и получения конечного результата этого числа.

Во-первых, для его вычисления нужно определить набор чисел или их количество. В этот набор могут входить большие и маленькие числа, и их количество может быть каким угодно.

Во-вторых, все эти числа нужно сложить и получить их сумму. Естественно, если числа несложные и их небольшое количество, то вычисления можно произвести, записав от руки. А если же набор чисел впечатляющий, то лучше воспользоваться калькулятором или электронной таблицей.

И, в-четвертых, полученную от сложения сумму необходимо разделить на количество чисел. В итоге мы получим результат, который и будет средним арифметическим числом этого ряда.



Для чего нужно среднее арифметическое

Среднее арифметическое может пригодиться не только для решения примеров и задач на уроках математики, но для других целей, необходимых в повседневной жизни человека. Такими целями может служить подсчет среднего арифметического для расчета среднего расхода финансов в месяц, или для подсчета времени, которое вы тратите на дорогу, также для того чтобы узнать посещаемость, производительность, скорость движения, урожайность и много другого.

Так, например, давайте попробуем рассчитать, сколько времени вы тратите на дорогу в школу. Идя в школу или возвращаясь, домой вы каждый раз тратите на дорогу разное время, так как когда вы спешите, то вы идете быстрее, и поэтому дорога занимает меньше времени. А вот, возвращаясь, домой вы можете идти не спеша, общаясь с одноклассниками, любуясь природой и поэтому времени на дорогу займет больше.

Поэтому, точно определить время, затраченное на дорогу у вас не получиться, но благодаря среднему арифметическому вы сможете приблизительно узнать время, которое вы тратите на дорогу.

Припустим, что в первый день после выходных, вы потратили на путь от дома до школу пятнадцать минут, на второй день ваш путь занял двадцать минут, в среду вы прошли расстояние за двадцать пять минут, за такое же время составил ваш путь и в четверг, а в пятницу вы никуда не торопились и возвращались целых пол часа.

Давайте найдем среднее арифметическое, прибавив время, за все пять дней. Итак,

15 + 20 + 25 + 25 + 30 = 115

Теперь разделим эту сумму на количество дней

Благодаря такому способу вы узнали, что путь от дома до школы вы приблизительно тратите двадцать три минуты своего времени.

Домашнее задание

1.Путем нехитрых вычислений найдите среднее арифметическое число посещаемости учеников вашего класса за неделю.

2. Найдите среднее арифметическое:



3. Решите задачу:



В статистике используют различные виды средних величин, которые делятся на два больших класса:

Степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадра-тическая, средняя кубическая);

Структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения, поэтому их называют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней величины – средняя арифметическая. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Вычисление данной величины сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй – 7, третий – 4, четвертый – 10, пятый– 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз, для опреде-

ления средней выработки одного рабочего следует применить формулу простой средней арифметической:

т. е. в нашем примере средняя выработка одного рабочего равна

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную. Например, рассчитаем средний возраст студентов в группе из 20 человек, возраст которых варьируется от 18 до 22 лет, где xi – варианты осредняемого признака, fi – частота, которая показывает, сколько раз встречается i-е значение в совокупности (табл. 5.1).

Таблица 5.1

Средний возраст студентов

Применяя формулу средней арифметической взвешенной, получаем:


Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум показателям, для одного из которых надо вычислить

среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя неизвестны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитывать-ся по формуле средней арифметической взвешенной.

В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысл и единственным обобщающим показателем может служить только другой вид средней величины – средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное деление одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной.

Например, пусть известно, что автомобиль прошел первые 210 км со скоростью 70 км/ч, а оставшиеся 150 км со скоростью 75 км/ч. Определить среднюю скорость автомобиля на протяжении всего пути в 360 км, используя формулу средней арифметической, нельзя. Так как вариантами являются скорости на отдельных участках xj = 70 км/ч и Х2 = 75 км/ч, а весами (fi) считаются соответствующие отрезки пути, то произведения вариантов на веса не будут иметь ни физического, ни экономического смысла. В данном случае смысл приобретают частные от деления отрезков пути на соответствующие скорости (варианты xi), т. е. затраты времени на прохождение отдельных участков пути (fi/ xi). Если отрезки пути обозначить через fi, то весь путь выразиться как?fi, а время, затраченное на весь путь, – как? fi/ xi , Тогда средняя скорость может быть найдена как частное от деления всего пути на общие затраты времени:

В нашем примере получим:

Если при использовании средней гармонической веса всех вариантов (f) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:

где xi – отдельные варианты; n – число вариантов осредняемого признака. В примере со скоростью простую среднюю гармоническую можно было бы применить, если бы были равны отрезки пути, пройденные с разной скоростью.

Любая средняя величина должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной (средней скоростью) не должно измениться общее расстояние.

Форма (формула) средней величины определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым, поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называется определяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.

Кроме средней арифметической и средней гармонической в статистике используются и другие виды (формы) средней величины. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения

их окажутся одинаковыми, здесь действует правило мажо-рантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина. Наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в табл. 5.2.

Таблица 5.2

Виды степенных средних


Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле

Формула средней геометрической взвешенной имеет следующий вид:

Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая – при абсолютных значениях уровней ряда.

Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и вычисляется по формуле

Средняя квадратическая взвешенная рассчитывается по другой формуле:

Средняя кубическая применяется при расчете с величинами кубических функций и вычисляется по формуле

средняя кубическая взвешенная:

Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:

где – средняя величина; – индивидуальное значение; n – число единиц изучаемой совокупности; k – показатель степени, определяющий вид средней.

При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:

Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому кроме рассмотренных средних в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные, или описательные, средние – мода (Мо) и медиана (Ме).

Мода – величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле

где х0 – нижняя граница интервала; h – величина интервала; fm – частота интервала; fm_ 1 – частота предшествующего интервала; fm+ 1 – частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой – больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (п +1) / 2 с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле

где X0 – нижняя граница интервала; h – величина интервала; fm – частота интервала; f – число членов ряда;

M-1 – сумма накопленных членов ряда, предшествующих данному.

Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на 4 равные части, а децили – на 10 равных частей. Квартилей насчитывается три, а децилей – девять.

Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти, не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

Средняя величина - это обобщающий показатель, который характеризует качественно однородную совокупность по определенному количественному признаку. Например, средний возраст лиц, осужденных за кражу.

В судебной статистике средние величины используют для характеристики:

Средних сроков рассмотрения дел данной категории;

Среднего размера иска;

Среднего числа ответчиков, приходящихся на одно дело;

Среднего размера ущерба;

Средней нагрузки судей, и др.

Средняя всегда величина именованная и имеет ту же размерность, что и признак у отдельной единицы совокупности. Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному варьирующему признаку, поэтому за всякой средней скрывается ряд распределения единиц этой совокупности по изучаемому признаку. Выбор вида средней определяется содержанием показателя и исходных данных для расчета средней величины.

Все виды средних величин, используемые в статистических исследованиях, подразделяются на две категории:

1) степенные средние;

2) структурные средние.

Первая категория средних величин включает: среднюю арифметическую, среднюю гармоническую, среднюю геометрическую и среднюю квадратическую . Вторая категория - это мода и медиана . При этом каждый из перечисленных видов степенных средних величин может иметь две формы: простую и взвешенную . Простая форма средней величины используется для получения среднего значения изучаемого признака, когда расчет осуществляется по несгруппированным статистическим данным, либо когда каждая варианта в совокупности встречается только один раз. Взвешенными средними называют величины, которые учитывают, что варианты значений признака могут иметь различную численность, в связи, с чем каждый вариант приходится умножать на соответствующую частоту. Иными словами, каждый вариант «взвешивают» по своей частоте. Частоту называют статистическим весом.

Средняя арифметическая простая - самый распространенный вид средней. Она равна сумме отдельных значений признака, деленной на общее число этих значений:

где x 1 ,x 2 , … ,x N - индивидуальные значения варьирующего признака (варианты), а N - число единиц совокупности.

Средняя арифметическая взвешенная применяется в тех случаях, когда данные представлены в виде рядов распределения или группировок. Она вычисляется как сумма произведений вариантов на соответствующие им частоты, деленная на сумму частот всех вариантов:

где x i - значение i -й варианты признака; f i - частота i -й варианты.

Таким образом, каждое значение варианты взвешивается по своей частоте, поэтому частоты иногда называют статистическими весами.


Замечание. Когда речь идет о средней арифметической величине без указания ее вида, подразумевается средняя арифметическая простая.

Таблица 12.

Решение. Для расчета используем формулу средней арифметической взвешенной:

Таким образом, в среднем на одно уголовное дело приходится два обвиняемых.

Если вычисление средней величины производят по данным, сгруппированным в виде интервальных рядов распределения, то сначала надо определить серединные значения каждого интервала х" i , после чего рассчитать среднюю величину по формуле средней арифметической взвешенной, в которую вместо x i подставляют х" i .

Пример. Данные о возрасте преступников, осужденных за совершение кражи, представлены в таблице:

Таблица 13.

Определить средний возраст преступников, осужденных за совершение кражи.

Решение. Для того, чтобы определить средний возраст преступников на основе интервального вариационного ряда необходимо сначала найти серединные значения интервалов. Так как дан интервальный ряд с открытыми первым и последним интервалами, то величины этих интервалов принимаются равными величинам смежных закрытых интервалов. В нашем случае величина первого и последнего интервалов равны 10.

Теперь находим средний возраст преступников по формуле средней арифметической взвешенной:

Таким образом, средний возраст преступников, осужденных за совершение кражи, приближенно равен 27 лет.

Средняя гармоническая простая представляет собой величину, обратную средней арифметической из обратных значений признака:

где 1/x i - обратные значения вариантов, а N - число единиц совокупности.

Пример. Для определения средней годовой нагрузки на судей районного суда при рассмотрении уголовных дел провели обследование нагрузки 5 судей этого суда. Средние затраты времени на одно уголовное дело для каждого из обследованных судей оказались равными (в днях): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Найти средние затраты на одно уголовное дело и среднюю годовую нагрузку на судей данного районного суда при рассмотрении уголовных дел.

Решение. Для определения средних затрат времени на одно уголовное дело, воспользуемся формулой средней гармонической простой:

Для упрощения расчетов в примере возьмем число дней в году равным 365, включая выходные (это не влияет на методику расчета, а при вычислении аналогичного показателя на практике необходимо вместо 365 дней подставить количество рабочих дней в конкретном году). Тогда средняя годовая нагрузка на судей данного районного суда при рассмотрении уголовных дел составит: 365(дней) : 5,56 ≈ 65,6 (дел).

Если бы мы для определения средних затрат времени на одно уголовное дело, воспользовались формулой средней арифметической простой, то получили бы:

365 (дней) : 5,64 ≈ 64,7 (дела), т.е. средняя нагрузка на судей оказалась меньше.

Проверим обоснованность такого подхода. Для этого воспользуемся данными о затратах времени на одно уголовное дело для каждого судьи и рассчитаем число уголовных, рассмотренных каждым из них за год.

Получим соответственно :

365(дней) : 6 ≈ 61 (дело), 365(дней) : 5,6 ≈ 65,2 (дел), 365(дней) : 6,3 ≈ 58 (дел),

365(дней) : 4,9 ≈ 74,5 (дела), 365(дней) : 5,4 ≈ 68 (дел).

Теперь вычислим среднюю годовую нагрузку на судей данного районного суда при рассмотрении уголовных дел:

Т.е. средняя годовая нагрузка такая же, как и при использовании средней гармонической.

Таким образом, использование средней арифметической в данном случае неправомерно.

В тех случаях, когда известны варианты признака, их объемные значения (произведение варианты на частоту), но неизвестны сами частоты, применяется формула средней гармонической взвешенной:

,

где x i - значения вариантов признака, а w i - объемные значения вариантов (w i = x i · f i ).

Пример. Данные о цене единицы однотипного товара, произведенного различными учреждениями уголовно-исполнительной системы, и об объемах его реализации приведены в таблице 14.

Таблица 14

Найти среднюю цену реализации товара.

Решение. При расчете средней цены мы должны пользоваться отношением суммы реализации к количеству реализованных единиц. Нам неизвестно количество реализованных единиц, но известны суммы реализаций товаров. Поэтому для нахождения средней цены реализованных товаров воспользуемся формулой средней гармонической взвешенной. Получаем

Если здесь использовать формулу средней арифметической, то можно получить среднюю цену, которая будет нереальна:

Средняя геометрическая вычисляется извлечением корня степени N из произведения всех значений вариантов признака:

,

где x 1 ,x 2 , … ,x N - индивидуальные значения варьирующего признака (варианты), а

N - число единиц совокупности.

Этот вид средней используется для вычисления средних показателей роста рядов динамики.

Средняя квадратическая применяется для расчета среднеквадратического отклонения, являющегося показателем вариации, и будет рассмотрена ниже.

Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода , или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном (упорядоченном) ряду. Упорядочение единиц статистической совокупности может быть проведено по возрастанию или убыванию вариантов изучаемого признака.

Медиана (Ме) - это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда. Таким образом, медиана - это тот вариант ранжированного ряда, по обе стороны от которого в данном ряду должно находиться равное число единиц совокупности.

Для нахождения медианы сначала необходимо определить ее порядковый номер в ранжированном ряду по формуле:

где N - объем ряда (число единиц совокупности).

Если ряд состоит из нечетного числа членов, то медиана равна варианте с номером N Me . Если же ряд состоит из четного числа членов, то медиана определяется как среднее арифметическое двух смежных вариант, расположенных в середине.

Пример. Дан ранжированный ряд 1, 2, 3, 3, 6, 7, 9, 9, 10. Объем ряда N = 9, значит N Me = (9 + 1) / 2 = 5. Следовательно, Ме = 6, т.е. пятой варианте. Если дан ряд 1, 5, 7, 9, 11, 14, 15, 16, т.е. ряд с четным числом членов (N = 8), то N Me = (8 + 1) / 2 = 4,5. Значит медиана равна полусумме четвертой и пятой вариант, т.е. Ме = (9 + 11) / 2 = 10.

В дискретном вариационном ряду медиану определяют по накопленным частотам. Частоты вариант, начиная с первой, суммируются до тех пор, пока не будет превзойден номер медианы. Значение последней просуммированной варианты и будет медианой.

Пример. Найти медиану числа обвиняемых, приходящихся на одно уголовное дело, используя данные таблицы 12.

Решение. В данном случае объем вариационного ряда N = 154, следовательно, N Me = (154 + 1) / 2 = 77,5. Просуммировав частоты первой и второй варианты, получим: 75 + 43 = 118, т.е. мы превзошли номер медианы. Значит Ме = 2.

В интервальном вариационном ряду распределения сначала указывают интервал, в котором будет находиться медиана. Его называют медианным . Это первый интервал, накопленная частота которого превышает половину объема интервального вариационного ряда. Затем численное значение медианы определяется по формуле:

где x Ме - нижняя граница медианного интервала; i - величина медианного интервала; S Ме-1 - накопленная частота интервала, который предшествует медианному; f Ме - частота медианного интервала.

Пример. Найти медиану возраста преступников, осужденных за совершение кражи, на основе статистических данных, представленных в таблице 13.

Решение. Статистические данные представлены интервальным вариационным рядом, значит сначала определим медианный интервал. Объем совокупности N = 162, следовательно, медианным интервалом является интервал 18-28, т.к. это первый интервал, накопленная частота которого (15 + 90 = 105) превышает половину объема (162: 2 = 81) интервального вариационного ряда. Теперь численное значение медианы определяем по приведенной выше формуле:

Таким образом, половина осужденных за совершение кражи младше 25 лет.

Модой (Мо) называют значение признака, которое наиболее часто встречается у единиц совокупности. К моде прибегают для выявления величины признака, имеющей наибольшее распространение. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Например, для дискретного ряда, представленного в таблице 3 Мо = 1, так как этому значению варианты соответствует наибольшая частота - 75. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой.

Его значение находят по формуле:

где x Mo - нижняя граница модального интервала; i - величина модального интервала; f Мо - частота модального интервала; f Мо-1 - частота интервала, предшествующего модальному; f Мо+1 - частота интервала, следующего за модальным.

Пример. Найтимодувозраста преступников, осужденных за совершение кражи, данные о которых представлены в таблице 13.

Решение. Наибольшая частота соответствует интервалу 18-28, следовательно, мода должна находиться в этом иртервале. Ее величину определяем по приведенной выше формуле:

Таким образом, наибольшее число преступников, осужденных за совершение кражи, имеет возраст 24 года.

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Однако две совокупности, имеющие одинаковые средние значения, могут значительно отличаться друг от друга по степени колеблемости (вариации) величины изучаемого признака. Например, в одном суде были назначены следующие сроки лишения свободы: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 лет, а в другом - 5, 5, 6, 6, 7, 7, 7, 8, 8, 8 лет. В обоих случаях средняя арифметическая равна 6,7 лет. Однако эти совокупности существенно различаются между собой разбросом индивидуальных значений назначенного срока лишения свободы относительно среднего значения.

И для первого суда, где этот разброс достаточно большой, средняя величина срока лишения свободы плохо отражает всю совокупность. Таким образом, если индивидуальные значения признака мало отличаются друг от друга, то средняя арифметическая будет достаточно показательной характеристикой свойств данной совокупности. В противном случае средняя арифметическая будет ненадежной характеристикой этой совокупности и применение ее на практике малоэффективно. Поэтому необходимо учитывать вариацию значений изучаемого признака.

Вариация - это различия в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Термин «вариация» имеет латинское происхождение - variatio, что означает различие, изменение, колеблемость. Она возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Для измерения вариации признака применяются различные абсолютные и относительные показатели.

К основным показателям вариации относятся следующие:

1) размах вариации;

2) среднее линейное отклонение;

3) дисперсия;

4) среднее квадратическое отклонение;

5) коэффициент вариации.

Кратко остановимся на каждом из них.

Размах вариации R самый доступный по простоте расчета абсолютный показатель, который определяется как разность между самым большим и самым малым значениями признака у единиц данной совокупности:

Размах вариации (размах колебаний) - важный показатель колеблемости признака, но он дает возможность увидеть только крайние отклонения, что ограничивает область его применения. Для более точной характеристики вариации признака на основе учета его колеблемости используются другие показатели.

Среднее линейное отклонение представляет собой среднее арифметическое из абсолютных значений отклонений индивидуальных значений признака от средней и определяется по формулам:

1) для несгруппированных данных

2) для вариационного ряда

Однако наиболее широко применяемым показателем вариации является дисперсия . Она характеризует меру разброса значений изучаемого признака относительно его среднего значения. Дисперсия определяется как средняя из отклонений, возведенных в квадрат.

Простая дисперсия для не сгруппированных данных:

.

Взвешенная дисперсия для вариационного ряда:

Замечание. На практике для вычисления дисперсии лучше использовать следующие формулы:

Для простой дисперсии

.

Для взвешенной дисперсии

Среднее квадратическое отклонение - это корень квадратный из дисперсии:

Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше среднее квадратическое отклонение, тем, однороднее совокупность и тем лучше средняя арифметическая отражает собой всю совокупность.

Рассмотренные выше меры рессеяния (размах вариации, дисперсия, среднее квадратическое отклонение) являются абсолютными показателями, судить по которым о степени колеблемости признака не всегда возможно. В некоторых задачах необходимо использовать относительные показатели рассеяния, одним из которых является коэффициент вариации.

Коэффициент вариации - выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

Коэффициент вариации используют не только для сравнительной оценки вариации разных признаков или одного и того же признака в различных совокупностях, но и для характеристики однородности совокупности. Статистическая совокупность считается количественно однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному распределению).

Пример. Имеются следующие данныео сроках лишения свободы 50 осужденных, доставленных для отбывания назначенного судом наказания в исправительное учреждение уголовно-исполнительной системы: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2, 5, 6, 4, 3, 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6, 4, 4, 3, 1, 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Построить ряд распределения по срокам лишения свободы.

2. Найти среднее значение, дисперсию и среднее квадратическое отклонение.

3. Вычислить коэффициент вариации и сделать заключение об однородности или неоднородности изучаемой совокупности.

Решение. Для построения дискретного ряда распределения необходимо определить варианты и частоты. Варианта в данной задаче - это срок лишения свободы, а частоты - численность отдельных вариант. Рассчитав частоты, получим следующий дискретный ряд распределения:

Найдем среднее значение и дисперсию. Поскольку статистические данные представлены дискретным вариационным рядом, то для их вычисления будем использовать формулы среднего арифметического взвешенного и дисперсии. Получим:

= = 4,1;

= 5,21.

Теперь вычисляем среднее квадратическое отклонение:

Находим коэффициент вариации:

Следовательно, статистическая совокупность количественно неоднородна.