Проект по исследованию статистики и нормального распределения в школе
Автор: Бобин Виталий Леонидович
Организация: МБОУ «СОШ №37» г. Чебоксары
Населенный пункт: Чувашская Республика, г. Чебоксары
Автор: Бобин Дмитрий Витальевич
Организация: ЧГУ им. И.Н.Ульянова
Населенный пункт: Чувашская Республика, г. Чебоксары
Некоторые математически четко заданные законы распределения естественным образом встречаются в физическом мире повседневной жизни, присутствие которых подтверждается статистикой. Наиболее значимый закон нормальное распределение, или распределение Гаусса. Это колоколообразная кривая, симметрично уменьшающаяся в обе стороны от максимального значения. На большом количестве экспериментов установлено, что многие случайные величины, например, масса овощей, промежутки времени между случайными прохожими, погрешности длины хорошо описываются с помощью функции нормального распределения плотности вероятности [1]
В 1733 году математик А. Муавр открыл нормальное распределение, которое К. Гаусс изучал и объяснил через десятилетия. Нормальный закон распределения занимает особое положение среди всех законов распределения. Главная особенность заключается в том, что он является предельным законом, к которому приближаются другие законы распределения при весьма часто встречающихся типичных условиях [2].
Целью исследования является выяснить, соответствуют ли нормальному распределению рост учеников. Исходные статистические данные исследования – параметр роста 90 учеников 7 класса школы. Поскольку результаты измерений являются непрерывными данными, то переменная X (рост) является непрерывной случайной величиной. Для анализа выборки построен вариационный ряд, таблица частот, гистограмма и оценены статистические характеристики выборки (табл. 1).
Таблица 1 – Основные статистические показатели роста учеников
№ |
Показатель |
Обозначение |
Значение |
1 |
Объем выборки |
n |
90 |
2 |
Минимальное значение |
xmin |
143 см |
3 |
Максимальное значение |
xmax |
178 см |
4 |
Размах |
h |
35 см |
5 |
Средняя величина |
xср |
160,1 см |
6 |
Медиана |
Me |
159 см |
7 |
Мода |
Mo |
157 см |
8 |
Дисперсия |
σ2 |
70,1 см2 |
9 |
Стандартное отклонение |
σ |
8,4 см |
10 |
Коэффициент вариации |
V |
5,23 % |
Показатели средней и медианы примерно равны, однако, хотя рост учеников и был близок нормальному распределению, наблюдалась некоторая асимметрия, мода была на 3 см левее среднего значения. Средний рост в 7 классе был 160,1 см, что больше 48% учеников. Можно предположить, что мода, медиана и среднее будут расти и приближаться друг другу по мере взросления учеников. Коэффициент вариации не превышает 10%, следовательно, статистическую совокупность можно считать однородной.
По формуле Стерджесса оптимальное количество интервалов частот равно 7-8. Поделим проранжированный ряд признака на отрезки длиной 5, но в качестве начального значения вместо минимального значения выборки возьмем 140, а максимального – 180, получится 8 частей. Эмпирические частоты распределения роста учеников представлены на рисунке 1. Теоретические частоты найдем по формуле
,
где Δ – длина отрезка, σ – стандартное отклонение, – средняя величина, xi – среднее значение i-го интервала.
Рис. 1. Кривые эмпирических и теоретических частот распределения роста учеников
Для проверки основной гипотезы воспользуемся критерием хи-квадрат Пирсона, наблюдаемое значение которого равно
,
где i – номер интервала, k – количество интервалов,mi – теоретические частоты, mi 1– эмпирические частоты. Критическое значение хи-квадрат критерия при уровне значимости 0,05 и степенями свободы k – 3 = 5 равно . Поскольку
, то нет оснований отвергнуть гипотезу о нормальном распределении роста учеников. Аналогичный статистический анализ тех же обучающихся в течение последующих двух лет показал, что с ростом и развитием обучающихся распределение их роста все ближе к теоретической кривой нормального распределения.
Литература
1. Бродский И.Л., Мешавкина О.С. Вероятность и статистика. 10-11 классы. Планирование и практикум: Пособие для учителя. М.: АРКТИ, 2009, 104 с.
2. Вентцель Е.С. Теория вероятностей. М.: Высш. шк., 2006, 575 с.