Статистика

Курсовая работа


                          Лабораторная работа № 1.

Тема: «Сводка, группировка, статистические таблицы».
Цель:  выявление  обобщающих  закономерностей,  характерных  для   изучаемой
совокупности объектов наблюдения как целостной системы.
Цель исследования—определение уровня успеваемости студентов 1-ого  курса,  а
так же факторов на него влияющих.
В качестве исследуемых признаков я рассматриваю:
   1. средний балл по итогам экзаменов за 1-ый курс (баллы).
   2. посещаемость занятий в университете на 1-ом курсе.
   3. самообразование (дополнительное обучение, курсы) (ч/нед).
   4. сон (ч/сутки).
   5. пол (м, ж).
   6. подготовка к семинарским и практическим занятиям (ч/нед).
   7. нравятся ли студенту на 1-ом курсе занятия в университете (да, нет).
Из  представленных  признаков  я  выделяю   признак-результат—средний   балл
зачётки  по  итогам  1-ого  курса,  так  как  его  значение  отвечает   цели
исследования. Остальные шесть признаков  являются  признаками-факторами,  т.
к. они оказывают влияние на признак-результат.
Наблюдение  единовременное  ауд.  722,   522   СПбГИЭУ.   Дата   проведения:
03.11.2000г. по  форме  проведения—опрос.  Объектом  наблюдения  являются  2
группы студентов (1093 и  1094)  2-ого  курса.  единица  наблюдения—студент.
Исследование основного массива.

                        Таблицы с исходными данными.
                                                                   Таблица 1


|Средний |Посещаемост|Самообразо|Подготовка|Сон       |Пол     |Нравятся |
|балл    |ь занятий  |вание     |к         |(ч/сут)   |(м, ж)  |ли       |
|зачётки |на первом  |(доп.     |семинарски|          |        |занятия в|
|по      |курсе      |Курсы)    |м занятиям|          |        |университ|
|итогам  |           |ч/нед     |(ч/нед)   |          |        |ете (да, |
|экзамено|           |          |          |          |        |нет)     |
|в за    |           |          |          |          |        |         |
|1-ый    |           |          |          |          |        |         |
|курс    |           |          |          |          |        |         |
|(баллы) |           |          |          |          |        |         |
|4,7     |19,5       |0         |5         |7         |Ж       |Да       |
|4,5     |22         |2         |6         |9         |Ж       |Да       |
|4,2     |22         |0         |2         |6         |М       |Да       |
|4,3     |19,5       |0         |7         |7         |Ж       |Да       |
|4,5     |17,5       |0         |3         |7         |Ж       |Нет      |
|4,2     |9,5        |6         |12        |10        |Ж       |Да       |
|4,0     |12,5       |0         |5         |5         |Ж       |Да       |
|4,7     |22         |4         |7         |6         |Ж       |Да       |
|4,6     |17,5       |3         |4         |8         |Ж       |Да       |
|4,7     |9,5        |0         |2         |7         |Ж       |Да       |
|4,5     |11,5       |6         |3         |7         |Ж       |Да       |
|4,0     |11,5       |2         |3         |9         |Ж       |Да       |
|4,2     |19,5       |4         |8         |8         |Ж       |Нет      |
|4,0     |20,5       |6         |9         |5         |Ж       |Да       |
|3,2     |9,5        |0         |0         |10        |М       |Нет      |
|4,0     |17,5       |0         |8         |8         |М       |Нет      |
|3,2     |14,5       |0         |2         |8         |М       |Нет      |
|3,5     |14,5       |0         |2         |8         |М       |Нет      |
|4,8     |22         |0         |10        |10        |Ж       |Нет      |
|4,6     |8,5        |0         |1         |8         |М       |Да       |
|4,5     |22         |0         |4         |7         |Ж       |Да       |
|4,5     |22         |6         |2         |7         |М       |Да       |
|4,2     |17,5       |4         |4         |9         |М       |Нет      |
|4,5     |14,5       |6         |4         |10        |Ж       |Да       |
|4,2     |11,5       |2         |2         |8         |Ж       |Нет      |
|4,8     |17,5       |0         |4         |9         |Ж       |Нет      |
|4,0     |10,5       |0         |2         |7         |Ж       |Да       |
|4,2     |17,5       |2         |6         |5         |Ж       |Да       |
|3,0     |9,5        |0         |0         |9         |М       |Нет      |
|4,8     |19,5       |2         |2         |8         |Ж       |Да       |
|4,8     |19,5       |2         |6         |9         |Ж       |Да       |
|4,3     |17,5       |4         |2         |7         |Ж       |Да       |
|3,2     |6,0        |0         |0         |5         |М       |Нет      |
|4,5     |22         |2         |5         |9         |Ж       |Нет      |
|4,7     |22         |4         |3         |6         |Ж       |Да       |
|4,2     |22         |3         |5         |8         |Ж       |Да       |
|4,6     |9,5        |0         |1         |8         |Ж       |Нет      |
|3,0     |14,0       |0         |2         |10        |М       |Нет      |
|3,0     |6,5        |0         |5         |9         |М       |Нет      |
|4,0     |22         |2         |5         |9         |Ж       |Да       |
|4,7     |17,5       |6         |0         |10        |Ж       |Нет      |
|3,5     |11,5       |0         |6         |7         |М       |Нет      |
|4,7     |22         |6         |2         |5         |Ж       |Да       |
|4,5     |22         |0         |0         |8         |Ж       |Да       |
|3,2     |17,5       |4         |8         |9         |Ж       |Да       |
|4,8     |22         |0         |0         |5         |М       |Да       |
|3,2     |9,5        |0         |5         |10        |М       |Да       |
|4,5     |17,5       |0         |3         |10        |Ж       |Да       |
|3,0     |14,5       |5         |3         |7         |М       |Нет      |
|4,7     |11,5       |5         |3         |7         |М       |Нет      |

                          Структурные группировки.
1 группировка.
                                                                   Таблица 2
|Средний балл по  |Число студентов  |% к итогу        |Fi               |
|итогам экзаменов |                 |                 |                 |
|за 1 курс, баллы |                 |                 |                 |
|[3-3,5]          |9                |18               |9                |
|[3,5-4]          |3                |6                |12               |
|[4-4,5]          |15               |30               |27               |
|[4,5-5]          |23               |46               |50               |
|Итог:            |50               |100              |                 |

Для удобства разбиваем вариационный ряд  на  4  равных  интервала.  Величину
интервала определяем по формуле:

 h = R / n =  (X max – X min) / n = (5-3) / 4 = 0,5

гистограмма:
    кумулята:

[pic]
считаем по несгруппированным данным для большей точности:
Х = (4,7 + 4,5 + 4,2 + 4,2 +4,5 + 4,2 + 4,0 + 4,7 + 4,6 + 4,7 + 3,5 + 4,0  +
3,2 + 4,0 + 3,2 + 3,5 + + 4,8 + 4,6 + 4,5 + 4,5 + 4,2 + 4,5 + 4,2  +  4,8  +
4,0 + 4,2 + 3,0 + 3,2 + 4,8 + 4,8 + 4,3 + 4,5 + 4,7 + 4,2 + 4,6 + 3,0 +  3,0
+ 4,0 + 4,7 + 3,5 + 4,7 + 4,5 + 3,2 + 4,5 + 4,8 + 3,2 + 3,0 + 4,5 +  4,7)  /
50 = 4,27 (балла)
Ме = x0 + ( Ме (N/2 – F(x0) / NMe
Me = 4+ 0,5 (25 –12) / 15 = 4,4 (балла)
Мо =  х0 + ( Мо (NМо – NМо-1) / (NМо – NМо-1) + (NМо – NМо+1)
Mo = 4,5 + 0,5 (25-15) / ((23-15) + (23-0)) = 4,6 (балла)
D = ( (xi – x)2 / n считаем по несгруппированным данным.
D = 0,3 (кв. балла)
bx = (D
bx = (0,3 = 0,55 (балла)
V = bx / x ( 100%
V = (0,55 / 4,27) ( 100% = 128%
R = xmax – xmin
R = 5 – 3 = 2 (балла)
Вывод: средний балл зачётки по итогам экзаменов  за  1-ый  курс  для  данной
совокупности составляет 4,27 балла.  Т.  к.  коэффициент  вариации  является
величиной незначительной (128%), можно предполагать, что такой средний  балл
является  типичным  для  данной  совокупности.   Наиболее   распространённым
является балл зачётки 4,6 балла. Средний балл у 50% студентов не больше  4,4
балла.
Группировка 2
                                                                   Таблица 3
|Посещаемость,    |Число студентов, |% к итогу        |Fi               |
|ч/нед            |чел              |                 |                 |
|[6-10]           |9                |18               |9                |
|[10-14]          |8                |16               |17               |
|[14-18]          |15               |30               |32               |
|[18-22]          |18               |36               |50               |
|Итог:            |50               |100              |                 |


Разбиение на интервалы аналогично группировке 1.
Для несгруппированных данных, значит более точный результат.
Х = ( xi / n
X = 16, 13 (ч/нед)
Ме = x0 + ( Ме (N/2 – F(x0) / NMe
Ме = 14 + 4 (25 – 17) / 15 = 17,3 (ч/нед)
[pic]
D = ( (xi – x)2 / n
D = 19,4 ((ч/нед)2)
bx = (D = 4,4 (ч/нед)
V = bx / x ( 100% = (4,4 / 16,13) ( 100% = 27,2%
R = xmax – xmin
R = 22 – 16 = 16 (балла)
Вывод: средняя посещаемость в группах составляет 16,13 ч/нед  (70% от  часов
в неделю назначенных расписанием). Коэффициент вариации  является  величиной
незначительной (28,6%), следовательно. Такая  средняя  посещаемость  типична
для студентов  данной  совокупности.  Большинство  студентов  посещало  17,3
ч/нед. Посещаемость занятий у 50% студентов меньше 19 ч/нед,  у  50%  больше
19 ч/нед.
Группировка 3
                                                                   Таблица 4
|Самообразование, |Число студентов  |% к итогу        |Fi               |
|курсы (ч/нед)    |                 |                 |                 |
|0                |25               |50               |25               |
|2                |8                |16               |33               |
|3                |2                |4                |35               |
|4                |6                |12               |41               |
|5                |2                |4                |43               |
|6                |7                |14               |50               |
|Итог:            |50               |100              |                 |

Полегон                                                              частот:
            кумулята



Х = ( xi (i / ( (i = (0 ( 25 + 2 ( 8 + 3 ( 2 + 4 ( 6 + 5 ( 2 + 6 ( 7)  /  50
= 1,96 (ч/нед)
NMe = (n+1) / 2  = 51 / 2 = 25,5
Me = x NMe ;         Me = 2 (ч/нед) ;           Мо = 0 (ч/нед)
D = ( (xi – x)2 (i / ( (I  = ((0 – 1,96)2 ( 25 + (2 – 1,96)2  (  8  +  (3  –
1,96)2 ( 2 + (4 – 1,96)2 ( 6 + (5 – 1,96)2 ( 2 + (6 – 1,96)2 (  7)  /  50  =
5,1 (ч/нед)2
bx = 2,26 (ч/нед)
V = (2,26 / 1,96) ( 100% = 115%
R = 6 – 0 = 6 (ч/нед)
Вывод: среднее количество часов, затраченное студентами  на  самообразование
1,96 ч/нед. Т.  к.  коэффициент  вариации  является  величиной  значительной
(115%), то среднее количество является не типичным для данной  совокупности.
Наиболее распространённым является количество часов  самообразования  равное
0 ч/нед. Ровно половина из 50 опрошенных студентов не занимались  на  первом
курсе дополнительным самообразованием.
Группировка 4
                                                                   Таблица 5
|Подготовка к     |Число студентов  |% к итогу        |Fi               |
|семинарам, ч/нед |                 |                 |                 |
|[0-3]            |21               |42               |21               |
|[3-6]            |18               |36               |39               |
|[6-9]            |8                |16               |47               |
|[9-12]           |3                |6                |50               |

Для удобства разбиваем вариационный ряд  на  4  равных  интервала.  Величину
интервала определяем по формуле: h = R / n. h = 3.

[pic]
Х = ( xi / n
Х = 4,08 (ч/нед)
Ме = 3 + 3 (25 – 21) / 18 = 3,6 (ч/нед)
Мо = 0 + 3 (21 – 0) / ((21 – 0) + (21 – 8)) = 1,85 (ч/нед)
D = ( (xi – x)2 / n
D = 7,2 ((ч/нед)2)
bx = 2,7 (ч/нед)
V = (2,7 / 4,08) ( 100% = 65,6%
R = 12 – 0 = 12 (ч/нед)
Вывод: среднее время, затраченное на подготовку  к  семинарским  занятиям  у
студентов на 1  курсе  4,08  ч/нед.  Т.  к.  коэффициент  вариации  является
величиной значительной, то среднее время подготовки  является  величиной  не
типичной  для  данной  совокупности  студентов.  Наиболее   распространённым
количеством  часов  на  подготовку  равно  1,85  ч/нед.   Число   студентов,
занимающихся  больше  3,6  ч/нед   равно   числу   студентов,   занимающихся
подготовкой к занятиям больше 3,6 ч/нед.
Группировка 5
                                                                   Таблица 6
|Сон, ч/сутки     |Число студентов  |% к итогу        |Fi               |
|5                |6                |12               |6                |
|6                |3                |6                |9                |
|7                |13               |26               |22               |
|8                |11               |22               |33               |
|9                |8                |16               |41               |
|10               |9                |18               |50               |
|Итог:            |50               |100              |                 |



X = (5  6 + 6  3 + 7  13 + 8  11 + 9  8 + 10  9) / 50 = 7,78 (ч/сут)
NMe = (n+1) / 2                             Me = 8 (ч/сут)
Мо = 7 (ч/сут)
D = ( (xi – x)2 (i / ( (I
D = 2,4 ((ч/сут)2)
bx = 1,55 (ч/сут)
V = (1,55 / 7,78) ( 100% = 19,9%
R = 10 – 5 = 5 (ч/сут)
Вывод: среднее значение часов сна 7,78 ч/сутки. Т. к.  коэффициент  вариации
является величиной незначительной (19,9%), то такое среднее  значение  часов
сна является типичным для  данной  совокупности.  Наиболее  распространённым
является количество часов сна 7 ч/сутки. Количество студентов, которые  спят
больше 8 ч/сутки равно количеству студентов, спящих меньше 8 ч/сут.
Группировка 6
                                                                   Таблица 7

|пол              |Число студентов, |% к итогу        |Fi               |
|                 |чел              |                 |                 |
|Ж                |33               |66               |30               |
|М                |17               |34               |50               |
|Итог:            |50               |100              |                 |


Вывод: из таблицы  видно,  что  большинство  опрошенных  студентов  женского
пола.

Группировка 7
                                                                   Таблица 8

|Нравятся ли      |Число студентов, |% к итогу        |Fi               |
|занятия на 1     |чел              |                 |                 |
|курсе            |                 |                 |                 |
|Да               |30               |60               |30               |
|Нет              |20               |40               |50               |
|Итог:            |50               |100              |                 |

[pic]
Вывод: из таблицы  видно,  что  большинству  студентов  данной  совокупности
нравились занятия на 1 курсе в академии.
                         Комбинационные группировки.
                                                                   Таблица 9
|сон  |Средний балл зачётки                                         |Всего|
|Неудовлетворительная   |21                     |3,7                    |
|Удовлетворительная     |18                     |4,3                    |
|Хорошая                |8                      |4,4                    |
|Отличная               |3                      |4,5                    |
|Всего:                 |50                     |                       |

Вывод:  из  таблицы  видно,  что  зависимость  между  фактором  и  признаком
существует.

Группировка 2
                                                                  Таблица 12
Введём обозначения:
   1. 1/3 всех занятий [6-12] ч/нед
   2. половина [12-18] ч/нед
   3. все занятия [18-22] ч/нед
|Посещаемость занятий   |Число студентов, чел   |Средний балл зачётки за|
|                       |                       |1 курс                 |
|1/3 всех занятий       |13                     |3,3                    |
|половина               |19                     |4,0                    |
|все занятия            |18                     |4,5                    |
|Всего:                 |50                     |                       |

Вывод:  из  таблицы  видно,  что  зависимости  между  признаком-фактором   и
признаком-результатом явной нет.
Группировка 3
                                                                  Таблица 13

|Самообразование        |Число студентов, чел   |Средний балл зачётки за|
|                       |                       |1 курс                 |
|Посещали доп. курсы    |25                     |4,2                    |
|Не посещали доп. курсы |25                     |4,0                    |



Вывод:  не  наблюдается  явной  зависимости   между   признаком-фактором   и
признаком результатом.
                           Лабораторная работа № 2
Тема: Корреляционный анализ, множественная линейная регрессия.
Цель: выбор оптимальной модели многофакторной регрессии  на  основе  анализа
различных  моделей  и   расчитан   для   них   коэффициентов   множественной
детерминации  и   среднеквадратических   ошибок   уравнения   многофакторной
регрессии.

                           Корреляционная матрица
                                                                   Таблица 1
|           |0          |1          |2          |3          |4          |
|0          |1          |0,572      |0,115      |0,486      |0,200      |
|1          |0,572      |1          |0,218      |0,471      |-0,112     |
|2          |0,115      |0,218      |1          |0,452      |-0,048     |
|3          |0,438      |0,471      |0,452      |1          |-0,073     |
|4          |-0,2       |-0,112     |-0,048     |-0,073     |1          |

Где х0 – средний балл зачётки (результат), х1 – посещаемость занятий,  х2  –
самообразование (доп. курсы), х3 – подготовка к семинарским занятиям,  х4  –
сон.
Введём обозначения признаков-факторов: 1 – посещаемость занятий на  1  курсе
(ч/нед); 2 –  самообразование  (ч/нед);  3  –  подготовка  к  семинарским  и
практическим занятиям (ч/нед); 4 – сон (ч/сут); 0 – средний балл зачётки  по
итогам экзаменов за 1 курс.
           Расчётная таблица для моделей многофакторной регрессии.
                                                                   Таблица 2
|Модель многофакторной  |R2                     |E2                     |
|регрессии              |                       |                       |
|1-2-3-4                |0,39                   |0,45                   |
|1-2-3                  |0,37                   |0,46                   |
|2-3-4                  |0,23                   |0,51                   |
|1-3-4                  |0,38                   |0,45                   |
|1-2                    |0,33                   |0,47                   |
|1-3                    |0,36                   |0,46                   |
|1-4                    |0,35                   |0,47                   |
|2-3                    |0,20                   |0,52                   |
|2-4                    |0,05                   |0,56                   |
|3-4                    |0,22                   |0,51                   |

По трём критериям выбираем оптимальную модель.
   1. число факторов минимально (2)
   2. max R,       R = 0,36
   3. min E,        E = 0,46
Следовательно, оптимальной моделью является модель  1-3.  Значит,  признаки-
факторы «посещаемость занятий  на  1  курсе»  и  «подготовка  к  семинарским
занятиям» влияют значительнее других факторов на признак-результат.
Среднеквадратическая ошибка уравнения многофакторной регрессии небольшая  по
сравнению  с  ошибками,  рассчитанными  для  других  моделей  многофакторной
регрессии.
Составляю для этой модели уравнение регрессии в естественных масштабах.
Х0/1,3 = a + b1x1 + b3x3
                           Корреляционная матрица.
                                                                   Таблица 3
|                 |0                |1                |3                |
|0                |1,00             |0,57             |0,48             |
|1                |0,57             |1,00             |0,47             |
|3                |0,43             |0,47             |1,00             |

t0/1,3 = (1t1 + (3t3
0,57 = (1 + 0,47(3                      0,57 =  (1  +  0,47(0,44  –  0,47(1)
         (1 = 0,4
0,44  =   0,47(1   +   (3                         (3   =   0,44   –   0,47(1
                                    (3 = 0,25
t0/1,3 = 0,4t1 + 0,25t3
b1 = ((0 / (x1) (1 = (0,47 / 4,4) 0,4 = 0,071
b3 = ((0 / (x3) (3 = (0,79 / 2,68) 0,25 = 0,073
a = x0 – b1x1 – b3x3 = 4,27 – 0,071 ( 16,13 – 0,073 ( 4,08 = 2,8
имеем: х0/1,3 =2,8 + 0,071х1 + 0,073х3 –  уравнение  линейной  множественной
регрессии.
R0/1,3 = ((1r01 + (3r03
R0/1,3 = (0,4 ( 0,58 + 0,25 ( 0,48 = 0,6

Вывод: коэффициент (1 говорит  о  том,  что  признак-результат—средний  балл
зачётки за 1 курс на 0,4 долю  от  своего  среднеквадратического  отклонения
(0,4 ( 0,79 = 0,316 балла) при изменении признака-фактора—посещаемости на  1
курсе на одно своё СКО (4,4 ч/нед).
(3 – средний балл зачётки изменится на 0,25 долю от своего СКО  (0,25   0,79
= 0,179 балла)  при  увеличении  признака-фактора—подготовки  к  семинарским
занятиям на одно своё СКО (2,68 ч/сут).
Т. к. (1  <  (3,  следовательно  фактор  1—посещаемость  занятий  влияет  на
средний балл зачётки больше, чем фактор 3—подготовка к занятиям.
R2 говорит о том, что 36% общей вариации значений среднего балла зачётки  на
1 курсе вызвано влиянием посещаемости и  подготовки  к  занятиям.  Остальные
60% вызваны прочими факторами.
R  =  0,58  свидетельствует  о  том,  что  между  посещаемостью  занятий   и
подготовкой к ним и средним  баллом  зачётки  существует  заметная  линейная
зависимость.
Коэффициент  b1 говорит о том, что если посещаемость занятий  увеличится  на
1 ч/нед, то средний балл зачётки увеличится в среднем на  0,071  балла,  при
условии неизменности всех остальных факторов. b2 говорит  о  том,  что  если
подготовка к занятиям увеличится на 1  ч/нед,  то  средний  балл  зачётки  в
среднем увеличится на 0,073 балла.



                                           (1             =              0,4
     (3 = 0,25

                                                r01 = 0,52

                                                                         r03
= 0,44


                                                   r13 = 0,47



Граф связи признаков-факторов:  х2  –  подготовки  к  семинарским  занятиям,
ч/нед; х1  -  посещаемости  занятий,  ч/нед  с  признаком-результатом  х0  –
средним баллом зачётки по итогам экзаменов за 1 курс.
(1  –  мера  непосредственного  влияния  на  признак-результат  посещаемости
занятий.
(3 – мера непосредственного влияния подготовки к занятиям  на  средний  балл
зачётки.

r01  =  (1  +  r13(3,  где  r01  –  общее  влияние  х1  на  r13(3   –   мера
опосредованного влияния х1 через х3 на х0.
r01 = 0,4 + 0,47 ( 0,25 = 0,52
r03  =  (3  +  r31(1,  где  r03  –  общее  влияние  х3  на  r31(1   –   мера
опосредованного влияния х3 через х1 на х0.
                          Лабораторная работа № 3.
Тема: «Дисперсионное отношение. Эмпирическая и аналитическая регрессии.»
Цель:  выявление  зависимости  между   признаками-факторами   и   признаком-
результатом.
                        Таблица с исходными данными.
                                                                   Таблица 1
|Средний балл   |Посещаемость       |Самообразование   |Подготовка к      |
|зачётки по     |занятий на первом  |(доп. Курсы)      |семинарским       |
|итогам         |курсе (ч/нед)      |(ч/нед)           |занятиям (ч/нед)  |
|экзаменов за   |                   |                  |                  |
|1-ый курс      |                   |                  |                  |
|(баллы)        |                   |                  |                  |
|4,7            |19,5               |0                 |5                 |
|4,5            |22                 |2                 |6                 |
|4,2            |22                 |0                 |2                 |
|4,3            |19,5               |0                 |7                 |
|4,5            |17,5               |0                 |3                 |
|4,2            |9,5                |6                 |12                |
|4,0            |12,5               |0                 |5                 |
|4,7            |22                 |4                 |7                 |
|4,6            |17,5               |3                 |4                 |
|4,7            |9,5                |0                 |2                 |
|4,5            |11,5               |6                 |3                 |
|4,0            |11,5               |2                 |3                 |
|4,2            |19,5               |4                 |8                 |
|4,0            |20,5               |6                 |9                 |
|3,2            |9,5                |0                 |0                 |
|4,0            |17,5               |0                 |8                 |
|3,2            |14,5               |0                 |2                 |
|3,5            |14,5               |0                 |2                 |
|4,8            |22                 |0                 |10                |
|4,6            |8,5                |0                 |1                 |
|4,5            |22                 |0                 |4                 |
|4,5            |22                 |6                 |2                 |
|4,2            |17,5               |4                 |4                 |
|4,5            |14,5               |6                 |4                 |
|4,2            |11,5               |2                 |2                 |
|4,8            |17,5               |0                 |4                 |
|4,0            |10,5               |0                 |2                 |
|4,2            |17,5               |2                 |6                 |
|3,0            |9,5                |0                 |0                 |
|4,8            |19,5               |2                 |2                 |
|4,8            |19,5               |2                 |6                 |
|4,3            |17,5               |4                 |2                 |
|3,2            |6,0                |0                 |0                 |
|4,5            |22                 |2                 |5                 |
|4,7            |22                 |4                 |3                 |
|4,2            |22                 |3                 |5                 |
|4,6            |9,5                |0                 |1                 |
|3,0            |14,0               |0                 |2                 |
|3,0            |6,5                |0                 |5                 |
|4,0            |22                 |2                 |5                 |
|4,7            |17,5               |6                 |0                 |
|3,5            |11,5               |0                 |6                 |
|4,7            |22                 |6                 |2                 |
|4,5            |22                 |0                 |0                 |
|3,2            |17,5               |4                 |8                 |
|4,8            |22                 |0                 |0                 |
|3,2            |9,5                |0                 |5                 |
|4,5            |17,5               |0                 |3                 |
|3,0            |14,5               |5                 |3                 |
|4,7            |11,5               |5                 |3                 |

Рассматриваю первую пару признаков: признак-фактор—посещаемость  занятий  на
1  курсе  (ч/нед)  и  признак-результат—средний  балл  зачётки   по   итогам
экзаменов за 1 курс (баллы). Далее обосную взаимосвязь между ними.
Расчётная таблица №1
                                                                   Таблица 2

|Посещаемость|Число  |xi    |yi    |(yi   |(2yi  |(2yi  |yi - y|(yi–y)|
|занятий     |наблюде|      |      |      |      |(i    |      |2(I   |
|(ч/нед)     |ний    |      |      |      |      |      |      |      |
|[6-10]      |9      |8,6   |3,7   |0,71  |0,5   |4,5   |-0,5  |2,25  |
|[10-14]     |8      |11,5  |4,1   |0,38  |0,14  |1,12  |-0,1  |0,08  |
|[14-18]     |15     |16,4  |3,7   |1,01  |1,02  |15,3  |-0,5  |3,75  |
|[18-22]     |18     |19,6  |4,4   |0,31  |0,09  |1,62  |0,4   |2,88  |
|Сумма       |50     |-     |-     |-     |-     |22,54 |-     |8,96  |
|Средняя     |-      |15,3  |4,0   |-     |-     |5,6   |-     |2,24  |

(2y = (((yi–y)2(I)
( 2y = 8,96 / 50 = 0,1792 (балла)2

E2y= ((б2yi(I) / ((I
E2y = (4,5 + 1,12 + 15,3 + 1,62) / 50 = 0,4508(балла)2

б2y = E2y + ( 2y = 0,4508 + 0,1792 = 0,63 (балла)2

(2 = ( 2y / б2y = 0,1792 / 0,63 = 0,28   (0,28%)
                     построение аналитической регрессии.
yx = a + bx
xy = ((xy(I) / ((I = 62,52
б2x = 19,4 (ч/нед)2
b = (xy – x y) / б2x = (62,52 – 15,3 ( 4,0) / 19,4 = 0,068
a = y – bx = 4,0 – 0,068 ( 15,3 = 2,96

Линейное уравнение регрессии зависимости среднего балла зачётки  за  1  курс
от посещаемости: строим по двум точкам
yx = 2,96 + 0,068х
   1. yx = 2,96 + 0,068 ( 6 = 3,358
   2. yx = 2,96 + 0,068 ( 22 = 4,446
rxy = (xy – x y) / бxбy = 0,37



Корреляционное поле
Эмпирическая линия регрессии
Аналитическая линия регрессии

Распределение   среднего   балла   зачётки   за   1   курс   по    признаку-
фактору—посещаемости занятий на 1 курсе.

Вывод: (2 свидетельствует о том,  что  28%  общей  вариации  результативного
признака вызвано влиянием признака фактора—посещаемостью.  Остальные  72%  -
вызваны  влиянием  прочих  факторов.   Можно   сказать,   что   это   слабая
корреляционная зависимость. Интерпретируя параметр b, предполагаем, что  для
данной совокупности студентов с увеличением посещаемости занятий на 1  курсе
на 1 ч/нед средний балл зачётки увеличивается на 0,068 балла. rxy говорит  о
том, что между признаком-результатом и признаком-фактором заметная  линейная
связь.
Рассматриваю вторую пару признаков:
Расчётная таблица № 2.
                                                                   Таблица 3

|Подготовка|Число  |xi    |yi    |(yi   |(2yi  |(2yi  |yi - y|(yi–y)|
|к         |наблюде|      |      |      |      |(i    |      |2(i   |
|семинарски|ний    |      |      |      |      |      |      |      |
|м занятиям|       |      |      |      |      |      |      |      |
|(ч/нед)   |       |      |      |      |      |      |      |      |
|[0-3]     |20     |1,2   |3,78  |0,63  |0,39  |7,8   |-0,22 |0,96  |
|[3-6]     |18     |4,0   |4,31  |0,45  |0,2   |3,6   |0,31  |1,72  |
|[6-9]     |9      |6,8   |4,46  |0,28  |0,07  |0,63  |0,46  |1,9   |
|[9-12]    |2      |9,5   |4,4   |0,399 |0,15  |0,3   |0,4   |0,32  |
|Сумма     |50     |-     |-     |-     |-     |2,33  |-     |4,9   |
|средняя   |-      |3,5   |4,0   |-     |-     |3,08  |-     |1,2   |

(2y = (((yi–y)2(I)
( 2y = 4,9 / 50 = 0,098 (балла)2

E2y= ((б2yi(I) / ((I
E2y = 12,33 / 50 = 0,25 (балла)2

б2y = E2y + ( 2y = 0,35 (балла)2

(2 = ( 2y / б2y = 0,098 / 0,35 = 0,28   (0,28%)
( = 0,53
                     построение аналитической регрессии.

yx = a + bx
xy = ((xy(I) / ((I
xy = 15,2
б2x = 7,2 (ч/нед)2
b = (xy – x y) / б2x = (15,2 – 3,5 ( 4,0) / 7,2 = 0,16
a = y – bx = 4,0 – 0,16 ( 3,4

Линейное уравнение регрессии зависимости среднего балла зачётки  за  1  курс
от подготовки к семинарским занятиям:
yx = 2,96 + 0,068х
x = 0        y = 3,4
x = 7        y = 4,5
rxy = (xy – x y) / бxбy = (15,2 – 14) / 2,6 = 0,46



Корреляционное поле
Эмпирическая линия регрессии
Аналитическая линия регрессии

Распределение   среднего   балла   зачётки   за   1   курс   по    признаку-
фактору—подготовке к семинарским занятиям.
Вывод: (2 свидетельствует о том,  что  28%  общей  вариации  результативного
признака  вызвано  влиянием  признака  фактора—подготовкой   к   семинарским
занятиям. Остальные 72% - вызваны влиянием прочих факторов.  Можно  сказать,
что  это  слабая  корреляционная  зависимость.  Интерпретируя  параметр   b,
предполагаем,  что  для  данной   совокупности   студентов   с   увеличением
подготовки  к  занятиям  на  1  курсе  на  1  ч/нед  средний  балл   зачётки
увеличивается на 0,16  балла.  rxy  говорит  о  том,  что  между  признаком-
результатом и признаком-фактором есть умеренная линейная связь.
Рассматриваю третью пару признаков:
Расчётная таблица № 3
                                                                   Таблица 4

|Самообразовани|Число |xi    |yi    |(yi   |(2yi  |(2yi  |yi - y|(yi–y)|
|е (ч/нед)     |наблюд|      |      |      |      |(i    |      |2(i   |
|              |ений  |      |      |      |      |      |      |      |
|0             |25    |0     |4,07  |0,68  |0,46  |11,5  |-0,03 |0,022 |
|2             |8     |2     |4,38  |0,3   |0,09  |0,72  |0,28  |0,62  |
|3             |2     |3     |4,40  |0,2   |0,04  |0,08  |0,3   |0,18  |
|4             |6     |4     |4,22  |0,5   |0,25  |1,5   |0,12  |0,08  |
|5             |2     |5     |3,35  |0,35  |0,12  |0,24  |-0,75 |1,16  |
|6             |7     |6     |3,3   |0,40  |0,16  |1,12  |0,2   |0,28  |
|Сумма         |50    |-     |-     |-     |-     |15,88 |-     |2,34  |
|средняя       |-     |1,96  |4,1   |-     |-     |0,31  |-     |0,39  |

(2y = (((yi–y)2(I)
( 2y = 2,34 / 50 = 0,046 (балла)2

E2y= ((б2yi(I) / ((I
E2y = 15,88 / 50 = 0,31 (балла)2

б2y = E2y + ( 2y = 0,31 + 0,046 = 0,36 (балла)2

(2 = ( 2y / б2y = 0,046 / 0,36 = 0,13   (13%)
( = 0,36
                     построение аналитической регрессии.

yx = a + bx
xy = ((xy(I) / ((I
xy = 8,22
б2x = 5,1 (ч/нед)2
b = (xy – x y) / б2x = (8,22 – 8,036) / 5,1 = 0,032
a = y – bx = 4,1 – 0,032 ( 1,96 = 4,03

Линейное уравнение регрессии зависимости среднего балла зачётки  за  1  курс
от самообразования:
yx = 2,96 + 0,068х
x = 0        y = 3,4
x = 7        y = 4,5
rxy = (xy – x y) / бxбy = (8,2 – 8,036) / 2,25 ( 0,6 = 0,12



Корреляционное поле
Эмпирическая линия регрессии
Аналитическая линия регрессии

Вывод: (2 свидетельствует о том,  что  13%  общей  вариации  результативного
признака вызвано влиянием признака фактора—самообразованием. Можно  сказать,
что  это  очень   слабая   корреляционная   связь.   Зная   коэффициент   b,
предполагаем,  что  для  данной   совокупности   студентов   с   увеличением
самообразования на 1 ч/нед  средний  балл  зачётки  увеличивается  на  0,032
балла. rxy говорит о  том,  что  между  признаком-результатом  и  признаком-
фактором есть слабая прямая линейная связь.
                     Министерство Высшего Образования РФ
   Санкт-Петербургский Государственный Инженерно-Экономический Университет



                             Лабораторные работы



                                По статистике



                                                           Студентки 1 курса
                                                                 Группы 3292
                                                     Специальность коммерция
                                                             Харькиной Анны.



Преподаватель: Карпова Г. В.
Оценка:


                                  СПб 2001


-----------------------
                                     Х1

[pic]

                                     Х0

Х3





смотреть на рефераты похожие на "Курсовая работа"