Компьютерные информационные технологии курс лекций


Скачать 4.88 Mb.
Название Компьютерные информационные технологии курс лекций
страница 8/19
Тип Документы
rykovodstvo.ru > Руководство эксплуатация > Документы
1   ...   4   5   6   7   8   9   10   11   ...   19

Регрессионный и корреляционный анализ



Регрессионный и корреляционный анализ позволяет установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин X, и делать прогнозы значений Y. Параметр Y, значение которого нужно предсказывать, является зависимой переменной. Параметр X, значения которого нам известны заранее и который влияет на значения Y, называется независимой переменной. Например, X – величина затрат компании на рекламу своего товара, Y – объем продаж этого товара и т.д.

Корреляционная зависимость Y от X – это функциональная зависимость вида

,

где  – среднее арифметическое (условное среднее) всех возможных значений параметра Y, которые соответствуют значению . Уравнение называется уравнением регрессии Y на X, функция  – регрессией Y на X, а ее график – линией регрессии Y на X.

Основная задача регрессионного анализа – установление формы корреляционной связи, т.е. вида функции регрессии (линейная, квадратичная, показательная и т.д.).
Метод наименьших квадратов

Метод наименьших квадратов позволяет определить коэффициенты уравнения регрессии таким образом, чтобы точки, построенные по исходным данным , лежали как можно ближе к точкам линии регрессии. Формально это записывается как минимизация суммы квадратов отклонений (ошибок) функции регрессии и исходных точек

,

где  – значение, вычисленное по уравнению регрессии;  – отклонение (ошибка, остаток); n – количество пар исходных данных.



Простейший вариант модели - прямая линия на плоскости.



где b - значение y при x=0;
a=tg(α) - тангенс угла наклона прямой по отношению к оси x.





Возможные варианты модели


Анализ отклонений

Первый шаг


Второй шаг


Третий шаг


Четвертый шаг


Пятый шаг







Понятие отклонения для случая линейной регрессии
В регрессионном анализе предполагается, что математическое ожидание случайной величины равно нулю и ее дисперсия одинакова для всех наблюдаемых значений Y. Отсюда следует, что рассеяние данных возле линии регрессии должно быть одинаково при всех значениях параметра X. В случае, показанном на рисунке, приведенном ниже, данные распределяются вдоль линии регрессии неравномерно, поэтому метод наименьших квадратов в этом случае неприменим.



Неравномерное распределение исходных точек вдоль линии регрессии
Основная задача корреляционного анализа 

Основная задача корреляционного анализа – оценка тесноты (силы) корреляционной связи. Теснота корреляционной зависимости Y от X оценивается по величине рассеяния значений параметра Y вокруг условного среднего . Большое рассеяние говорит о слабой зависимости Y от X, либо об ее отсутствии и, наоборот, малое рассеяние указывает на наличие достаточно сильной зависимости.

Коэффициент детерминации (по другому – детерминированности) показывает, на сколько процентов () найденная функция регрессии описывает связь между исходными значениями параметров X и Y
,

где  – объясненная вариация;  – общая вариация.


Графическая интерпретация коэффициента детерминации

для случая линейной регрессии

Соответственно, величина показывает, сколько процентов вариации параметра Y обусловлены факторами, не включенными в регрессионную модель. При высоком () значении коэффициента детерминации можно делать прогноз для конкретного значения .
Линейная регрессия

Коэффициенты линейной регрессии вычисляются по следующим формулам (все суммы берутся по n парам исходных данных)


.
Нелинейная регрессия

Рассмотрим наиболее простые случаи нелинейной регрессии: гиперболу, экспоненту и параболу. При нахождении коэффициентов гиперболы и экспоненты используют прием приведения нелинейной регрессионной зависимости к линейному виду. Это позволяет использовать для вычисления коэффициентов функций регрессии формулы линейной зависимости.
Гипербола

При нахождении гиперболы вводят новую переменную , тогда уравнение гиперболы принимает линейный вид . После этого используют формулы для нахождений линейной функции, но вместо значений используются значения

; .
Экспонента

Для приведения к линейному виду экспоненты проводят логарифмирование

;

;

.

Введя переменные и , тогда , откуда следует, что можно применять формулы линейной зависимости, в которых вместо значений надо использовать

; .

При этом получаем численные значения коэффициентов и , от которых надо перейти к и , используемых в модели экспоненты. Исходя из введенных обозначений и определения логарифма, получаем

, .
Парабола

Для нахождения коэффициентов параболы необходимо решить линейную систему из трех уравнений



При вычислении коэффициента детерминации экспоненты все значения параметра Y (исходные, регрессионные, среднее) необходимо заменить на их логарифмы, например,  – на и т.д.

1   ...   4   5   6   7   8   9   10   11   ...   19

Похожие:

Компьютерные информационные технологии курс лекций icon Компьютерные информационные технологии курс лекций
Именно этим опреде­ляется актуальность и необходимость освоения основ компью­терных информационных технологий. Знание компьютерных...
Компьютерные информационные технологии курс лекций icon Российской Федерации Тольяттинский государственный университет Кафедра...
Курс лекций дисциплины «Компьютерные технологии и сапр» для студентов специальностей 120500, 120507, 120700 очной
Компьютерные информационные технологии курс лекций icon Учебное пособие (Курс лекций) по учебной дисциплине «Информационные...
Демьянов А. В. преподаватель фгбоу впо «Брянская государственная сельскохозяйственная академия» Мичуринского филиала
Компьютерные информационные технологии курс лекций icon Отчет по практике «Информационные компьютерные системы и технологии...
«Информационные компьютерные системы и технологии в ресторанно-гостиничном бизнесе»
Компьютерные информационные технологии курс лекций icon Лекция Введение в курс «Компьютерные технологии в науке и образовании»
Лекция Классификация и характеристика программных средств информационной технологии обучения (ито) 18
Компьютерные информационные технологии курс лекций icon Курс лекций ббк20. 1 я7 к 17 Калыгин В. Г
К а л ы г и н В. Г. Промышленная экология. Курс лекций. М.: Изд-во мнэпу, 2000. 240 с
Компьютерные информационные технологии курс лекций icon Конспект лекций по дисциплине системы обработки экономической информации...
Понятие информационная потребность тесно связано с понятием цели и функции управления. Можно сказать, что потребность в информации...
Компьютерные информационные технологии курс лекций icon 1. Предмет и основные понятия корпоративных информационных систем. 4
Компьютерные информационные технологии в управлении экономическим объектом. Классификация систем управления. 4
Компьютерные информационные технологии курс лекций icon Компьютерные, сетевые и информационные технологии
Магда Ю. С. Микроконтроллеры pic 24. Архитектура и программирование / Ю. С. Магда.— Москва : дмк : Додэка-xxi, 2009.— 240 с
Компьютерные информационные технологии курс лекций icon Курс лекций по дисциплине: «Санитария и гигиена» 2015г
Курс лекций предназначен для изучения дисциплины «Санитария и гигиена» обучающимися 1 курса специальности «Парикмахер»
Компьютерные информационные технологии курс лекций icon Курс лекций, прочитанный для студентов Московской Духовной Академии «Духовная Библиотека»
Когда я по благословению церковных властей читал курс лекций в Академии, то не предполагал, что они когда-нибудь будут изданы
Компьютерные информационные технологии курс лекций icon Курс лекций по дисциплине оп. 13 «автомобильные эксплуатационные материалы» 2016 г
Курс лекций содержит основные сведения по производству и применению автомобильных эксплуатационных материалов. В данном курсе рассмотрены...
Компьютерные информационные технологии курс лекций icon Морозова М. А. Информационные технологии в социально-культурном сервисе и туризме. Оргтехника
Информационные технологии, используемые в гостиничном комплексе «Континент»
Компьютерные информационные технологии курс лекций icon Программа дисциплины «информационные технологии в менеджменте» для...
Дисциплина включает два раздела: «Часть I. Методы и инструменты анализа данных в логистике» (I курс, 3 и 4 модуль) и «Часть II. Системы...
Компьютерные информационные технологии курс лекций icon Курс лекций Педагогическое общество России Москва 2001
Б 53 Социальное прогнозирование. Курс лекций.— М.: Педагогическое общество России 2002. — 392 с
Компьютерные информационные технологии курс лекций icon Т. Е. Мамонова информационные технологии
Информационные технологии. Организация информационных процессов. Технология компьютерного моделирования: учебное пособие / Т. Е....

Руководство, инструкция по применению




При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск