Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Анализ и представление данных психологического исследования

Содержание

Задача регрессионного анализаЗадача регрессионного анализ (РА) состоит в построении модели, позволяющей по значениям независимых переменных получать оценки значений зависимой переменной.Используется также для выявления связи переменных.
Анализ и представление данных психологического исследованияЛекция 7. Регрессионный анализ Задача регрессионного анализаЗадача регрессионного анализ (РА) состоит в построении модели, позволяющей по Типы переменных регрессионной моделиЗависимая (результирующая) – в модели играет роль функции, значение Типы переменных регрессионной моделиЗависимая переменная:непрерывнаяНезависимые переменныенепрерывные,дискретные,категориальные Формула для прямой линииПрямая линия описывается линейной функцией y = a + Как интерпретировать коэффициент b?Знак b говорит о направлении связи. Значение b показывает, Проведение регрессионной линииЗадача: провести через множество точек линию, которая наилучшим образом описывала Метод наименьших квадратов (МНК)	Сумма расстояний будет близка к нулю, т.к. часть из Вернемся к примеры об IQ и доходеЗарплата = -19403 + 327 * Ожидаемые значенияРегрессионная формула позволяет определить ожидаемые (предсказанные) значения y для определённого уровня Источники ошибокОшибки (остатки) являются неотъемлемой частью регрессионных уравнений. Случаи, когда одна переменная Регрессия – вероятностная модельФормула регрессионной функции:	E(y) = a + βx, где E(y) Значимость и сила связиЗначимость и сила статистической связи – два разных понятия. Коэффициент детерминации R-квадратR-квадрат является квадратом коэффициента корреляцииR-квадрат принимает значения от 0 до Статистическая связь и причинностьНаличие статистической связи не означает наличия причинной связи между Условия использования РАВсе переменные должны быть случайными, подчиняться нормальному распределению.Линейная регрессия используется Методы устранения или уменьшения мультиколлинеарностиИсключение одного из двух сильно связанных факторов.Переход от Построение моделиКачество результатов регрессионного анализа определяется качеством теоретического обоснования спецификации модели.Как выбирать Этапы построения модели регрессииПроверка распределения всех переменных на нормальностьПроверка объясняющих переменных на 1. Проверка распределения всех переменных на нормальностьКритерий Колмогорова-СмирноваПеременные, не являющиеся нормально распределенными, 2. Проверка объясняющих переменных на наличие мультиколлинеарностиАнализ матрицы коэффициентов парной корреляции		Если коэффициент Методы устранения или уменьшения мультиколлинеарностиИсключение одного из двух сильно связанных факторов.Переход от 3. Построение линейного уравнения регрессииAnalyze – Regression – Linear… 4. Оценка качества моделиКоэффициент детерминации R2 (Доля вариации результативного признака под воздействием 4. Оценка качества модели-2Проверка распределение остатков		Критерий Колмогорова-Смирнова 5. Построение прогноза по модели регрессииНеобходимо построить регрессионное уравнение Помощь = 1,033*симпатия+1,257*польза+1,168*агрессия
Слайды презентации

Слайд 2 Задача регрессионного анализа
Задача регрессионного анализ (РА) состоит в

Задача регрессионного анализаЗадача регрессионного анализ (РА) состоит в построении модели, позволяющей

построении модели, позволяющей по значениям независимых переменных получать оценки

значений зависимой переменной.

Используется также для выявления связи переменных.


Слайд 3 Типы переменных регрессионной модели
Зависимая (результирующая) – в модели

Типы переменных регрессионной моделиЗависимая (результирующая) – в модели играет роль функции,

играет роль функции, значение которой определяется значениями объясняющих переменных.

Независимые

(объясняющие) – в модели играют роль аргументов, определяют значения результирующей переменной. Их называют предикторами, или факторными признаками.


Слайд 4 Типы переменных регрессионной модели
Зависимая переменная:
непрерывная

Независимые переменные
непрерывные,
дискретные,
категориальные

Типы переменных регрессионной моделиЗависимая переменная:непрерывнаяНезависимые переменныенепрерывные,дискретные,категориальные

Слайд 8 Формула для прямой линии
Прямая линия описывается линейной функцией

Формула для прямой линииПрямая линия описывается линейной функцией y = a

y = a + bx,
Где a – это точка,

в которой прямая пересекает ось y, b – тангенс угла наклона прямой.
Если b>0, то прямая идет «вверх», т.е. с увеличением x увеличивается y. Связь положительна.
Если b<0, то прямая идет «вниз», т.е. с увеличением x уменьшается y. Связь отрицательна.
Если b=0, то прямая идет параллельно оси x (y=a). Изменения x не влияют на значение y. Связь отсутствует.


Слайд 9 Как интерпретировать коэффициент b?
Знак b говорит о направлении

Как интерпретировать коэффициент b?Знак b говорит о направлении связи. Значение b

связи.
Значение b показывает, насколько измениться y если x

изменить на единицу.
Например, y = 2 + 5x. Если x1 = 5, то y1 = 27. Если x2 = 6, то н2 = 32. y2 – y1 = 32 – 27 = 5 = b.
В данном случае b>0, поэтому y растет с увеличением x.

Слайд 10 Проведение регрессионной линии
Задача: провести через множество точек линию,

Проведение регрессионной линииЗадача: провести через множество точек линию, которая наилучшим образом

которая наилучшим образом описывала бы это множество.
Наилучшей линией будет

такая, для которой расстояние от линии до точек будет минимальным.

Слайд 11 Метод наименьших квадратов (МНК)
Сумма расстояний будет близка к

Метод наименьших квадратов (МНК)	Сумма расстояний будет близка к нулю, т.к. часть

нулю, т.к. часть из них являются положительными, часть –

отрицательными величинами. Поэтому:
Можно сложить модули расстояний.
Можно сложить квадраты расстояний. По ряду статистических причин в качестве наилучшего метода для построения регрессионной линии используется метод наименьших квадратов.

Слайд 12 Вернемся к примеры об IQ и доходе

Зарплата =

Вернемся к примеры об IQ и доходеЗарплата = -19403 + 327

-19403 + 327 * IQ
a = -19403, b =

327.
Соответственно, согласно этой модели, с увеличением IQ на один пункт зарплата увеличивается на 327 руб. в месяц.

Слайд 13 Ожидаемые значения
Регрессионная формула позволяет определить ожидаемые (предсказанные) значения

Ожидаемые значенияРегрессионная формула позволяет определить ожидаемые (предсказанные) значения y для определённого

y для определённого уровня х.
В примере для IQ =

90 ожидаемое значение зарплаты будет = -19403 + 327*90 = 10027 руб.
Ожидаемые значения y отличаются от реальных значений в базе (у Любы IQ = 90, а зарплата = 8000).
Разница между ожидаемыми и реальными значениями называется остатками (residuals), или ошибками. В случае Любы остаток равен 10027 – 8000 = 2027. Люба получает меньше, чем предсказывает регрессионное уравнение.


Слайд 14 Источники ошибок
Ошибки (остатки) являются неотъемлемой частью регрессионных уравнений.

Источники ошибокОшибки (остатки) являются неотъемлемой частью регрессионных уравнений. Случаи, когда одна

Случаи, когда одна переменная идеально предсказывает другую (все точки

находятся на регрессионной прямой), являются исключением (и не интересны).
Ошибки состоят из двух компонентов:
Ошибки измерения.
Вероятностный компонент, неизменно присущий отношению между двумя переменными.

Слайд 15 Регрессия – вероятностная модель
Формула регрессионной функции:
E(y) = a

Регрессия – вероятностная модельФормула регрессионной функции:	E(y) = a + βx, где

+ βx, где E(y) – ожидаемое значение (среднее) y

на определенном уровне x.

Иначе эту же формулу можно записать так:
y = a + βx + ε, где ε – ошибка.

Слайд 16 Значимость и сила связи
Значимость и сила статистической связи

Значимость и сила связиЗначимость и сила статистической связи – два разных

– два разных понятия.
Значимость: действительно ли x и

y связаны?
Сила: как сильно связаны x и y?
Размер коэффициента b говорит о силе связи. Однако его интерпретация сильно зависит от единиц измерения x. Например, если в нашем примере IQ/10, то коэффициент b уменьшится в 10 раз.
Следовательно, коэффициенты при разных переменных НЕЛЬЗЯ непосредственно сравнивать (но можно сравнивать, если переменные измерены по одной и той же шкале).

Слайд 17 Коэффициент детерминации R-квадрат
R-квадрат является квадратом коэффициента корреляции
R-квадрат принимает

Коэффициент детерминации R-квадратR-квадрат является квадратом коэффициента корреляцииR-квадрат принимает значения от 0

значения от 0 до 1. 1 указывает на идеальную

связь, 0 – на отсутствие связи. Чем больше значение, тем сильнее связь.
R-квадрат можно интерпретировать как долю дисперсии зависимой переменной, которую «объясняет» независимая переменная.
R-квадрат имеет смысл, только когда речь идет о линейной связи.

Слайд 18 Статистическая связь и причинность
Наличие статистической связи не означает

Статистическая связь и причинностьНаличие статистической связи не означает наличия причинной связи

наличия причинной связи между переменными и не позволяет утверждать,

что зависимая переменная влияет на независимую.



Слайд 19 Условия использования РА
Все переменные должны быть случайными, подчиняться

Условия использования РАВсе переменные должны быть случайными, подчиняться нормальному распределению.Линейная регрессия

нормальному распределению.
Линейная регрессия используется тогда(и только тогда!), когда зависимая

переменная является интервальной(метрической).
Зависимость между переменными является линейной.
Математическое ожидание остатков должно приближаться к нулю, т.е. они должны быть нормально распределены.
Отсутствие связи между зависимыми переменными (отсутствие мультиколлинеарности).


Слайд 20 Методы устранения или уменьшения мультиколлинеарности
Исключение одного из двух

Методы устранения или уменьшения мультиколлинеарностиИсключение одного из двух сильно связанных факторов.Переход

сильно связанных факторов.
Переход от первоначальных факторов к их главным

компонентам.
Использование стратегии шагового отбора факторов.

Слайд 21 Построение модели
Качество результатов регрессионного анализа определяется качеством теоретического

Построение моделиКачество результатов регрессионного анализа определяется качеством теоретического обоснования спецификации модели.Как

обоснования спецификации модели.
Как выбирать переменные для включения в модель?


Теоретическая логика
Эксплораторная логика

Следует избегать стратегии «мусорной корзины».

Слайд 22 Этапы построения модели регрессии
Проверка распределения всех переменных на

Этапы построения модели регрессииПроверка распределения всех переменных на нормальностьПроверка объясняющих переменных

нормальность
Проверка объясняющих переменных на наличие мультиколлинеарности
Построение линейного уравнения регрессии
Оценка

качества модели
Построение прогноза по модели регрессии


Слайд 23 1. Проверка распределения всех переменных на нормальность
Критерий Колмогорова-Смирнова

Переменные,

1. Проверка распределения всех переменных на нормальностьКритерий Колмогорова-СмирноваПеременные, не являющиеся нормально

не являющиеся нормально распределенными, не могут использоваться в модели


Слайд 24 2. Проверка объясняющих переменных на наличие мультиколлинеарности

Анализ матрицы

2. Проверка объясняющих переменных на наличие мультиколлинеарностиАнализ матрицы коэффициентов парной корреляции		Если

коэффициентов парной корреляции

Если коэффициент парной корреляции между двумя переменными

больше 0.8, то явление мультиколлинеарности можно считать установленным

Слайд 25 Методы устранения или уменьшения мультиколлинеарности
Исключение одного из двух

Методы устранения или уменьшения мультиколлинеарностиИсключение одного из двух сильно связанных факторов.Переход

сильно связанных факторов.
Переход от первоначальных факторов к их главным

компонентам.
Использование стратегии шагового отбора факторов.

Слайд 26 3. Построение линейного уравнения регрессии
Analyze – Regression –

3. Построение линейного уравнения регрессииAnalyze – Regression – Linear…

Linear…


Слайд 27 4. Оценка качества модели
Коэффициент детерминации R2 (Доля вариации

4. Оценка качества моделиКоэффициент детерминации R2 (Доля вариации результативного признака под

результативного признака под воздействием изучаемых факторов)
Коэффициент множественной корреляции R

(теснота связи зависимой переменной со всеми включенными в модель объясняющими факторами)
F-критерий Фишера (Проверка значимости уравнения регрессии)


Слайд 30 4. Оценка качества модели-2
Проверка распределение остатков
Критерий Колмогорова-Смирнова

4. Оценка качества модели-2Проверка распределение остатков		Критерий Колмогорова-Смирнова

Слайд 31 5. Построение прогноза по модели регрессии
Необходимо построить регрессионное

5. Построение прогноза по модели регрессииНеобходимо построить регрессионное уравнение

уравнение


  • Имя файла: analiz-i-predstavlenie-dannyh-psihologicheskogo-issledovaniya.pptx
  • Количество просмотров: 93
  • Количество скачиваний: 0