Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.

Обратная связь

Презентация на тему Планирование исследования. Определение размера выборки

Содержание

2. Планирование научных исследованийОпределение целейОпределение задачОпределение переменных и
3. Напомним Контроль систематической ошибкиДизайнКонтроль случайной ошибкиРазмер выборки
4. Задача науки – предсказывать будущееОсновные конкуренты – маги и чародеи
5. Предсказывать легкоРучка всегда падает на полТело впернутое
6. Индивидуум и группа, проблема предсказанийДля каждого конкретного
7. Проблема предсказанийДетерминизм – маги и чародеиСтохастический подход – наука
8. Случайные колебания - вариабельностьЕсть истинный параметрμИ есть
9. Случайная вариабельность - распределение
10. Случайные колебанияНеприятный факт: измеренный показатель отличается от
11. СоответственноЕсли сложить все значения в популяцииΣYi=Σ(μ+εi)=N*μ+Σ(εi)=N*μСоответственно,μ=ΣYi/NИными словами,
12. На самом деле…Мы в реальность предположили, что
13. Распределение фактора случайной ошибкиПо определению, среднее значение
14. Распределение фактора случайной ошибкиФорма распределения определяет типНормальноеЭкспоненциальноеВейбуллаПуассона и т.д.Ширина разброса определяется стандартным отклонением σ.
15. Обратите вниманиеИстинные параметры (популяционные) обозначаются греческими буквамиВыборочные (позднее) - латинскими
16. Стандартное отклонениеσ=SQRT(Σ(Yi-μ)/(n-1))Надо помнить, что иногда s определяется
17. Соответственно, описание данныхИстинный параметрμСтандартное отклонениеσТип распределенияНапример, N(120,20). Распределение ошибки - N(0,σ)
18. Что нам это дает?Распределения и теория диагностики
19. Конкурирующие гипотезыЕсть заболевание (1) или нет (2)Предположим,
20. Конкурирующие гипотезыИзвестно распределениеЗначение у пациента
21. Конкурирующие гипотезыИзвестно распределениеЗначение у пациента
22. 2. Подсчитываем вероятности справедливости каждой гипотезы
23. ДалееДва вариантаПринимаем решение по каждому случаю индивидуально,
24. Установление границ нормыНа самом деле устанавливаем произвольную
25. 2. Подсчитываем вероятности справедливости каждой гипотезычувствительностьспецифичность
26. Se и SpЧувствительностьСпецифичность
27. 3. Создать характеристическую кривую нанеся на график
28. 4. Если точность достаточно высока, необходимо
29. Соответственно, выбираем точку разделения, чтобыМинимизировать количество ложноположительныхМинимизировать количество ложноотрицательныхОптимизировать соотношение ложноположительных и ложноотрицательных значений
30. Выбор точки разделения1.2.3.Min FPMin FNOpt FP|FN
31. Выбранная точка разделенияИспользуется для диагностики.Обратите внимание, что
32. ОднакоМы редко работаем с популяцией (генеральной совокупностью)
33. Выборка 1
34. Выборка 2
35. Выборка 3
36. Популяция5 выборокВыборка 4Выборка 3Выборка 2Выборка 1
37. СоответственноДля каждой выборки тоже можно рассчитать среднее
40. Соответственно,Средние и дисперсии превращаются в случайные величиныДля
41. Выборочные показатели меняются от исследования к исследованиюОднако
42. Центральная предельная теоремаВне зависимости от формы исходного
43. Центральная предельная теоремаВ случае большого количества наблюдений распределение выборочных средних становится нормальным
44. Нормальное распределение
45. Поскольку распределение нормальноеМожно сделать ряд выводов о
46. Напомним, для того, чтобы описать распределение необходимоИстинный
47. Еще раз вернемся к результатам исследованияЕсть выборочное
48. Для описания обеих гипотез надоЗнать истинный параметрДля
49. Приемлемое количество FP|FNТ.е. допустимую ошибкуОшибка I типаВероятность
50. Откуда это все брать?ДисперсияПилотное исследованиеЛитературные данныеОриентировочные методы (диапазон/4)Предполагаемый эффектЛитературные данныеМинимальные клинически значимые различия
51. ОшибкиОбычно уровень ошибки I типа фиксируется в данной отрасли5%, 1%, 0,1%Мощность исследования редко допускается ниже 80%
52. ИтакЗнаяИстинные параметрыСтандартное отклонение (в популяции)Форму распределенияПриемлемые значения
53. Нет, естьПоскольку стандартное отклонение выборочного показателя зависит
54. Принять HaПринять H0правило
55. Квантили распределенияЗначения распределения, для которых известны вероятности
56. СоответственноHo: N(0,σ/√(n))zα=(μ0+ граница)/σ/√(n)Ha: N(X,σ/√(n))zβ=(ma-граница)/ границаОтсюда, поскольку граница-то одна ++++0++||+++Х+++++ граница
57. Наиболее общая формулаN=(zα+zβ)2*σ2/(μ0-μa)2
58. Общая формула, количественный результатЕсли σ неизвестнаЕсли σ известна
59. Размер выборки на группу для α =
60. Общая формула, качественный результатЕсли наблюдений мало:
61. Таблица, качественный результат
62. Общая формула, время до наступления событияN=D/PВо многих
63. Упрощенные формулыТолько t-тест (для качественных и количественных)
64. Желаемая оценка dСогласно Cohen (1988) если размер
65. Дизайн до-и-после (одна группа)
66. Две группы наблюдений
67. Пропорции
68. Кроме тогоЕсть программы
69. SASPROC POWER;TWOSAMPLEMEANS ALPHA=0.02 STDDEV=20 GROUPMEANS=(120 130) POWER=0.8 NPERGROUP=. ;RUN;
70. SAS
71. Stata
72. RR использует размер эффекта d = (M1-M2)/σ
73. R
74. Другой тип задачТочность выводов (оценка распространенности)
75. Оценка параметровСредние (количественные переменные)Доли (качественные переменные)
76. Оценка параметровОпределяем возможные пределы колебаний интересующего нас
77. Эти колебанияОпределяют ширину доверительного интервала.Соответственно, задача определить
78. Соответственно
79. ПримерНадо определить средний уровень артериального давления в
80. РаспространенностьИзвестно, что в этом случаеσ2=p*(1-p)ПоэтомуУчитывая, что дисперсия максимальна при р=0,5, можно оценить максимальное количество обследованных
81. ПримерОценить распространенность с точностью +/-2%Необходимо обследовать n=1/(0,02)2=2500пациентов
82. ПримерНеобходимо оценить распространенность хронического гастрита с точностью +/-3%. Ожидаемая распространенность 12%.n=3.84*0.12*(1-0.12)/(0,03)2=451Необходимо обследовать 451 человека
83. Можно сделать таблицу
84. Таким образомДля описательных исследований размер выборки определяется
85. ИтакДля каждой задачиУказать зависимые переменные, их типОценить
86. ПеременныеСоответственно, изучаемые переменныеПеременные исхода – отклика, результата, зависимыеПеременные воздействия – вмешивающиеся, влияющие, независимые
87. Показатели исходаТе показатели, которые являются индикаторами наступления
88. Показатели исходаПоказатели исхода (зависимые переменные) всегда измеряемые
89. Переменные исходаПервичныеПервичная переменная – предоставляет наиболее клинически
90. Переменные исходаВ протоколе должно быть дано точное
91. Переменные исходаВторичные переменныеПоддерживающие показатели в дополнение к
92. Композитные переменныеОбъединение нескольких переменных в одну, с
93. Переменные глобальной оценкиПеременные для оценки «общей» эффективности
94. Множественные первичные переменныеВ некоторых случаях необходимо иметь
95. Суррогатные переменныеНепрямые показатели, которые коррелируют с интересующим
96. Категоризированные переменныеДихотомизация интервальных или ординальных переменных, а
97. ПеременныеПоказатели, которые измеряются в исследованииИсходя из характеристик измерительного прибора выделяют переменные, измеряющиесяНоминальной шкалойОрдинальной шкалойИнтервальной шкалойШкалой отношений
98. ПеременныеКоличество информации, которая содержится в переменных зависит
99. ПеременныеПоскольку шкала напрямую определяет мощность статистического теста,
100. Однако…Целый ряд исходов, интересующих пациента бинаренЭто номинальная
101. Для удобстваПеременные, измеренные при помощи разных шкал,
102. Показатели исходаПоказатели исхода (зависимые переменные) всегда измеряемые
103. Скачать презентацию
104. Похожие презентации

Планирование научных исследованийОпределение целейОпределение задачОпределение переменных и методов их измеренияВыбор дизайна исследованияВыбор метода статистической обработкиОпределение размера выборкиНаписание протокола исследования и создание ИРК участника

Главная
Информатика
Планирование исследования. Определение размера выборки

Планирование исследования. Определение размера выборки

Планирование научных исследованийОпределение целейОпределение задачОпределение переменных и методов их измеренияВыбор дизайна исследованияВыбор

Напомним Контроль систематической ошибкиДизайнКонтроль случайной ошибкиРазмер выборки

Задача науки – предсказывать будущееОсновные конкуренты – маги и чародеи

Предсказывать легкоРучка всегда падает на полТело впернутое в воду, выпирает на свободу

Индивидуум и группа, проблема предсказанийДля каждого конкретного человека есть только одно значениеОднако

Проблема предсказанийДетерминизм – маги и чародеиСтохастический подход – наука

Случайные колебания - вариабельностьЕсть истинный параметрμИ есть множество небольших факторов, которые на

Случайная вариабельность - распределение

Случайные колебанияНеприятный факт: измеренный показатель отличается от истинного, причем будет отличаться всегдаОднако,

СоответственноЕсли сложить все значения в популяцииΣYi=Σ(μ+εi)=N*μ+Σ(εi)=N*μСоответственно,μ=ΣYi/NИными словами, в случае случайной вариабельности популяционное

На самом деле…Мы в реальность предположили, что у нас есть два фактораИстинное

Распределение фактора случайной ошибкиПо определению, среднее значение равно 0Соответственно, остается описать форму

Распределение фактора случайной ошибкиФорма распределения определяет типНормальноеЭкспоненциальноеВейбуллаПуассона и т.д.Ширина разброса определяется стандартным отклонением σ.

Обратите вниманиеИстинные параметры (популяционные) обозначаются греческими буквамиВыборочные (позднее) - латинскими

Стандартное отклонениеσ=SQRT(Σ(Yi-μ)/(n-1))Надо помнить, что иногда s определяется другими формулами, например в случае

Соответственно, описание данныхИстинный параметрμСтандартное отклонениеσТип распределенияНапример, N(120,20). Распределение ошибки - N(0,σ)

Что нам это дает?Распределения и теория диагностики

Конкурирующие гипотезыЕсть заболевание (1) или нет (2)Предположим, известно глазное давление. У пациента

Конкурирующие гипотезыИзвестно распределениеЗначение у пациента

2. Подсчитываем вероятности справедливости каждой гипотезы

ДалееДва вариантаПринимаем решение по каждому случаю индивидуально, на основании рассмотрения другой информацииБайсовский

Установление границ нормыНа самом деле устанавливаем произвольную точку разделения, которая может быть

2. Подсчитываем вероятности справедливости каждой гипотезычувствительностьспецифичность

3. Создать характеристическую кривую нанеся на график для каждой диагностической границы точку,

4. Если точность достаточно высока, необходимо выбрать точку разделения таким образом,

Соответственно, выбираем точку разделения, чтобыМинимизировать количество ложноположительныхМинимизировать количество ложноотрицательныхОптимизировать соотношение ложноположительных и ложноотрицательных значений

Выбор точки разделения1.2.3.Min FPMin FNOpt FP|FN

Выбранная точка разделенияИспользуется для диагностики.Обратите внимание, что тут, несмотря на вероятности не

ОднакоМы редко работаем с популяцией (генеральной совокупностью) в целомЭто экономически невыгодноВыводы нельзя

Популяция5 выборокВыборка 4Выборка 3Выборка 2Выборка 1

СоответственноДля каждой выборки тоже можно рассчитать среднее (выборочное) и дисперсию (выборочную)Однако в

Соответственно,Средние и дисперсии превращаются в случайные величиныДля того, чтобы их отличать популяционные

Выборочные показатели меняются от исследования к исследованиюОднако они уже результат усредненияm=Σ(μ+εi)/NЭто не

Центральная предельная теоремаВне зависимости от формы исходного распределения, если размер выборки достаточно

Центральная предельная теоремаВ случае большого количества наблюдений распределение выборочных средних становится нормальным

Поскольку распределение нормальноеМожно сделать ряд выводов о возможном распределении выборочных средних.Если будет

Напомним, для того, чтобы описать распределение необходимоИстинный параметрСтандартное отклонениеРаспределениеПри достаточном количестве наблюдений

Еще раз вернемся к результатам исследованияЕсть выборочное среднее.Есть конкурирующие гипотезыПрепарат не работает,

Для описания обеих гипотез надоЗнать истинный параметрДля нулевой гипотезы он прост:μ=0Для альтернативной

Приемлемое количество FP|FNТ.е. допустимую ошибкуОшибка I типаВероятность признать справедливость альтернативной гипотезы, когда

Откуда это все брать?ДисперсияПилотное исследованиеЛитературные данныеОриентировочные методы (диапазон/4)Предполагаемый эффектЛитературные данныеМинимальные клинически значимые различия

ОшибкиОбычно уровень ошибки I типа фиксируется в данной отрасли5%, 1%, 0,1%Мощность исследования редко допускается ниже 80%

ИтакЗнаяИстинные параметрыСтандартное отклонение (в популяции)Форму распределенияПриемлемые значения ошибокМы можем оценить принадлежность результата

Нет, естьПоскольку стандартное отклонение выборочного показателя зависит от размера выборки, это единственный

Квантили распределенияЗначения распределения, для которых известны вероятности наличия значений больших данного называются

СоответственноHo: N(0,σ/√(n))zα=(μ0+ граница)/σ/√(n)Ha: N(X,σ/√(n))zβ=(ma-граница)/ границаОтсюда, поскольку граница-то одна ++++0++||+++Х+++++ граница

Наиболее общая формулаN=(zα+zβ)2*σ2/(μ0-μa)2

Общая формула, количественный результатЕсли σ неизвестнаЕсли σ известна

Размер выборки на группу для α = 0.05 (двухсторонний тест)Как видно из

Общая формула, качественный результатЕсли наблюдений мало:

Общая формула, время до наступления событияN=D/PВо многих случаях функция выживаемости аппроксимируется экспоненциальным

Упрощенные формулыТолько t-тест (для качественных и количественных) – достаточно большой размер выборки

Желаемая оценка dСогласно Cohen (1988) если размер эффекта не превышает 0,2, говорят

SASPROC POWER;TWOSAMPLEMEANS ALPHA=0.02 STDDEV=20 GROUPMEANS=(120 130) POWER=0.8 NPERGROUP=. ;RUN;

RR использует размер эффекта d = (M1-M2)/σ

Другой тип задачТочность выводов (оценка распространенности)

Оценка параметровСредние (количественные переменные)Доли (качественные переменные)

Оценка параметровОпределяем возможные пределы колебаний интересующего нас параметраОценить распространенность с точностью +/-

Эти колебанияОпределяют ширину доверительного интервала.Соответственно, задача определить нужную ширину доверительного интервала (точнее,

ПримерНадо определить средний уровень артериального давления в группе детей в возрасте 5

РаспространенностьИзвестно, что в этом случаеσ2=p*(1-p)ПоэтомуУчитывая, что дисперсия максимальна при р=0,5, можно оценить максимальное количество обследованных

ПримерОценить распространенность с точностью +/-2%Необходимо обследовать n=1/(0,02)2=2500пациентов

ПримерНеобходимо оценить распространенность хронического гастрита с точностью +/-3%. Ожидаемая распространенность 12%.n=3.84*0.12*(1-0.12)/(0,03)2=451Необходимо обследовать 451 человека

Таким образомДля описательных исследований размер выборки определяется исходя из желаемой точности оценки

ИтакДля каждой задачиУказать зависимые переменные, их типОценить разброс данныхВыбрать метод статистического анализаУстановить

ПеременныеСоответственно, изучаемые переменныеПеременные исхода – отклика, результата, зависимыеПеременные воздействия – вмешивающиеся, влияющие, независимые

Показатели исходаТе показатели, которые являются индикаторами наступления исхода (смерть, развитие ИМ) или

Показатели исходаПоказатели исхода (зависимые переменные) всегда измеряемые показатели и исследователь должен понимать,

Переменные исходаПервичныеПервичная переменная – предоставляет наиболее клинически значимые и прямые доказательства для

Переменные исходаВ протоколе должно быть дано точное определение первичной переменной, которое будет

Переменные исходаВторичные переменныеПоддерживающие показатели в дополнение к первичной переменной или Показатели эффекта

Композитные переменныеОбъединение нескольких переменных в одну, с использованием четко прописанного алгоритмаПозволяет избавиться

Переменные глобальной оценкиПеременные для оценки «общей» эффективности или «общей» безопасностиОбычно имеют субъективный

Множественные первичные переменныеВ некоторых случаях необходимо иметь несколько первичных переменных (диапазон эффектов)Необходимо

Суррогатные переменныеНепрямые показатели, которые коррелируют с интересующим клиническим исходомПо возможности не должны

Категоризированные переменныеДихотомизация интервальных или ординальных переменных, а также иное снижение размерности шкалыИногда

ПеременныеПоказатели, которые измеряются в исследованииИсходя из характеристик измерительного прибора выделяют переменные, измеряющиесяНоминальной шкалойОрдинальной шкалойИнтервальной шкалойШкалой отношений

ПеременныеКоличество информации, которая содержится в переменных зависит от типа шкалы, при помощи

ПеременныеПоскольку шкала напрямую определяет мощность статистического теста, то чем более точный измерительный

Однако…Целый ряд исходов, интересующих пациента бинаренЭто номинальная переменнаяПоскольку ДМ считает только важные

Для удобстваПеременные, измеренные при помощи разных шкал, имеют дополнительные названияКачественные (номинальные)Полуколичественные (ординальные)Количественные

Пять этапов формирования групп исследованияОпределить популяцию, сформулировав:Критерии включенияКритерии исключенияОпределить размер группОпределить размер

Слайды презентации

Слайд 2 Планирование научных исследований
Определение целей
Определение задач
Определение переменных и методов

Планирование научных исследованийОпределение целейОпределение задачОпределение переменных и методов их измеренияВыбор дизайна

их измерения
Выбор дизайна исследования
Выбор метода статистической обработки
Определение размера выборки
Написание

протокола исследования и создание ИРК участника

Слайд 3 Напомним
Контроль систематической ошибки
Дизайн
Контроль случайной ошибки
Размер выборки

Слайд 4 Задача науки – предсказывать будущее
Основные конкуренты – маги

и чародеи

Слайд 5 Предсказывать легко
Ручка всегда падает на пол

Тело впернутое в

Предсказывать легкоРучка всегда падает на полТело впернутое в воду, выпирает на

воду, выпирает на свободу с силой выпертой воды, телом

впернутом туды

Но это не всегда так легко…

Слайд 6 Индивидуум и группа, проблема предсказаний
Для каждого конкретного человека

Индивидуум и группа, проблема предсказанийДля каждого конкретного человека есть только одно

есть только одно значение
Однако у разных людей значения немного

различаются и мы не можем объяснить, почему
Или они отличаются у одного человека и мы не можем объяснить почему
Или можем, но использовать данную информацию для предсказаний будет очень накладно

Слайд 7 Проблема предсказаний
Детерминизм – маги и чародеи

Стохастический подход –

наука

Слайд 8 Случайные колебания - вариабельность
Есть истинный параметр
μ
И есть множество

Случайные колебания - вариабельностьЕсть истинный параметрμИ есть множество небольших факторов, которые

небольших факторов, которые на него влияют
Соответственно, наблюдаемое значение
Yi=μ+εi
Если записать

все возможные для данной популяции значения Y и частоту их встречаемости, то получим распределение

Слайд 9 Случайная вариабельность - распределение

Слайд 10 Случайные колебания
Неприятный факт: измеренный показатель отличается от истинного,

Случайные колебанияНеприятный факт: измеренный показатель отличается от истинного, причем будет отличаться

причем будет отличаться всегда
Однако, колебания случайные, т.е. с одинаковой

вероятностью вверх и вниз
Тогда Σεi=0

Слайд 11 Соответственно
Если сложить все значения в популяции
ΣYi=Σ(μ+εi)=Nμ+Σ(εi)=Nμ
Соответственно,
μ=ΣYi/N

Иными словами, в

случае случайной вариабельности популяционное среднее равно истинному значению в

популяции

Слайд 12 На самом деле…
Мы в реальность предположили, что у

На самом деле…Мы в реальность предположили, что у нас есть два

нас есть два фактора
Истинное значение (которое нас интересует) –

μ
Случайная ошибка, варьирующая от наблюдения к наблюдению – ε

Для оценки случайной ошибки надо знать ее распределение.

Слайд 13 Распределение фактора случайной ошибки
По определению, среднее значение равно

Распределение фактора случайной ошибкиПо определению, среднее значение равно 0Соответственно, остается описать

0
Соответственно, остается описать форму распределения (симетричное, несимметричное, колоколообразное, прямоугольное)

и ширину разброса

Слайд 14 Распределение фактора случайной ошибки
Форма распределения определяет тип
Нормальное
Экспоненциальное
Вейбулла
Пуассона и

т.д.
Ширина разброса определяется стандартным отклонением σ.

Слайд 15 Обратите внимание
Истинные параметры (популяционные) обозначаются греческими буквами
Выборочные (позднее)

- латинскими

Слайд 16 Стандартное отклонение

σ=SQRT(Σ(Yi-μ)/(n-1))
Надо помнить, что иногда s определяется другими

Стандартное отклонениеσ=SQRT(Σ(Yi-μ)/(n-1))Надо помнить, что иногда s определяется другими формулами, например в

формулами, например в случае распределения Пуассона σ=μ, в случае

большого числа испытаний биномиального распределения σ=π*(1−π)

Слайд 17 Соответственно, описание данных
Истинный параметр
μ
Стандартное отклонение
σ
Тип распределения
Например, N(120,20). Распределение

ошибки - N(0,σ)

Слайд 18 Что нам это дает?
Распределения и теория диагностики

Слайд 19 Конкурирующие гипотезы
Есть заболевание (1) или нет (2)

Предположим, известно

Конкурирующие гипотезыЕсть заболевание (1) или нет (2)Предположим, известно глазное давление. У

глазное давление. У пациента может быть глаукома (справедлива гипотеза

2). А может быть и нет (справедлива гипотеза 1).

Слайд 20 Конкурирующие гипотезы
Известно распределение
Значение у пациента

Слайд 21 Конкурирующие гипотезы
Известно распределение
Значение у пациента

Слайд 22 2. Подсчитываем вероятности справедливости каждой гипотезы

Слайд 23 Далее
Два варианта
Принимаем решение по каждому случаю индивидуально, на

ДалееДва вариантаПринимаем решение по каждому случаю индивидуально, на основании рассмотрения другой

основании рассмотрения другой информации
Байсовский подход
Заранее устанавливаем границы нормы
Фреквентистский подход

(стандарт в обычной статистике и планировании эксперимента)

Слайд 24 Установление границ нормы
На самом деле устанавливаем произвольную точку

Установление границ нормыНа самом деле устанавливаем произвольную точку разделения, которая может

разделения, которая может быть охарактеризована с точки зрения
Количества ложноположительных

результатов
Количества истинно положительных результатов (чувствительность)
Количества ложноотрицательных результатов
Количества истинно отрицательных результатов (специфичность)

Слайд 25 2. Подсчитываем вероятности справедливости каждой гипотезы
чувствительность
специфичность

Слайд 26 Se и Sp
Чувствительность
Специфичность

Слайд 27 3. Создать характеристическую кривую нанеся на график для

3. Создать характеристическую кривую нанеся на график для каждой диагностической границы

каждой диагностической границы точку, соответствующую соотношеню истинно положительных против

ложно-положительных результатов. Прямая линия - тест аналогичен подбрасыванию монеты. Точность теста определяется как площдь под кривой AOC

Слайд 28
4. Если точность достаточно высока, необходимо выбрать

4. Если точность достаточно высока, необходимо выбрать точку разделения таким

точку разделения таким образом, чтобы было достаточное количество истинно

положительных результатов без чрезвычайно большого количества ложно-положительных.

Слайд 29 Соответственно, выбираем точку разделения, чтобы
Минимизировать количество ложноположительных
Минимизировать количество

ложноотрицательных
Оптимизировать соотношение ложноположительных и ложноотрицательных значений

Слайд 30 Выбор точки разделения
1.
2.
3.
Min FP
Min FN
Opt FP|FN

Слайд 31 Выбранная точка разделения
Используется для диагностики.

Обратите внимание, что тут,

Выбранная точка разделенияИспользуется для диагностики.Обратите внимание, что тут, несмотря на вероятности

несмотря на вероятности не было статистики. Мы предполагали, что

нам известны популяционные значения

Слайд 32 Однако
Мы редко работаем с популяцией (генеральной совокупностью) в

ОднакоМы редко работаем с популяцией (генеральной совокупностью) в целомЭто экономически невыгодноВыводы

целом
Это экономически невыгодно
Выводы нельзя будет распространять на другие популяции
Для

работы из популяции берется выборка (выборочная совокупность)

Слайд 33 Выборка 1

Слайд 34 Выборка 2

Слайд 35 Выборка 3

Слайд 36 Популяция
5 выборок
Выборка 4
Выборка 3
Выборка 2
Выборка 1

Слайд 37 Соответственно
Для каждой выборки тоже можно рассчитать среднее (выборочное)

СоответственноДля каждой выборки тоже можно рассчитать среднее (выборочное) и дисперсию (выборочную)Однако

и дисперсию (выборочную)
Однако в разных выборках они уже совпадать

не будут!

Слайд 38

Слайд 39

Слайд 40 Соответственно,
Средние и дисперсии превращаются в случайные величины
Для того,

Соответственно,Средние и дисперсии превращаются в случайные величиныДля того, чтобы их отличать

чтобы их отличать популяционные показатели обозначают греческими буквами
μ, σ
А

выборочные – латинскими
M, s

Слайд 41
Выборочные показатели меняются от исследования к исследованию
Однако они

Выборочные показатели меняются от исследования к исследованиюОднако они уже результат усредненияm=Σ(μ+εi)/NЭто

уже результат усреднения
m=Σ(μ+εi)/N
Это не равно μ, поскольку Σ(εi) не

равно нулю, но чем больше N тем оно будет ближе
Поэтому суммарные выборочные показатели варьируют меньше, чем исходные данные

Слайд 42 Центральная предельная теорема
Вне зависимости от формы исходного распределения,

Центральная предельная теоремаВне зависимости от формы исходного распределения, если размер выборки

если размер выборки достаточно велик, распределение выборочных средних подчиняется

нормальному закону и дисперсия выборочных средних в n раз меньше, чем дисперсия индивидуальных значений в популяции

Слайд 43 Центральная предельная теорема
В случае большого количества наблюдений распределение

выборочных средних становится нормальным

Слайд 44 Нормальное распределение

Слайд 45 Поскольку распределение нормальное
Можно сделать ряд выводов о возможном

Поскольку распределение нормальноеМожно сделать ряд выводов о возможном распределении выборочных средних.Если

распределении выборочных средних.
Если будет проведено много испытаний, то
68% выборочных

средних будут находиться в пределах 1 σ от популяционного среднего
95% выборочных средних будут находиться в пределах 2 σ от популяционного среднего

Слайд 46 Напомним, для того, чтобы описать распределение необходимо
Истинный параметр
Стандартное

отклонение
Распределение

При достаточном количестве наблюдений распределение известно (по ЦПТ –

нормальное).

Слайд 47 Еще раз вернемся к результатам исследования
Есть выборочное среднее.
Есть

Еще раз вернемся к результатам исследованияЕсть выборочное среднее.Есть конкурирующие гипотезыПрепарат не

конкурирующие гипотезы
Препарат не работает, отклонения связаны только со случайными

факторами (нулевая гипотеза)
Препарат работает (альтернативная гипотеза)
Надо выбрать одну (как в случае с диагностикой)

Слайд 48 Для описания обеих гипотез надо
Знать истинный параметр
Для нулевой

Для описания обеих гипотез надоЗнать истинный параметрДля нулевой гипотезы он прост:μ=0Для

гипотезы он прост:
μ=0
Для альтернативной его надо определить
Стандартное отклонение
Надо определить,

стандартное отклонение для выборочного среднего (m) по ЦПТ в корень квадратный из размера выборки меньше, чем популяционное

Слайд 49 Приемлемое количество FP|FN
Т.е. допустимую ошибку
Ошибка I типа
Вероятность признать

Приемлемое количество FP|FNТ.е. допустимую ошибкуОшибка I типаВероятность признать справедливость альтернативной гипотезы,

справедливость альтернативной гипотезы, когда это не так (обозначается α),

AKA уровень достоверности
Ошибка II типа
Вероятность признать справедливость нулевой гипотезы, когда это не так (обозначается β)
Чаще используют 1-β, называемую мощностью – вероятность найти различия, если они действительно существуют

Слайд 50 Откуда это все брать?
Дисперсия
Пилотное исследование
Литературные данные
Ориентировочные методы (диапазон/4)
Предполагаемый

эффект
Литературные данные
Минимальные клинически значимые различия

Слайд 51 Ошибки
Обычно уровень ошибки I типа фиксируется в данной

отрасли
5%, 1%, 0,1%
Мощность исследования редко допускается ниже 80%

Слайд 52 Итак
Зная
Истинные параметры
Стандартное отклонение (в популяции)
Форму распределения
Приемлемые значения ошибок

Мы

можем оценить принадлежность результата к тому или иному классу…

Но у нас ведь нет варьирующего параметра?

Слайд 53 Нет, есть
Поскольку стандартное отклонение выборочного показателя зависит от

Нет, естьПоскольку стандартное отклонение выборочного показателя зависит от размера выборки, это

размера выборки, это единственный показатель, который может варьировать при

планировании исследования

Слайд 54 Принять Ha
Принять H0
правило

Слайд 55 Квантили распределения
Значения распределения, для которых известны вероятности наличия

Квантили распределенияЗначения распределения, для которых известны вероятности наличия значений больших данного

значений больших данного называются квантилями
Для нормального распределения N(0,1) обозначаются

буквой z
Соответственно z0.975=1.96
Очевидно, что любое нормальное распределение можно привести к виду N(0,1) если рассчитать z=(Yi-μ)/σ

Слайд 56 Соответственно
Ho: N(0,σ/√(n))
zα=(μ0+ граница)/σ/√(n)
Ha: N(X,σ/√(n))
zβ=(ma-граница)/ граница
Отсюда, поскольку граница-то одна

++++0++||+++Х+++++
граница

Слайд 57 Наиболее общая формула

N=(zα+zβ)2*σ2/(μ0-μa)2

Слайд 58 Общая формула, количественный результат
Если σ неизвестна
Если σ известна

Слайд 59 Размер выборки на группу для α = 0.05

Размер выборки на группу для α = 0.05 (двухсторонний тест)Как видно

(двухсторонний тест)

Как видно из данных этой таблицы, различия в

размере выборки, полученные с использованием

Таблица, количественный результат

Слайд 60 Общая формула, качественный результат
Если наблюдений мало:

Слайд 61 Таблица, качественный результат

Слайд 62 Общая формула, время до наступления события
N=D/P
Во многих случаях

Общая формула, время до наступления событияN=D/PВо многих случаях функция выживаемости аппроксимируется

функция выживаемости аппроксимируется экспоненциальным распределением (иными словами S0(t) =

exp (-λ0t) и S1(t) = exp (-λ1t). Параметры λ0 и λ1 - это риски, которые могут быть получены путем указания средней медианной выживаемости.
Медианное время выживаемости для контрольной и тестовой групп составляет два и три года, соответственно. Тогда λ0 = 0,347 λ1 = 0,231 и логарифм отношения риска θ1= log (0,347 / 0,231) = 0,407.
Для исследования с равным разделением на группы требуемое количество событий для того, чтобы достигнуть 90% мощности составляет D= 256.
Если исследование будет рекрутировать пациента в первый год и будет иметь трехлетний период наблюдения после того, как последний человек был введен в исследование, тогда P= 0,628 и требуемый размер выборки может быть оценен как N=256/ 0,628 = 408.

t - это время, которое требуется для рекрутирования пациента и f - это время наблюдения для последнего, введенного в исследование пациента.

– логарифм ОР
π – пропорция в группе лечения

Слайд 63 Упрощенные формулы
Только t-тест (для качественных и количественных) –

Упрощенные формулыТолько t-тест (для качественных и количественных) – достаточно большой размер

достаточно большой размер выборки (более 30 объектов)
Уровень ошибки I

типа фиксирован на 5%
Размер эффекта d
d2=(M1-M2)2/σ2 – количественный показатель
d2=(p1-p2)2/σ2 – качественный показатель,
σ2=р*(1-р)

Слайд 64 Желаемая оценка d
Согласно Cohen (1988) если размер эффекта

Желаемая оценка dСогласно Cohen (1988) если размер эффекта не превышает 0,2,

не превышает 0,2, говорят о слабом эффекте терапии, если

он оказывается равным 0,5 - говорят об эффекте средней силы и если он превышает 0,8 - то говорят о большом эффекте действия препарата.

Слайд 65 Дизайн до-и-после (одна группа)

Слайд 66 Две группы наблюдений

Слайд 67 Пропорции

Слайд 68 Кроме того
Есть программы

Слайд 69 SAS
PROC POWER;
TWOSAMPLEMEANS
ALPHA=0.02
STDDEV=20
GROUPMEANS=(120 130)
POWER=0.8
NPERGROUP=.
;
RUN;

Слайд 70 SAS

Слайд 71 Stata

Слайд 72 R
R использует размер эффекта d = (M1-M2)/σ

Слайд 73 R

Слайд 74 Другой тип задач
Точность выводов (оценка распространенности)

Слайд 75 Оценка параметров
Средние (количественные переменные)

Доли (качественные переменные)

Слайд 76 Оценка параметров
Определяем возможные пределы колебаний интересующего нас параметра
Оценить

распространенность с точностью +/- 5%
Оценить уровень АД с точностью

+/- 5 мм рт. ст.

Слайд 77 Эти колебания
Определяют ширину доверительного интервала.
Соответственно, задача определить нужную

Эти колебанияОпределяют ширину доверительного интервала.Соответственно, задача определить нужную ширину доверительного интервала

ширину доверительного интервала (точнее, полуширину)
Известно, что полуширина интервала равна

Слайд 78 Соответственно

Слайд 79 Пример
Надо определить средний уровень артериального давления в группе

ПримерНадо определить средний уровень артериального давления в группе детей в возрасте

детей в возрасте 5 лет с точностью +/-5 мм

рт. ст.
Известно, что популяционное стандартное отклонение 20 мм рт. ст.
Необходимо обследовать
3,84*202/52=62
ребенка

Слайд 80 Распространенность
Известно, что в этом случае
σ2=p*(1-p)
Поэтому

Учитывая, что дисперсия максимальна

при р=0,5, можно оценить максимальное количество обследованных

Слайд 81 Пример
Оценить распространенность с точностью +/-2%
Необходимо обследовать
n=1/(0,02)2=2500
пациентов

Слайд 82 Пример
Необходимо оценить распространенность хронического гастрита с точностью +/-3%.

Ожидаемая распространенность 12%.
n=3.840.12(1-0.12)/(0,03)2=451
Необходимо обследовать 451 человека

Слайд 83 Можно сделать таблицу

Слайд 84 Таким образом
Для описательных исследований размер выборки определяется исходя

Таким образомДля описательных исследований размер выборки определяется исходя из желаемой точности

из желаемой точности оценки популяционного параметра и вариабельности данных.

Слайд 85 Итак
Для каждой задачи
Указать зависимые переменные, их тип
Оценить разброс

ИтакДля каждой задачиУказать зависимые переменные, их типОценить разброс данныхВыбрать метод статистического

данных
Выбрать метод статистического анализа
Установить вероятность ошибки I типа
Определить желаемый

результат
Установить вероятность ошибки II типа
Рассчитать размер выборки

Слайд 86 Переменные
Соответственно, изучаемые переменные
Переменные исхода – отклика, результата, зависимые
Переменные

воздействия – вмешивающиеся, влияющие, независимые

Слайд 87 Показатели исхода
Те показатели, которые являются индикаторами наступления исхода

Показатели исходаТе показатели, которые являются индикаторами наступления исхода (смерть, развитие ИМ)

(смерть, развитие ИМ) или интересующими нас показателями, влияние на

которые мы изучаем (зависимые переменные)
Обычно для каждой задачи имеется только один основной показатель исхода (зависимая переменная) и может быть несколько вторичных (дополнительных) показателей.

Слайд 88 Показатели исхода
Показатели исхода (зависимые переменные) всегда измеряемые показатели

Показатели исходаПоказатели исхода (зависимые переменные) всегда измеряемые показатели и исследователь должен

и исследователь должен понимать, каким образом он/она будут измерять

эти показатели

Переменные исхода
Первичные
Вторичные

Слайд 89 Переменные исхода
Первичные
Первичная переменная – предоставляет наиболее клинически значимые

Переменные исходаПервичныеПервичная переменная – предоставляет наиболее клинически значимые и прямые доказательства

и прямые доказательства для цели исследования.
В исследовании может

быть только одна первичная переменная
Обычно это переменная эффективности
Другие потенциальные первичные переменные
Безопасность/переносимость
Качество жизни
Экономические показатели
Отбор переменной производится на основании принятых норм и стандартов в данной области.
Необходимо использовать надежные и достоверные переменные, которые использовались в ранних исследованиях или опубликованной литературе

Размер выборки оценивается по первичной переменной

Слайд 90 Переменные исхода
В протоколе должно быть дано точное определение

Переменные исходаВ протоколе должно быть дано точное определение первичной переменной, которое

первичной переменной, которое будет использоваться в статистическом анализе
Смертность –

не первичная переменная
Сравнение
Доли умерших?
Распределения времен дожития?
Эффект терапии тоже не первичная переменная
Сравнение
Возник исход/нет
Время по первого возникновения
Скорость возникновения события (количество на длительность)

Слайд 91 Переменные исхода
Вторичные переменные
Поддерживающие показатели в дополнение к первичной

Переменные исходаВторичные переменныеПоддерживающие показатели в дополнение к первичной переменной или Показатели

переменной или
Показатели эффекта для вторичных задач исследования
Количество

вторичных переменных должно быть ограничено и они должны быть четко описаны в протоколе

Слайд 92 Композитные переменные
Объединение нескольких переменных в одну, с использованием

Композитные переменныеОбъединение нескольких переменных в одну, с использованием четко прописанного алгоритмаПозволяет

четко прописанного алгоритма
Позволяет избавиться от проблемы множественного сравнения не

раздувая ошибку I типа
Метод должен быть описан в протоколе
Надо оценить валидность и надежность переменной

Слайд 93 Переменные глобальной оценки
Переменные для оценки «общей» эффективности или

Переменные глобальной оценкиПеременные для оценки «общей» эффективности или «общей» безопасностиОбычно имеют

«общей» безопасности
Обычно имеют субъективный компонент. Надо представить следующую информацию
Соответствие

основной цели исследования
Основания для оценки надежности и валидности
Как собранные данные используются для оценки по глобальной шкале
Как оцениваются пациенты с пропущенными данными
Если исследователь опирается на объективные показатели, они также должны быть включены в анализ как дополнительные первичные или важные вторичные переменные
Переменные глобальной полезности включают оценку врачом пользы и риска назначения терапии.
Смешивают два разных показателя
Не рекомендуются как первичные переменные

Слайд 94 Множественные первичные переменные
В некоторых случаях необходимо иметь несколько

Множественные первичные переменныеВ некоторых случаях необходимо иметь несколько первичных переменных (диапазон

первичных переменных (диапазон эффектов)
Необходимо спланировать сравнения
Указать, какой минимум или

все должны давать доказательства успеха исследования
Необходимо объяснить эффект на ошибку I типа и описать методы контроля ошибки I типа

Слайд 95 Суррогатные переменные
Непрямые показатели, которые коррелируют с интересующим клиническим

Суррогатные переменныеНепрямые показатели, которые коррелируют с интересующим клиническим исходомПо возможности не

исходом
По возможности не должны использоваться
Нет уверенности в том, что

они являются предиктором клинического исхода
Могут не давать адекватной оценки клинического эффекта, которая может быть сравнена с нежелательными явлениями

Слайд 96 Категоризированные переменные
Дихотомизация интервальных или ординальных переменных, а также

Категоризированные переменныеДихотомизация интервальных или ординальных переменных, а также иное снижение размерности

иное снижение размерности шкалы
Иногда полезно, если есть клиническое обоснование
Должно

быть четкое предварительное описание в протоколе
Надо учитывать потерю мощности

Слайд 97 Переменные
Показатели, которые измеряются в исследовании
Исходя из характеристик измерительного

прибора выделяют переменные, измеряющиеся
Номинальной шкалой
Ординальной шкалой
Интервальной шкалой
Шкалой отношений

Слайд 98 Переменные
Количество информации, которая содержится в переменных зависит от

ПеременныеКоличество информации, которая содержится в переменных зависит от типа шкалы, при

типа шкалы, при помощи которой происходит измерение
Соответственно, надо использовать

наиболее точный, т.е. информативный, из доступных методов

Кроме того, следует помнить, что измеренную с большей точностью переменную можно огрубить, а вот наоборот сделать не получится
Разные методы статобработки предназначены для переменых, измеренных разными шкалами:
Точный тест Фишера: номинальные
Тест Викоксона: ординальные
Т-тест: интервальные

Рост мощности

Слайд 99 Переменные
Поскольку шкала напрямую определяет мощность статистического теста, то

ПеременныеПоскольку шкала напрямую определяет мощность статистического теста, то чем более точный

чем более точный измерительный метод используется, тем меньше надо

единиц наблюдения
Чем более надежен измерительный инструмент, тем выше его точность и тем меньше надо единиц наблюдения

Поэтому с теоретической точки зрения количественные (интервальные) переменные предпочтительнее все других

Слайд 100 Однако…
Целый ряд исходов, интересующих пациента бинарен
Это номинальная переменная
Поскольку

Однако…Целый ряд исходов, интересующих пациента бинаренЭто номинальная переменнаяПоскольку ДМ считает только

ДМ считает только важные для пациента исходы, то заменять

их на количественные показатели только с целью повышения эффективности исследования нельзя
Но можно адекватно операционализировать исследовательский вопрос
«Доктор, умру ли я?»
«Да, абсолютно точно»
«Вопрос только в том, когда»
Замена бинарного показателя (жизнь/смерть) на интервальный (времена дожития)

Слайд 101 Для удобства
Переменные, измеренные при помощи разных шкал, имеют

Для удобстваПеременные, измеренные при помощи разных шкал, имеют дополнительные названияКачественные (номинальные)Полуколичественные

дополнительные названия
Качественные (номинальные)
Полуколичественные (ординальные)
Количественные (интервальные)

Кроме того, для компьютерного ввода

необходимо учесть, как будем кодировать переменные
Число (любые)
Количество разрядов числа, наличие десятичной запятой и число знаков после запятой (для ИРК)
Текст (всегда номинальные)

Лучше всего все кодировать числами

Слайд 102 Показатели исхода
Показатели исхода (зависимые переменные) всегда измеряемые показатели

и исследователь должен понимать, каким образом он/она будут измерять

эти показатели

На что следует обратить внимание
Тип переменной (качественная/количественная)
Пределы колебаний
Точность измерения
Ошибка измерения должна быть значительно меньше диапазона изменений переменной

- Предыдущая Сведения о чрезвычайных ситуациях. Чрезвычайные ситуации военного времени. Ядерное, химическое, бактериологическое оружие

Следующая - Звуковоспроизводящие устройства

Заветы студента 124

Презентация по ПМ Ввод и обработка информации на тему Технология цифрового видео 174

Организация вычислений в электронных таблицах. Обработка числовой информации в электронных таблицах 96

Информационная защита и компьютерные вирусы 114

Введение в язык программирования Паскаль 108

Жертвы ДТП 211

Изкуствен интелект 84

Структурный анализ и проектирование ИСУ 89

Что такое компьютер? 21

Бiоiнформатика 152

Подготовка к ГИА 128

Основы социальной информатики. Информационная деятельность человека в историческом аспекте 129

Команды редактирования 3D чертежей. Алгоритмы визуализации. (Лекция 8) 132

Моноблоки 204

Презентация по информатике на тему Оператор цикла с параметром в Паскале 9 кл 121

Язык программирования Pascal. Массивы 141

Занимательная информатика 158

“Совместная ФЭМП и изодеятельность с одаренными детьми” презентация к уроку по информатике (старшая группа) 116

Учебно-методический комплекс Front Page 2003 129

Презентация Овощи и фрукты презентация урока для интерактивной доски по информатике (младшая группа) 110

Динамические структуры данных. Деревья 116

Презентация по информатике и ИКТ на тему Массивы в Pascal 118

Программное обеспечение ЭВМ 99

Творческо-исследовательский проект Мультфильм своими руками презентация к уроку по информатике (старшая, подготовительная группа) 40

Что такое findslide.org?

Обратная связь

Презентация на тему Планирование исследования. Определение размера выборки

Содержание

Слайд 2 Планирование научных исследованийОпределение целейОпределение задачОпределение переменных и методов

их измеренияВыбор дизайна исследованияВыбор метода статистической обработкиОпределение размера выборкиНаписание

Слайд 3 Напомним Контроль систематической ошибкиДизайнКонтроль случайной ошибкиРазмер выборки

Слайд 4 Задача науки – предсказывать будущееОсновные конкуренты – маги

и чародеи

Слайд 5 Предсказывать легкоРучка всегда падает на полТело впернутое в

воду, выпирает на свободу с силой выпертой воды, телом

Слайд 6 Индивидуум и группа, проблема предсказанийДля каждого конкретного человека

есть только одно значениеОднако у разных людей значения немного

Слайд 7 Проблема предсказанийДетерминизм – маги и чародеиСтохастический подход –

наука

Слайд 8 Случайные колебания - вариабельностьЕсть истинный параметрμИ есть множество

небольших факторов, которые на него влияютСоответственно, наблюдаемое значениеYi=μ+εiЕсли записать

Слайд 9 Случайная вариабельность - распределение

Слайд 10 Случайные колебанияНеприятный факт: измеренный показатель отличается от истинного,

причем будет отличаться всегдаОднако, колебания случайные, т.е. с одинаковой

Слайд 11 СоответственноЕсли сложить все значения в популяцииΣYi=Σ(μ+εi)=N*μ+Σ(εi)=N*μСоответственно,μ=ΣYi/NИными словами, в