Скачать 2.16 Mb.
|
18.2. Корреляционно-регрессионный анализВоспроизведем схемы одномерно-одномерного (рис. 12, а), одномерно$многомерного (рис. 12, б) и многомерно$одномерного (рис. 12, в) объектов исследований. Рис. 12. Схемы объектов исследований В случае одномерно-одномерного объекта исследований (рис. 12, а) при наличии статистически достоверной связи между x и y может быть получено уравнение y = f(x), описывающее эту связь. Такое уравнение, называемое уравнением однофакторной регрессии или просто регрессии, дает возможность рассчитывать (прогнозировать) значения выходного параметра y по известным значениям входного фактора x, не прибегая к помощи каких$либо расчетных графиков. В случае одномерно-многомерного объекта исследований (рис. 12, б) статистически достоверная связь между какими$либо выходными параметрами yi позволяет сократить их число, и тем самым, сократить затраты времени и средств на исследовательский процесс. Так, например, при наличии статистически достоверной связи между y1 и y2, можно определять (измерять) только один из этих параметров. Как правило, оставляют тот из параметров, который проще и точнее измеряется. В случае многомерно-одномерного объекта исследований (рис. 12, в), являющегося частным случаем многомерно$многомерного объекта, при наличии связи между входными факторами, например между x1 и x2, возникают некоторые закономерности:
Наличие, форма и сила (степень тесноты) связи между СВ, имеющими нормальное распределение, устанавливаются с помощью корреляционного анализа. Различают:
18.2.1. Парная корреляцияПредварительную характеристику корреляционной связи между случайными величинами x и y можно найти путем построения так называемого корреляционного поля, т. е. графика зависимости y = f(x) с нанесением на него всех экспериментальных точек. В качестве примера приведем ряд корреляционных полей различной формы. О наличии связи между двумя случайными величинами можно судить по тесноте группирования точек на корреляционном поле вокруг условной прямой или кривой линии. Так, из рис. 13, а, в, г видно, что между х и у определенная связь существует, а вот по данным, приведенным на рис. 13, б, связь между х и у отсутствует. По форме корреляционного поля можно судить и о предполагаемой форме связи между двумя случайными величинами, которая может быть:
Рис.13. Корреляционные поля различной конфигурации Кроме этого степень разбросанности точек на корреляционном поле в определенной мере свидетельствует и о силе связи между х и у. Так, очевидно, что для данных, приведенных на рис. 13, а, связь между х и у слабая, тогда как для данных, показанных на рис. 13, в и г, связь между х и у достаточно сильная. Но такая визуальная и качественная оценка, хотя и дает определенную информацию, не может заменить количественной оценки существования связи между х и у, а также оценки формы и силы этой связи. Сила связи между двумя случайными величинами оценивается величиной коэффициента парной корреляции или просто коэффициента корреляции, определяемого по следующей формуле: где n – число пар наблюдений (измерений); ͞x, ͞y – средние арифметические значения х и у; х, у – среднеквадратические отклонения х и у, рассчитываемые по формулам (25) и (11). Значения коэффициента корреляции ryx изменяются в пределах от –1 до +1, т. е. –1 ryx +1. (38) Если с ростом значения х значение у растёт, то rух будет иметь знак плюс (положительная или прямая связь), а если уменьшается, то – знак минус (отрицательная или обратная связь). Чем ближе абсолютное значение rух к 1, тем сильнее значения одной случайной величины зависят от того, какие значения принимает другая случайная величина, т. е. тем сильнее связь между ними. Тесноту связи между х и у обычно считают:
Следует помнить о том, что rух является случайной величиной, т. е. может принимать различные значения при повторных измерениях. Кроме этого, величина rух зависит от числа пар наблюдений. С их уменьшением и достоверность выводов, формулируемых после определения rух, снижается. При rух = ±1 – две случайных величины связаны линейной, функциональной связью, т. е. каждому конкретному значению х соответствует только одно, строго определенное, значение у. При rух = 0 случайные величины называют некоррелированными (независимыми). Однако обратное утверждение, что случайные величины независимы, если rух = 0, несправедливо, так как rух как мера тесноты связи имеет четкий математический смысл только при линейной зависимости между случайными величинами и при нормальном их распределении. Поэтому значение rух может быть равным нулю, когда случайные величины связаны нелинейной связью, а следовательно, зависимы друг от друга. Достоверность коэффициента корреляции оценивают критерием надежности: Где При Qr > 2,6 с доверительной вероятностью равной 0,95 можно утверждать о значимости найденного коэффициента корреляции rух, т.е. о существовании между х и у линейной связи. По известным значениям величин rух, х и у несложно определить линейное уравнение регрессии, описывающее связь между х и у, т. е. После нахождения линейной математической модели, следует оценить возможность улучшения описания связи между х и у, путём перехода к нелинейной модели. Вначале эту нелинейную модель изучают. После этого необходимо вычислить корреляционное отношение по следующей формуле: i где y~ – значение выходного параметра в i-м опыте, рассчитанное по найденной нелинейной модели, yi – фактическое значение параметра в i-м опыте. Корреляционное отношение у характеризует силу (степень тесноты) связи между двумя случайными величинами при отсутствии между ними линейной зависимости, т. е. связанными не линейно. Значения у могут находиться в пределах от 0 до 1. Для некоррелированных (независимых) случайных величин у = 0, а в случае функциональной зависимости между ними у = 1. Если связь между двумя случайными величинами линейна, то корреляционное отношение равно абсолютному значению коэффициента корреляции, т.е. y | ryx | . Следует отметить, что значимое различие значений у и rух проявляется только при достаточно большом числе пар измерений. Достоверность корреляционного отношения оценивается по критерию его надежности. При r > 2,6 с доверительной вероятностью равной 0,95 можно утверждать, что найденное корреляционное отношение значимо. По известным значениям у и rух оценивают степень нелинейности: 2 Если n0 < (12/n), то переход к нелинейной модели не улучшит связи между х и у, а в противном случае – может привести к лучшим результатам. 18.2.1.1. Применение корреляционного анализа для уменьшения числа параметров (факторов) Очевидно, что если две случайные величины являются коррелированными, т. е. зависимыми друг от друга, о чем свидетельствует значимость коэффициента корреляции rух, то любая из них (х или у) может быть исключена из рассмотрения. Для сокращения числа параметров, в случае одномерно-многомерного объекта исследований, или числа факторов, в случае многомерно-одномерного объекта исследований, рассчитывают значения коэффициента корреляции между всеми возможными парами параметров (факторов), а также, в зависимости от схемы объекта исследований, между выходными параметрами и входным фактором, или входными факторами и выходным параметром. На основе расчетов составляют так называемую нормированную корреляционную матрицу. Таблица 3 Корреляционная матрица
В матрице значимые значения коэффициента корреляции принято обозначать звездочками (обозначено для примера). Из приведенной корреляционной матрицы следует, что незначимым является лишь коэффициент корреляции между у2 и у4. Отсюда следует, что при исследовании влияния фактора х на параметры у1, у2, у3, у4, вместо четырех параметров можно ограничиться двумя – у2 и у4. 18.3. Однофакторная регрессияРанее нами была рассмотрена процедура определения значений коэффициентов а и b линейного уравнения регрессии y = ax + b по данным корреляционного анализа. Между тем существуют и другие приёмы и методы нахождения значений этих коэффициентов, причем не только для линейной зависимости, но и для различного вида нелинейных зависимостей. Эмпирическая связь между двумя случайными величинами может быть описана одной из наиболее распространённых зависимостей:
18.3.1. Метод наименьших квадратовСуть метода заключается в том, что вид зависимости и значения ее коэффициентов должны обеспечивать минимальную сумму квадратов отклонений (S) ординат экспериментальных точек от ординат этой зависимости: (47) Для линейного уравнения y = ax + b требование (47) запишется следующим образом: Для того чтобы найти минимальную сумму квадратов отклонений S, необходимо приравнять к нулю частные производные этой суммы по коэффициентам b и а: Для определения коэффициентов а и b линейного уравнения будем иметь систему линейных уравнений: Решение системы уравнений относительно а и b дает следующие формулы для их расчета: Рассмотренный нами на примере линейной зависимости метод нахождения коэффициентов а и b называется методом наименьших квадратов (МНК), который был предложен К. Гауссом. Аналогичным образом, с помощью этого метода были получены формулы для расчета коэффициентов и нелинейных зависимостей 2–8 (см. выше). Источник: Квеско Н.Г. Методы и средства исследований: учебное пособие / Н.Г. Квеско, П.С. Чубик; Национальный исследовательский Томский политехнический университет. – Томск: Изд-во Томского политехнического университета, 2010. – 112 с. |
Учебно-методический комплекс дисциплины «Компьютерные технологии в науке и образовании» |
Учебно-методический комплекс по дисциплине компьютерные технологии в образовании и науке |
||
Курс лекций Ставрополь, 2015 содержание стр. Введение лекция Введение... Лекция 5: Приборы и приспособления для обнаружения и регистрации ионизирующих излучений |
Конспект лекций по дисциплине «Информационные системы и технологии в науке и образовании» Введение. Содержание дисциплины и порядок ее изучения. Фактографический поиск. Математические модели фактографического поиска. Информационная... |
||
Отчет по лабораторной работе №1 по дисциплине: «Компьютерные технологии в науке и производстве» Целью лабораторной работы является изучение основ языка гипертекстовой разметки html |
Секция: «Информационные системы и технологии в науке, технике и образовании» проектно Для любого человека актуально обеспечение безопасности помещения, являющегося его собственностью |
||
Учебно-методический комплекс дисциплины «компьютерные технологии в науке и технике» Учебно-методический комплекс составлен на основании требований федерального государственного образовательного стандарта высшего профессионального... |
Российской Федерации Тольяттинский государственный университет Кафедра... Курс лекций дисциплины «Компьютерные технологии и сапр» для студентов специальностей 120500, 120507, 120700 очной |
||
Компьютерные информационные технологии курс лекций Именно этим определяется актуальность и необходимость освоения основ компьютерных информационных технологий. Знание компьютерных... |
Компьютерные информационные технологии курс лекций Именно этим определяется актуальность и необходимость освоения основ компьютерных информационных технологий. Знание компьютерных... |
||
Отчет по практике «Информационные компьютерные системы и технологии... «Информационные компьютерные системы и технологии в ресторанно-гостиничном бизнесе» |
Лекция I и проблема языка и сознания лекция II 31 слово и его семантическое... Монография представляет собой изложение курса лекций, про* читанных автором на факультете психологии Московского государственного... |
||
Лекция I и проблема языка и сознания лекция II 31 слово и его семантическое... Монография представляет собой изложение курса лекций, про* читанных автором на факультете психологии Московского государственного... |
Содержание Введение Лекция Базы данных и файловые системы Файловые системы 1 Структуры файлов Лекция Ранние подходы к организации бд. Системы, основанные на инвертированных списках, иерархические и сетевые субд. Примеры. Сильные... |
||
Лекция 1 Введение в cals-технологии Концепция cals сначала Computer... Целью cals-технологий является повышение эффективности производства посредством применения компьютерных информационных технологий... |
Лекция 1 Введение в cals-технологии Концепция cals сначала Computer... Целью cals-технологий является повышение эффективности производства посредством применения компьютерных информационных технологий... |
Поиск |