какое значение примет параметр r2 если тренд
Самостоятельная работа по информатике «Модели статического прогнозирования»
Описание разработки
Задание #1
Задание #2
Определите какая модель относится к математической
Выберите один из 4 вариантов ответа:
Задание #3
Задание #4
Укажите регрессионную модель
Укажите место на изображении:
Задание #5
Укажите место на изображении:
Задание #6
Укажите табличную модель
Укажите место на изображении:
Задание #7
В чем заключается метод наименьших квадратов?
Выберите один из 3 вариантов ответа:
1) искомая функция должна быть построена так, чтобы сумма квадратов отклонений х-координат всех экспериментальны точек от х-координат графика функции была минимальной
2) искомая функция должна быть построена так, чтобы сумма квадратов отклонений y-координат всех экспериментальны точек от y-координат графика функции была минимальной
3) искомая функция должна быть построена так, чтобы отклонений y-координат всех экспериментальны точек от y-координат графика функции была минимальной
Задание #8
Задание #9
Коэффициент детерминированности показывает.
Выберите один из 2 вариантов ответа:
1) зависимость одной величины от другой
2) насколько удачной является полученная регрессионная модель
Задание #10
Задание #11
Что такое R² в Excel, и зачем нужен тренд на графике?
Когда научный руководитель сказал мне о необходимости указать на графике R² (р квадрат), я растерялся. В тот момент я не знал о трендах в диаграммах и графиках Excel. Этот материал поможет сориентироваться начинающим.
Что такое R² в Экселе
Для примера возьмем данные о продажах умных часов по брендам. Саму таблицу и график можно найти по этой ссылке на сайте CounterPointResearch. Там много подобной информации.
Выделяем диапазон данных и добавляем диаграмму. Теперь наводим мышь на столбцы бренда Others — «остальные», нажимаем правую клавишу мыши. Выбираем пункт Добавить линию тренда.
По умолчанию тренд линейный. Чуть позднее расскажу, как выбрать иную функцию, и стоит ли это делать. Теперь подводим курсор мыши к тренду и снова нажимаем правую кнопку.
Добавляем на график R².
Как видим из названия пункта, это величина достоверности апроксимации. Максимальное значение параметра Р-квадрат единица. Но получить ее можно только на специально подогнанных данных в реальной жизни приемлемое значение 0,8-0,9. В нашем случае — 0,78, что неплохо.
Стоит ли добиваться максимального значения R²
Улучшить достоверность апроксимации можно меняя вид кривой. Это можно сделать в открывающемся справа окошке Формат линии тренда.
Если использовать полиноминальную функцию, то апроксимацию можно улучшить значительно. Но вот смысла это не имеет. Экономические показатели обычно укладываются в линейный (рост/падение) или экспоненциальный тренд. Экспоненциально, например, растет число клиентов быстрорастущей фирмы.
Выбор полиноминальной функции может и улучшит показатель достоверности, а вот прогноз сделает менее точным.
Как использовать тренд для прогноза
Кроме определения общего положения дел (рост/снижение), тренд может предсказать значения показателей в будущем. Это делается в окошке Формата линии тренда.
Попробуем предсказать продажи умных часов в первом квартале 2021 году и сравним их с фактом. Добавим два линейных тренда для Apple и Остальных.
Как видим, по яблочным часа прогноз построен верно, по остальным функция прогнозирует значение около 35%, а в реальности 46%. Возможно, это связано с выходом новых игроков на рынок или снижением доли Huawei. Мы имеем дело с относительными показателями (доля), а не с натуральными. Кстати, полиноминальный прогноз для категории Остальные дал бы еще менее точный прогноз, хотя R² и выше, что подтверждает необходимость осторожно выбирать функцию.
Почитайте и другие статьи про работу с таблицами Excel на нашем сайте. Например, у нас есть полезный материал об условном оформлении ячеек в таблице.
ГДЗ по информатике 11 класс учебник Семакин параграф 18
1. а) Что такое статистика?
б) Являются ли результаты статистических расчетов точными?
Статистические данные всегда являются приближенными, усредненными.
в) Что такое регрессионная модель?
Регрессионный анализ — статистический метод исследования влияния одной или нескольких независимых переменных
2. Какие из следующих величин можно назвать статистическими: температура вашего тела в данный момент; средняя температура в вашем регионе за последний месяц; максимальная скорость, развиваемая данной моделью автомобиля; среднее число осадков, выпадающих в вашем регионе в течение года?
средняя температура в вашем регионе за последний месяц, среднее число осадков, выпадающих в вашем регионе в течение года
3. а) Для чего используется метод наименьших квадратов?
Основная тенденция изменения чего-либо: например, в математике — временного ряда.
в) Как располагается линия тренда, построенная по МНК, относительно экспериментальных точек?
Линия проходит через центр тяжести выборочных данных, то есть выполняется равенство:
г) Может ли тренд, построенный по МНК, пройти выше всех экспериментальных точек?
Нет, не может. Потому что в этом случае параллельно опустив тренд до первой же точки, мы уже добьемся лучшего совпадения с экспериментальными данными. Все расстояния от тренда до экспериментальных точек уменьшатся, а значит, уменьшится и сумма квадратов расстояний.
4. а) В чем смысл параметра R2? Какие значения он принимает?
Коэффициент детерминированности. Именно она определяет, насколько удачной является полученная регрессионная модель. Коэффициент детерминированности всегда заключен в диапазоне от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если 0, то выбранный вид регрессионной модели предельно неудачен. Чем
R2 ближе к 1, тем удачнее регрессионная модель.
б) Какое значение примет параметр R2, если тренд точно проходит через экспериментальные точки?
§ 18. Модели статистического прогнозирования
О статистике и статистических данных
Рассмотрим способ нахождения зависимости частоты заболеваемости жителей города бронхиальной астмой от качества воздуха (третий пример из сформулированных в начале предыдущего параграфа). Любому человеку понятно, что такая зависимость существует. Очевидно, что чем хуже воздух, тем больше больных астмой. Но это качественное заключение. Его недостаточно для того, чтобы управлять уровнем загрязненности воздуха. Для управления требуются более конкретные знания. Нужно установить, какие именно примеси сильнее всего влияют на здоровье людей, как связана концентрация этих примесей в воздухе с числом заболеваний. Такую зависимость можно установить только экспериментальным путем: посредством сбора многочисленных данных, их анализа и обобщения.
При решении таких проблем на помощь приходит статистика.
Статистика — наука о сборе, измерении и анализе массовых количественных данных.
Существуют медицинская статистика, экономическая статистика, социальная статистика и другие. Математический аппарат статистики разрабатывает наука под названием математическая статистика.
Рассмотрим пример из области медицинской статистики.
Известно, что наиболее сильное влияние на бронхиально-легочные заболевания оказывает угарный газ — монооксид углерода. Поставив цель определить эту зависимость, специалисты по медицинской статистике проводят сбор данных. Они собирают сведения из разных городов о средней концентрации угарного газа в атмосфере и о заболеваемости астмой (число хронических больных на 1000 жителей). Полученные данные можно свести в таблицу, а также представить в виде точечной диаграммы (рис. 3.3).*
Рис. 3.3. Табличное и графическое представление статистических данных
Статистические данные всегда являются приближенными, усредненными. Поэтому они носят оценочный характер, но верно отражают характер зависимости величин. И еще одно важное замечание: для достоверности результатов, полученных путем анализа статистических данных, этих данных должно быть много.
Из полученных данных можно сделать вывод, что при концентрации угарного газа до 3 мг/м 3 его влияние на заболеваемость астмой несильное. С дальнейшим ростом концентрации наступает резкий рост заболеваемости.
А как построить математическую модель данного явления? Очевидно, нужно получить формулу, отражающую зависимость количества хронических больных Р от концентрации угарного газа С. На языке математики это называется функцией зависимости Р от С: Р(С). Вид такой функции неизвестен, ее следует искать методом подбора по экспериментальным данным.
Понятно, что график искомой функции должен проходить близко к точкам диаграммы экспериментальных данных. Строить функцию так, чтобы ее график точно проходил через все данные точки (рис. 3.4, а), не имеет смысла. Во-первых, математический вид такой функции может оказаться слишком сложным. Во-вторых, уже говорилось о том, что экспериментальные значения являются приближенными.
Рис. 3.4. Два варианта построения графической зависимости по экспериментальным данным
Полученную функцию, график которой приведен на рис. 3.4, б, в статистике принято называть регрессионной моделью.
Метод наименьших квадратов
Первая задача не имеет строгого решения. Здесь может помочь опыт и интуиция исследователя, а возможен и «слепой» перебор из конечного числа функций и выбор лучшей из них.
Чаще всего выбор производится среди следующих функций:
у = ах + b — линейная функция;
у = ах 2 + bх + с — квадратичная функция;
у — а ln(х) + b — логарифмическая функция;
у = ае bх — экспоненциальная функция;
у — ах b — степенная функция.
Квадратичная функция называется в математике полиномом второй степени. Иногда используются полиномы и более высоких степеней, например полином третьей степени имеет вид: у = ах 3 + Ьх 2 + сх + d.
Во всех этих формулах х — аргумент, у — значение функции, а, Ь, с, d — параметры функции, ln(х) — натуральный логарифм, е — константа, основание натурального логарифма.
Если вы выбрали (сознательно или наугад) одну из предлагаемых функций, то далее нужно подобрать параметры (а, b, с и пр.) так, чтобы функция располагалась как можно ближе к экспериментальным точкам. Что значит «располагалась как можно ближе»? Ответить на этот вопрос значит предложить метод вычисления параметров. Такой метод был предложен в XVIII веке немецким математиком К. Гауссом и называется методом наименьших квадратов (МНК). Суть его заключается в следующем: искомая функция должна быть построена так, чтобы сумма квадратов отклонений у-координат всех экспериментальных точек от у-координат графика функции была минимальной.
Мы не будем здесь производить подробное математическое описание метода наименьших квадратов. Достаточно того, что вы теперь знаете о существовании такого метода. Он очень широко используется в статистической обработке данных и встроен во многие математические пакеты программ. Важно понимать следующее: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую (в том числе и из рассмотренных выше) функцию. А вот будет ли она нас удовлетворять, это уже другой вопрос — вопрос критерия соответствия. На рис. 3.5 изображены три функции, построенные методом наименьших квадратов по приведенным экспериментальным данным.
Рис. 3.5. Три функции, построенные по МНК
Уже с первого взгляда хочется отбраковать вариант линейного тренда. График линейной функции — это прямая. Полученная по МНК прямая отражает факт роста заболеваемости от концентрации угарного газа, но по этому графику трудно что-либо сказать о характере этого роста. А вот квадратичный и экспоненциальный тренды правдоподобны. Теперь пора обратить внимание на надписи, присутствующие на графиках. Во-первых, это записанные в явном виде искомые функции — регрессионные модели:
Из трех выбранных моделей значение R 2 наименьшее у линейной. Значит, она самая неудачная (нам и так это было понятно). Значения же R 2 у двух других моделей достаточно близки (разница меньше 0,01). Если определить погрешность решения данной задачи как 0,01, по критерию R2 эти модели нельзя разделить. Они одинаково удачны. Здесь могут вступить в силу качественные соображения. Например, если считать, что наиболее существенно влияние концентрации угарного газа проявляется при больших величинах, то, глядя на графики, предпочтение следует отдать квадратичной модели. Она лучше отражает резкий рост заболеваемости при больших концентрациях примеси.
Интересный факт: опыт показывает, что если человеку предложить на данной точечной диаграмме провести «на глаз» прямую так, чтобы точки были равномерно разбросаны вокруг нее, то он проведет линию, достаточно близкую к той, что дает МНК.
Прогнозирование по регрессионной модели
Мы получили регрессионную математическую модель и можем прогнозировать процесс путем вычислений. Теперь можно оценить уровень заболеваемости астмой не только для тех значений концентрации угарного газа, которые были получены путем измерений, но и для других значений. Это очень важно с практической точки зрения. Например, если в городе планируется построить завод, который будет выбрасывать в атмосферу угарный газ, то, рассчитав его возможную концентрацию, можно предсказать, как это отразится на заболеваемости астмой жителей города.
Существует два способа прогнозирования по регрессионной модели. Если прогноз производится в пределах экспериментальных значений независимой переменной (в нашем случае это концентрация угарного газа С), то это называется восстановлением значения.
Прогнозирование за пределами экспериментальных данных называется экстраполяцией.
Имея регрессионную модель, легко прогнозировать, производя расчеты с помощью электронных таблиц. Выберем для нашего примера в качестве наиболее подходящей квадратичную зависимость. Построим следующую электронную таблицу:
Подставляя в ячейку А2 значение концентрации угарного газа, в ячейке В2 будем получать прогноз заболеваемости. Вот пример восстановления значения:
Заметим, что число, получаемое по формуле в ячейке В2, на самом деле является дробным. Однако не имеет смысла считать число людей, даже среднее, в дробных величинах. Дробная часть удалена — в формате вывода числа указано 0 цифр после запятой.
Экстраполяционный прогноз выполняется аналогично.
Табличный процессор дает возможность производить экстраполяцию графическим способом, продолжая тренд за пределы экспериментальных данных. Как это выглядит при использовании квадратичного тренда для С = 7, показано на рис. 3.6.
Рис. 3.6. Квадратичный тренд с экстраполяцией
Система основных понятий
Вопросы и задания
б) Являются ли результаты статистических расчетов точными?
в) Как располагается линия тренда, построенная по МНК, относительно экспериментальных точек?
* Приведенные в примере данные не являются официальной статистикой, однако правдоподобны.
Практическая работа по информатике по теме: «Прогнозирование по регрессионным моделям»
Ищем педагогов в команду «Инфоурок»
Тема урока : Прогнозирование по регрессионной модели
Задача урока: научиться по экспериментальным данным находить математическую формулу их связи и прогнозировать количественные характеристики системы путем восстановления значений и экстраполяции.
Прогнозирование по регрессионным моделям
— Какие Вам известны формы представления зависимостей между величинами?
— Что такое математическая модель?
— Что такое статистика?
— Что такое регрессионная модель?
— Для чего используется метод наименьших квадратов?
Задание на лабораторную работу:
— задание на лабораторную работу дано на Рабочем листе;
— 1-е задание на тему «Заболеваемость астмой» выполняется по пунктам 1-7 Рабочего листа;
— заполняется Отчет по лабораторной работе;
— 2-е задание по данной таблице также выполняется по пунктам 1-7 Рабочего листа;
— заполняется Отчет по лабораторной работе.
Рабочий лист к лабораторной работе на тему:
«Построение регрессионных моделей с помощью табличного процессора».
Алгоритм получения регрессионной модели по МНК с построением тренда с помощью Ms Excel :
Ввести табличные данные:
Концентрация примесей в воздухе
Построить точечную диаграмму (график) по столбцу 2;
Выделить диаграмму (щелкнуть мышью по полю диаграммы);
Выполнить команду: Диаграмма – Добавить линию тренда ;
В открывшемся окне на закладке « Тип » выбрать « Линейный тренд »;
Аналогично построить графики и другие типы трендов, не удаляя предыдущие результаты. Квадратичный тренд получается путем выбора полиномиального типа функции с указанием степени 2. На рабочем листе должно получиться 6 графиков. Выберите тот график с трендом, который (на Ваш взгляд) наиболее приближается к экспериментальным данным и выполните для этого графика следующие действия.
Получение экстраполяции. Выполнить команды: Диаграмма – Добавить линию тренда – выбрать закладку Параметры – область Прогноз – строка Вперед на – установить 2 единицы.
Заполните Отчет по лабораторной работе.
По данным из следующей таблицы постройте с помощью Ms Excel линейную, экспоненциальную и т.д. регрессионные модели. Выберите лучшую модель.
по лабораторной работе
«Построение регрессионных моделей с помощью табличного процессора»
Лабораторную работу выполняли:____________________________________
Дата выполнения «___»____________20__г.
1 задание «Заболеваемость астмой».
Вывод : для графика, полученного по экспериментальным точкам больше всего подходит регрессионная модель, построенная с помощью ___________________________________________
_________________________________________________________ ___________________ ________
2 задание – по данной таблице
Вывод : для графика, полученного по экспериментальным точкам больше всего подходит регрессионная модель, построенная с помощью ___________________________________________
Зависимости между величинами могут быть представлены__________________________________
________________________________________ ______________________________________ ______
Регрессионная модель – это _________________________________________ ___________________
Параметр R 2 –это … _________________________________________________________ _________
Экстраполяция – это … _______________________________________________________ ________
Что называется восстановлением значения? ______________________________________ ________
Почему при экстраполяции нельзя далеко уходить от экспериментальной области? _______ _________________________________________________________________ __________ __
Курс повышения квалификации
Дистанционное обучение как современный формат преподавания
Курс повышения квалификации
Современные педтехнологии в деятельности учителя
Курс профессиональной переподготовки
Математика и информатика: теория и методика преподавания в образовательной организации
Номер материала: ДБ-1138442
Международная дистанционная олимпиада Осень 2021
Не нашли то что искали?
Вам будут интересны эти курсы:
Оставьте свой комментарий
Авторизуйтесь, чтобы задавать вопросы.
Рособрнадзор оставил за регионами решение о дополнительных школьных каникулах
Время чтения: 1 минута
В школе в Пермском крае произошла стрельба
Время чтения: 1 минута
Минпросвещения объявило конкурс «Учитель-международник»
Время чтения: 1 минута
Школьников не планируют переводить на удаленку после каникул
Время чтения: 1 минута
Минобрнауки утвердило перечень олимпиад для школьников на 2021-2022 учебный год
Время чтения: 1 минута
В Хабаровске утвердили дополнительные школьные каникулы
Время чтения: 1 минута
Подарочные сертификаты
Ответственность за разрешение любых спорных моментов, касающихся самих материалов и их содержания, берут на себя пользователи, разместившие материал на сайте. Однако администрация сайта готова оказать всяческую поддержку в решении любых вопросов, связанных с работой и содержанием сайта. Если Вы заметили, что на данном сайте незаконно используются материалы, сообщите об этом администрации сайта через форму обратной связи.
Все материалы, размещенные на сайте, созданы авторами сайта либо размещены пользователями сайта и представлены на сайте исключительно для ознакомления. Авторские права на материалы принадлежат их законным авторам. Частичное или полное копирование материалов сайта без письменного разрешения администрации сайта запрещено! Мнение администрации может не совпадать с точкой зрения авторов.