График овуляции пример и расшифровка результатов


График базальной температуры - примеры и расшифровки

Один из самых распространенных методов отслеживания овуляции или зачатия – построение графика базальной температуры за полный период менструального цикла. Такой способ популярен тем, что не занимает много времени, не требует материальных затрат и простой в применении. Все, что необходимо, – градусник, ручка и бумага. Но следует знать, как правильно записать и расшифровать график. Тогда этот метод поможет выявить заболевания, препятствующие беременности.

 

Что такое базальная температура

Температура, измеряемая в утреннее время, и имеющая наиболее низкое значение, называется базальной. На нее никакие внешние раздражители в этот период не влияют, поэтому она наиболее эффективно показывает состояние здоровья.

Базальная температура (БТ) измеряется тремя способами: ректально, во рту либо во влагалище. Начинают измерение в самый первый день цикла. В течение цикла показатели ежедневно заносятся в график, где потом можно оценить изменения базальной температуры, и на основе показателей сделать определенные выводы. Пользоваться при этом следует весь период только одним градусником, а измерять лишь в одном выбранном месте, тогда показатели будут точными.

Изменение базальной температуры происходит из-за влияния прогестерона на процессы терморегуляции женского тела, что, естественно, приводит к постоянным перепадам показателей в течение цикла. У женщин с хорошим здоровьем график будет выглядеть практически идентично, а при каких-либо отклонениях в здоровье (воспалительные процессы, недостаточность гормонов) или с наступлением беременности показатели меняются. Поэтому такой метод – один из основных и наиболее точных тестов, показывающий правильность функционирования яичников.

Чтобы более точно узнать базальную температуру и правильно внести данные в график, необходимо придерживаться некоторых правил, указанных в видео:

 

График базальной температуры с примерами и расшифровкой

При построении графика следует учитывать следующую информацию:

  • число месяца;
  • текущий день цикла;
  • время на момент измерения;
  • температурное значение;
  • факторы, способствующие изменению БТ.

Дополнительными сведениями могут быть текстура выделений, цвет цервикальной слизи, наличие полового акта и прочее.

Стандартный график БТ делится на две четко разграниченные фазы – до и после овуляции. Поэтому на графике обозначают линию овуляции (пересекает вертикально) и перекрывающую (горизонтальную) линию. Ниже приведен пример того, как строиться график.

Перекрывающая (второе ее название – средняя) линия определяется в первые 11–12 дней цикла, и берет свое начало с 6-го дня. Следующие 6 дней ежедневно измеряется базальная температура, и по максимальному значению проводится горизонтальная линия через весь график. Но дни, когда на нее воздействовали внешние негативные факторы, не учитываются. Такие значения, как правило, могут отличаться аномально высокими цифрами – на 0,3 градуса и больше относительно рядом стоящих чисел.

Линия овуляции наносится после нахождения перекрывающей линии. Вычисляются первые три цифры превышающие значение средней линии на 0,1– 0,2 градуса. Линия овуляции проходит горизонтально по самому последнему низкому значению перед этими тремя превышающими числами. Все значения после этой линии обозначают вторую фазу.

Исходя из этих данных, можно оценить продолжительность фаз и разницу базальной температуры. Нормой считается график, где 2 фаза не больше и не меньше 12–16 дней. А температурная разница имеет отличие во 2 фазе на 0,4 градуса и больше.

Внимание! Линию овуляции невозможно предугадать, поэтому желающие забеременеть должны исследовать базальную температуру несколько месяцев подряд, а затем, изучив общую тенденцию, можно примерно узнать об изменениях, сопутствующих скорой овуляции.

 

Какие показатели считаются нормой

При отсутствии отклонений менструальный цикл состоит из 2 четко разграниченных фаз: фолликулярной (время формирования фолликула) и лютеиновой. В первой половине БТ имеет тенденцию к снижению, а во второй она резко повышается и находится в таком состоянии несколько дней.

Также на графике, приведенном ниже, заметно, что базальная температура перед самыми месячными уменьшается. Так и должно происходить, если не было зачатия, и нет никаких заболеваний.

На графике выделяется три особенности нормального течения цикла:

  1. Снижение кривой перед овуляцией.
  2. Повышение ее после овуляции.
  3. Предменструальное понижение кривой.

Базальная температура при овуляции, зачатии и беременности – с объяснением

Изучая график при зачатии, можно заметить, что базальная температура начала цикла и при овуляции сходна с кривой предыдущих месяцев. А после овуляторного периода на графике уже отсутствует понижение значений перед менструальными днями. Даже можно заметить постепенное нарастание показателей.

Еще одной особенностью наступления беременности считается имплантационное западание – резкое понижение показателя на 0,2–0,3 градуса на седьмой день после овуляции. Затем через 1–2 дня базальная температура выравнивается. В течение всей беременности средний температурный показатель держится на уровне 37,1–37,5 градусов.

На видео показано, как выглядит график БТ при наступлении зачатия.

 

Что ждать при поздней овуляции

Если цикл составляет в среднем больше 28 дней, то и овуляция наступает позже. Но 2 фаза не должна превышать 16 дней. Поэтому происходит увеличение именно фолликулярной фазы, что отражается удлинением ее на графике.

То есть первая половина графика показывает те же значения, что и при нормальном течении цикла, за исключением увеличения периода до овуляции. Затем так же заметно снижение базальной температуры в конце 1 фазы и ее повышение в овуляторный период.

Но такие показатели будут только тогда, если нет никаких проблем со здоровьем. При других обстоятельствах значения могут меняться в зависимости от сопутствующих факторов.

 

Значения при стимуляции овуляции

Если стимуляция происходит при помощи Клостилбегита (Кломифена) в начале цикла и применения Дюфастона в постовуляторный период, график БТ будет «нормальным», то есть состоять из двух фаз, переход между которыми будет явно выражен. Во 2 фазе температурный показатель будет значительно выше первого. А так же будет заметно ступенчатое повышение значений как минимум 2 раза, и произойдет небольшое западение.

Если график будет выглядеть по-другому, это явный признак неправильного выбора препарата либо его дозировки. Если заметно повышение показателя в первой половине, это может говорить об индивидуальной непереносимости кломифена.

 

Какие показатели могут быть при ановуляторном менструальном цикле

Об отсутствии овуляции в данном периоде свидетельствует график, на котором нет видимого деления на фазы. То есть весь период держаться примерно одни и те же показатели, нет падения и последующего повышения кривой в середине цикла. Такой график, при отсутствии беременности, показывает, что в этом периоде зачатие будет невозможно, поскольку овуляция не произошла.

Ановуляторный период является нормой, если он происходит не более 1–2 раза в год. Однако, если такой симптом наблюдается несколько циклов подряд, пора обратиться к врачу, поскольку это является признаком патологических процессов.

 

Недостаточность второй фазы

Из-за гормональной недостаточности наблюдается повышение температурных показателей перед месячными. Притом отсутствует предовуляторное западание, а 2 фаза не больше 10 дней.

Зачатие при таком графике возможно, однако, часто бывают выкидыши. Это связано с недостатком прогестерона, действие которого заключается в поддержании беременности. А если БТ на графике имеет тенденцию к повышению, следует после овуляции сдать анализ на уровень этого гормона.

При выявлении недостаточного количества прогестерона назначают гестагенные препараты, прием которых обязателен в течение первых 3 месяцев вынашивания плода.

 

Как выглядит график при ЭКО

Базальная температура и ее изменение после переноса эмбрионов будет такой же, как при обычном зачатии. Если нет никаких нарушений, то нормой будет температурный показатель 37,1–37,5 градусов. Это значение должно держаться весь период беременности.

Резкое однодневное снижение происходит только в момент имплантации эмбриона. Затем показатель увеличивается до того же уровня.

Однако, если после ЭКО наблюдается резкое снижение БТ, и это значение держится 3 дня и дольше, следует обратиться к ведущему беременность специалисту.

 

Что показывает график при недостаточности желтого тела

После того как яйцеклетка покинула фолликул, он преобразовывается в желтое тело – временную железу, продуцирующую прогестерон. Если эта железа недостаточно развита, то и выработка гормона происходит в недостающем количестве. А выявить это можно по нескольким признакам:

  1. Температурный показатель после выхода яйцеклетки растет медленно.
  2. Предменструальное снижение кривой отсутствует.
  3. Продолжительность 2 фазы не превышает 10 дней.

Такой цикл при успешном зачатии грозит выкидышем, поэтому важно провести тщательную диагностику и определить причину гормонального нарушения.

 

Значения при эстрогенной недостаточности

Нормой считается, если эстроген в первой половине цикла имеет высокий уровень. Это влечет понижение базальной температуры. Однако при недостаточности этого гормона происходит повышение значений, из-за чего невозможно определить разделение фаз. Температурная кривая слишком беспорядочная, трудно вычислить день овуляции.

Маловероятно, что при недостатке в организме эстрогена наступит беременность. Однако остаточное заключение по графику не ставят, нужно пройти полный осмотр.

 

График при эстроген-прогестероновой недостаточности

Диагностировать недостаток обоих гормонов можно по низким температурным показателям во 2 фазе, а в момент овуляции увеличение значений происходит не больше, чем на 0,2–0,3 градуса.

В таком случае врач назначает стимулирующие препараты на весь цикл. Если график не приходит в норму, меняют курс лечения и дозу препаратов.

 

Воспаление придатков – примеры графика

Воспаление в придатках приводит к резкому повышению базальной температуры до 37 градусов вначале цикла. Повышение может держаться несколько дней, а потом наблюдается резкое падение до нормальных значений.

Нередко такой скачок принимают за овуляторный период. Поэтому бывает сложно определить точную дату выхода яйцеклетки. В случае наблюдения такой кривой на графике следует немедленно обратиться к гинекологу, поскольку воспаление лучше лечить на ранних стадиях, чем в запущенном состоянии. К тому же такая патология негативно сказывается на протекании беременности.

 

Примеры графика при гиперпролактинемии

При росте уровня пролактина в крови также наблюдается нетипичный график. Его можно сравнить с показателями, характерными для кормящих либо беременных женщин. На графике ниже можно увидеть кривую, значения которой высокие на протяжении всего периода. А месячные при таком диагнозе могут вообще отсутствовать.

Для беременных высокий уровень пролактина – норма. В определенный момент он снизится самостоятельно. Но если такой показатель присутствует на графике небеременной женщины, следует показаться врачу.

 

Заключение

График базальной температуры помогает вовремя выявить любые отклонения, связанные с женским здоровьем. Особенно его следует вести тем, кто длительное время безуспешно пытается забеременеть, поскольку температурные показатели помогут определить, в какой фазе цикла происходит нарушение, что значительно поможет врачу при обследовании. Не стоит беспокоиться, если отклонения от нормы произошли только единожды. Но если нарушения замечены в течение нескольких циклов, следует немедленно обратиться к специалисту.

 

Интерпретация коэффициентов линейной регрессии | Эрик Левинсон

Источник: Unsplash

Узнайте, как правильно интерпретировать результаты линейной регрессии, включая случаи с преобразованиями переменных

В настоящее время существует множество алгоритмов машинного обучения, которые мы можем попробовать, чтобы найти наиболее подходящий для нашей конкретной проблемы. Некоторые из алгоритмов имеют четкую интерпретацию, другие работают как черный ящик, и мы можем использовать такие подходы, как LIME или SHAP, для получения некоторых интерпретаций.

В этой статье я хотел бы сосредоточиться на интерпретации коэффициентов самой базовой регрессионной модели, а именно линейной регрессии , включая ситуации, когда зависимые / независимые переменные были преобразованы (в данном случае я говорю о логарифмическом преобразовании ).

Основная форма линейной регрессии (без остатков)

Я предполагаю, что читатель знаком с линейной регрессией (если нет, то есть много хороших статей и сообщений на Medium), поэтому я сосредоточусь исключительно на интерпретации коэффициентов.

Базовую формулу линейной регрессии можно увидеть выше (я специально опустил остатки, чтобы все было просто и по существу). В формуле y обозначает зависимую переменную, а x - независимую переменную. Для простоты предположим, что это одномерная регрессия, но принципы, очевидно, справедливы и для многомерного случая.

Чтобы представить это в перспективе, предположим, что после подбора модели мы получаем:

Intercept (a)

Я разобью интерпретацию точки пересечения на два случая:

  • x является непрерывным и по центру (вычитая среднее значение x из каждого наблюдения, среднее значение преобразованного x становится 0) - среднее значение y равно 3, когда x равно среднему значению выборки
  • x является непрерывным, но не центрировано - среднее значение y равно 3, когда x = 0
  • x является категориальным - среднее значение y равно 3, когда x = 0 (на этот раз указывает на категорию, подробнее об этом ниже)

Коэффициент (b)

  • x - непрерывная переменная

Интерпретация: увеличение единицы в x приводит к увеличению среднего значения y на 5 единиц, все o эти переменные оставались постоянными.

  • x - категориальная переменная

Это требует дополнительных пояснений. Предположим, что x описывает пол и может принимать значения («мужской», «женский»). Теперь давайте преобразуем ее в фиктивную переменную, которая принимает значения 0 для мужчин и 1 для женщин.

Интерпретация: среднее значение и для женщин на 5 единиц выше, чем для мужчин, все остальные переменные остаются неизменными.

Логарифм обозначает натуральный логарифм.

Обычно мы используем преобразование журнала для извлечения данных, которые выбрасываются из положительно искаженного распределения, ближе к основному количеству данных, чтобы обеспечить нормальное распределение переменной.В случае линейной регрессии еще одним преимуществом использования логарифмического преобразования является интерпретируемость.

Пример преобразования журнала: справа - до, слева - после. Источник

Как и раньше, предположим, что приведенная ниже формула представляет коэффициенты подобранной модели.

Перехват (a)

Интерпретация такая же, как и в обычном случае (уровень-уровень), однако нам нужно взять показатель степени перехвата для интерпретации exp (3) = 20.09. Разница в том, что это значение представляет собой среднее геометрическое y (в отличие от среднего арифметического в случае модели уровня-уровня).

Коэффициент (b)

Когда дело доходит до интерпретации категориальных / числовых переменных, принципы снова аналогичны уровневой модели. По аналогии с точкой пересечения нам нужно взять показатель степени коэффициента: exp ( b ) = exp (0,01) = 1,01. Это означает, что увеличение единицы измерения в x вызывает увеличение на 1% среднего (геометрического) y , все остальные переменные остаются постоянными.

Здесь стоит упомянуть две вещи:

  • Когда дело доходит до интерпретации коэффициентов такой модели, существует практическое правило.Если abs (b) <0,15, можно с уверенностью сказать, что при b = 0,1 мы будем наблюдать 10% -ное увеличение y при изменении единицы измерения x . Для коэффициентов с большим абсолютным значением рекомендуется вычислять показатель степени.
  • При работе с переменными в диапазоне [0, 1] (например, в процентах) для интерпретации удобнее сначала умножить переменную на 100, а затем подогнать под модель. Таким образом, интерпретация становится более интуитивной, поскольку мы увеличиваем переменную на 1 процентный пункт вместо 100 процентных пунктов (сразу с 0 до 1).

Предположим, что после подбора модели мы получаем:

Интерпретация точки пересечения такая же, как и в случае модели уровня-уровня.

Для коэффициента b - увеличение x на 1% приводит к приблизительному увеличению среднего значения y на b /100 (0,05 в данном случае), все остальные переменные остаются постоянными . Чтобы получить точную сумму, нам нужно взять b × log (1.01), что в данном случае дает 0.0498.

Предположим, что после подбора модели мы получаем:

Я снова сосредоточусь на интерпретации b. Увеличение x на 1% приводит к 5% -ному увеличению среднего (геометрического) y , все остальные переменные остаются неизменными. Чтобы получить точную сумму, нам нужно взять

, что составляет ~ 5,1%.

Я надеюсь, что эта статья дала вам обзор того, как интерпретировать коэффициенты линейной регрессии, включая случаи, когда некоторые из переменных были преобразованы логарифмически.Как всегда, приветствуются любые конструктивные отзывы. Вы можете связаться со мной в Twitter или в комментариях.

.

Что такое интерпретация данных? Значение, методы, преимущества и проблемы

Анализ и интерпретация данных заняли центральное место с приходом цифровой эры… и огромное количество данных может пугать. Фактически, исследование Digital Universe показало, что общий объем данных в 2012 году составил 2,8 триллиона гигабайт! Если судить только по этому количеству данных, становится ясно, что визитной карточкой любого успешного предприятия в современном глобальном мире будет способность анализировать сложные данные, получать действенные идеи и адаптироваться к новым потребностям рынка… и все это со скоростью мысли.

Информационные панели для бизнеса - это инструменты цифровой эры для больших данных. Способные отображать ключевые показатели эффективности (KPI) как для количественного, так и для качественного анализа данных, они идеально подходят для принятия быстрых рыночных решений на основе данных, которые подталкивают современных лидеров отрасли к устойчивому успеху. Благодаря искусству оптимизированной визуальной коммуникации информационные панели позволяют предприятиям принимать обоснованные решения в режиме реального времени и являются ключевыми инструментами интерпретации данных.Прежде всего, давайте найдем определение, чтобы понять, что скрывается за значением интерпретации данных.

Что такое интерпретация данных?

Интерпретация данных относится к реализации процессов, посредством которых данные проверяются с целью прийти к обоснованному выводу. Интерпретация данных придает значение анализируемой информации и определяет ее значение и значение.

Важность интерпретации данных очевидна, и поэтому ее нужно делать правильно.Данные с большой вероятностью поступают из нескольких источников и имеют тенденцию попадать в процесс анализа со случайным упорядочением. Анализ данных имеет тенденцию быть чрезвычайно субъективным. То есть характер и цель интерпретации будут варьироваться от бизнеса к бизнесу, вероятно, в зависимости от типа анализируемых данных. Хотя существует несколько различных типов процессов, которые реализуются в зависимости от характера индивидуальных данных, две самые широкие и наиболее распространенные категории - это «количественный анализ» и «качественный анализ».

Тем не менее, прежде чем можно будет начать какое-либо серьезное исследование интерпретации данных, следует понять, что визуальное представление результатов данных не имеет значения, если не будет принято обоснованное решение относительно масштабов измерения. Прежде чем приступить к серьезному анализу данных, необходимо определить масштаб измерения для данных, поскольку это будет иметь долгосрочное влияние на рентабельность инвестиций при интерпретации данных. Различные шкалы включают:

  • Номинальная шкала: нечисловых категорий, которые нельзя ранжировать или сравнивать количественно.Переменные являются исключительными и исчерпывающими.
  • Порядковая шкала: эксклюзивных категорий, которые являются исключительными и исчерпывающими, но с логическим порядком. Рейтинги качества и рейтинги согласия являются примерами порядковых шкал (т.е. хорошо, очень хорошо, удовлетворительно и т. Д., ИЛИ согласен, полностью согласен, не согласен и т. Д.).
  • Интервал: шкала измерения, в которой данные сгруппированы по категориям с упорядоченными и равными расстояниями между категориями. Всегда есть произвольная нулевая точка.
  • Соотношение : содержит характеристики всех трех.

Для более подробного обзора шкал измерения прочтите нашу статью по вопросам анализа данных. После выбора шкал измерения пора выбрать, какой из двух общих процессов интерпретации лучше всего соответствует вашим потребностям в данных. Давайте подробнее рассмотрим эти конкретные методы интерпретации данных и возможные проблемы интерпретации данных.

Как интерпретировать данные?

При интерпретации данных аналитик должен попытаться различить различия между корреляцией, причинно-следственной связью и совпадениями, а также многие другие предубеждения, но он также должен учитывать все факторы, которые могли привести к результату.Можно использовать различные методы интерпретации данных.

Интерпретация данных призвана помочь людям понять числовые данные, которые были собраны, проанализированы и представлены. Наличие базового метода (или методов) интерпретации данных предоставит вашим аналитическим командам структуру и прочную основу. В самом деле, если несколько отделов используют разные подходы к интерпретации одних и тех же данных, разделяя одни и те же цели, это может привести к несовпадению целей. Несопоставимые методы приведут к дублированию усилий, непоследовательным решениям, потере энергии и неизбежно - времени и денег.В этой части мы рассмотрим два основных метода интерпретации данных: качественный и количественный анализ.

Качественная интерпретация данных

Качественный анализ данных можно резюмировать одним словом - категориальный. При качественном анализе данные описываются не с помощью числовых значений или шаблонов, а с помощью описательного контекста (т. Е. Текста). Как правило, повествовательные данные собираются с использованием самых разных методов личного общения. Эти методы включают:

  • Наблюдения: детализирует поведенческие модели, возникающие в группе наблюдения.Эти закономерности могут быть количеством времени, потраченного на деятельность, типом деятельности и используемым методом общения.
  • Документы: Подобно тому, как можно наблюдать модели поведения, различные типы ресурсов документации могут быть закодированы и разделены в зависимости от типа материала, который они содержат.
  • Интервью: один из лучших методов сбора повествовательных данных. Ответы на запросы можно сгруппировать по теме, теме или категории. Подход интервью позволяет сфокусировать сегментацию данных.

Ключевое различие между качественным и количественным анализом отчетливо заметно на этапе интерпретации. Качественные данные, поскольку они широко доступны для интерпретации, должны быть «закодированы», чтобы облегчить группировку и маркировку данных по идентифицируемым темам. Поскольку методы личного сбора данных часто могут приводить к спорам, касающимся надлежащего анализа, качественный анализ данных часто резюмируется с помощью трех основных принципов: замечать вещи, собирать вещи, думать о вещах.

Интерпретация количественных данных

Если бы количественную интерпретацию данных можно было выразить одним словом (а это действительно невозможно), то это слово было бы «числовым». Когда дело доходит до анализа данных, нет определенности, но вы можете быть уверены, что если в исследовании, в котором вы участвуете, нет никаких цифр, это не количественное исследование. Под количественным анализом понимается набор процессов, с помощью которых анализируются числовые данные. Чаще всего он включает использование статистического моделирования, такого как стандартное отклонение, среднее значение и медиана.Давайте быстро рассмотрим наиболее распространенные статистические термины:

  • Среднее значение: среднее значение представляет собой среднее значение для набора ответов. При работе с набором данных (или несколькими наборами данных) среднее значение будет представлять центральное значение определенного набора чисел. Это сумма значений, деленная на количество значений в наборе данных. Другие термины, которые могут использоваться для описания концепции, - это среднее арифметическое, среднее и математическое ожидание.
  • Стандартное отклонение: это еще один статистический термин, часто встречающийся в количественном анализе.Стандартное отклонение показывает распределение ответов вокруг среднего. Он описывает степень согласованности ответов; вместе со средним значением он дает представление о наборах данных.
  • Распределение частот: это измерение, измеряющее скорость появления ответа в наборе данных. При использовании опроса, например, частотное распределение может определять, сколько раз появляется определенный ответ по порядковой шкале (т.е. согласен, полностью согласен, не согласен и т. Д.). Распределение частот чрезвычайно важно для определения степени согласия между точками данных.

Обычно количественные данные измеряются путем визуального представления тестов корреляции между двумя или более значимыми переменными. Различные процессы можно использовать вместе или по отдельности, и можно проводить сравнения, чтобы в конечном итоге прийти к заключению. Другие процессы сигнатурной интерпретации количественных данных включают:

  • Регрессионный анализ
  • Когортный анализ
  • Прогнозный и предписывающий анализ

Теперь, когда мы увидели, как интерпретировать данные, давайте продолжим и зададим себе несколько вопросов: какие преимущества дает интерпретация данных? Почему все отрасли занимаются исследованием и анализом данных? Это основные вопросы, но зачастую им не уделяется должного внимания.

Почему важна интерпретация данных

Целью сбора и интерпретации является получение полезной и полезной информации и принятие наиболее обоснованных возможных решений. От предприятий до молодоженов, исследующих свой первый дом, сбор и интерпретация данных обеспечивает безграничные преимущества для широкого круга учреждений и отдельных лиц.

Анализ и интерпретация данных, независимо от метода и качественного / количественного статуса, могут включать следующие характеристики:

  • Обозначение и пояснение данных
  • Сравнение и сопоставление данных
  • Идентификация выбросов в данных
  • Предсказания на будущее

Анализ и интерпретация данных, в конце концов, помогает улучшить процессы и выявлять проблемы.Трудно развиваться и вносить надежные улучшения без, по крайней мере, минимального сбора и интерпретации данных. Какое ключевое слово? Надежный. Расплывчатые идеи относительно повышения производительности существуют во всех учреждениях и отраслях. Тем не менее, без надлежащих исследований и анализа идея, скорее всего, навсегда останется в застойном состоянии (то есть при минимальном росте). Итак ... каковы некоторые из бизнес-преимуществ анализа и интерпретации данных цифровой эпохи? Давайте взглянем!

1) Принятие осознанного решения: Решение настолько хорошо, насколько хороши знания, которые его сформировали.Принятие решений на основе обоснованных данных может выделить лидеров отрасли среди остальных участников рынка. Исследования показали, что компании, входящие в верхнюю треть своих отраслей, в среднем на 5% производительнее и на 6% более прибыльны при внедрении процессов принятия решений на основе информации. Наиболее решительные действия возникнут только после выявления проблемы или определения цели. Анализ данных должен включать идентификацию, разработку диссертации и сбор данных с последующей передачей данных.

Если учебные заведения будут следовать только этому простому порядку, который мы все должны знать по школьным научным ярмаркам, то они смогут решать проблемы по мере их возникновения в реальном времени. Информированное принятие решений имеет тенденцию быть цикличным. Это означает, что на самом деле нет конца, и, в конце концов, в процессе возникают новые вопросы и условия, которые необходимо изучить дальше. Мониторинг результатов данных неизбежно вернет процесс к началу с новыми данными и взглядами.

2) Предвидение потребностей с выявлением тенденций: анализ данных дает знания, а знания - сила. Понимание, полученное в результате анализа рыночных и потребительских данных, может определять тенденции для аналогов в аналогичных сегментах рынка. Прекрасным примером того, как анализ данных может повлиять на прогнозирование тенденций, может служить приложение для идентификации музыки Shazam. Приложение позволяет пользователям загружать аудиоклип на песню, которая им нравится, но их невозможно идентифицировать.Пользователи делают 15 миллионов идентификаций песен в день. Имея эти данные, Shazam сыграл важную роль в предсказании будущих популярных артистов.

Когда отраслевые тенденции определены, они могут служить более важной цели отрасли. Например, результаты мониторинга Shazam помогают не только Shazam понять, как удовлетворить потребности потребителей, но и позволяют руководителям музыкальных компаний и звукозаписывающим компаниям лучше понять современную сцену поп-культуры. Процессы сбора и интерпретации данных могут позволить прогнозировать климат в масштабах всей отрасли и привести к увеличению потоков доходов на рынке.По этой причине все учреждения должны следовать базовому циклу сбора, интерпретации, принятия решений и мониторинга данных.

3) Экономическая эффективность: Надлежащее внедрение процессов анализа данных может обеспечить предприятиям значительные преимущества в затратах в их отраслях. Недавнее исследование данных, проведенное Deloitte, наглядно демонстрирует это: рентабельность инвестиций в анализ данных достигается за счет эффективного сокращения затрат. Часто это преимущество упускается из виду, потому что зарабатывание денег обычно считается «более привлекательным», чем их экономия.Тем не менее, надежный анализ данных может предупредить руководство о возможностях снижения затрат без каких-либо значительных усилий со стороны человеческого капитала.

Отличным примером потенциала экономической эффективности за счет анализа данных является корпорация Intel. До 2012 года Intel проведет более 19 000 производственных функциональных тестов своих чипов, прежде чем они будут признаны приемлемыми для выпуска. Чтобы сократить расходы и сократить время тестирования, корпорация Intel внедрила прогнозный анализ данных. Используя исторические и текущие данные, Intel теперь избегает тестирования каждого чипа 19 000 раз, сосредотачиваясь на конкретных и индивидуальных тестах чипа.После его внедрения в 2012 году Intel сэкономила более 3 миллионов долларов на производственных затратах. Снижение затрат может быть не таким «привлекательным», как прибыль от данных, но, как доказывает Intel, это преимущество анализа данных, которым нельзя пренебрегать.

4) Четкое предвидение: компаний, которые собирают и анализируют свои данные, лучше узнают о себе, своих процессах и производительности. Они могут выявлять проблемы с производительностью, когда они возникают, и принимать меры для их решения. Интерпретация данных с помощью визуального представления позволяет им быстрее обрабатывать свои выводы и принимать более обоснованные решения о будущем компании.

Проблемы интерпретации данных

Часто повторяемая мантра тех, кто опасается развития данных в цифровую эпоху, звучит так: «большие данные - это большие проблемы». Хотя это утверждение не является точным, можно с уверенностью сказать, что определенные проблемы интерпретации данных или «подводные камни» существуют и могут возникать при анализе данных, особенно со скоростью мысли. Давайте выделим три наиболее распространенных риска неправильной интерпретации данных и пролим свет на то, как их можно избежать:

1) Корреляция, ошибочно принятая за причинную связь: наша первая неверная интерпретация данных связана с тенденцией аналитиков смешивать причину явления с корреляцией.Это предположение, что, поскольку два действия произошли вместе, одно вызвало другое. Это неточно, поскольку действия могут происходить вместе, при отсутствии причинно-следственной связи.

  • Пример цифровой эпохи: Предполагая, что рост доходов является результатом увеличения числа подписчиков в социальных сетях ... между ними может быть определенная корреляция, особенно с учетом сегодняшнего опыта многоканальных покупок. Но это не означает, что увеличение числа подписчиков является прямой причиной увеличения доходов.Может быть как общая причина, так и косвенная причинность.
  • Средство: попытайтесь устранить переменную, которая, по вашему мнению, является причиной явления.

2) Систематическая ошибка подтверждения: наша вторая проблема интерпретации данных возникает, когда у вас есть теория или гипотеза, но вы намерены только обнаружить шаблоны данных, которые обеспечивают поддержку, и отвергать те, которые этого не делают.

  • Пример цифровой эпохи: ваш начальник просит вас проанализировать успех недавней мультиплатформенной маркетинговой кампании в социальных сетях.Анализируя возможные переменные данных из кампании (которая, по вашему мнению, показала хорошие результаты), вы видите, что доля публикаций публикаций в Facebook была высокой, а доля публикаций твитов в Twitter - нет. Использование только сообщений в Facebook для доказательства вашей гипотезы об успешности кампании будет прекрасным проявлением предвзятости подтверждения.
  • Средство правовой защиты: Поскольку эта ловушка часто основана на субъективных желаниях, одним из средств защиты может быть анализ данных с группой объективных людей.Если это невозможно, другое решение - противостоять побуждению сделать вывод до завершения исследования данных. Не забывайте всегда стараться опровергнуть гипотезу, а не доказывать ее.

3) Неактуальные данные: третья и последняя ловушка неверной интерпретации данных особенно важна в эпоху цифровых технологий. Поскольку большие данные больше не хранятся централизованно и продолжают анализироваться со скоростью мысли, аналитики неизбежно сосредоточатся на данных, которые не имеют отношения к проблеме, которую они пытаются исправить.

  • Пример цифровой эпохи: Пытаясь оценить успех кампании по привлечению потенциальных клиентов по электронной почте, вы замечаете, что количество просмотров домашней страницы, непосредственно связанное с кампанией, увеличилось, а количество ежемесячных подписчиков на информационный бюллетень - нет. Основываясь на количестве просмотров домашней страницы, вы решаете, что кампания была успешной, хотя на самом деле она не привела к нулевым лидам.
  • Средство правовой защиты: заблаговременно и четко сформулируйте любые переменные анализа данных и ключевые показатели эффективности, прежде чем приступить к проверке данных.Если метрикой, которую вы используете для измерения успеха кампании по привлечению потенциальных клиентов, являются подписчики на рассылку новостей, нет необходимости проверять количество посещений домашней страницы. Обязательно сосредоточьтесь на переменной данных, которая отвечает на ваш вопрос или решает вашу проблему, а не на нерелевантных данных.

Интерпретация данных: использование информационных панелей для преодоления разрыва

Как мы видели, количественные и качественные методы представляют собой разные типы анализа данных. Оба предлагают разную степень возврата инвестиций (ROI) в отношении исследования данных, тестирования и принятия решений.Из-за их различий важно понимать, как можно реализовать информационные панели, чтобы восполнить пробелы в количественной и качественной информации. Как решения для информационных панелей цифровых данных играют ключевую роль в устранении разрыва в данных? Вот несколько способов:

1) Соединение и смешивание данных. При нынешних темпах инноваций больше нецелесообразно (и желательно) хранить большие объемы данных в центре. По мере того, как предприятия продолжают глобализоваться, а границы продолжают растворяться, для предприятий будет становиться все более важным обладать способностью проводить разнообразный анализ данных без ограничений местоположения.Панели мониторинга данных децентрализует данные без ущерба для необходимой скорости мышления, сочетая как количественные, так и качественные данные. Независимо от того, хотите ли вы измерить потребительские тенденции или эффективность организации, теперь у вас есть возможность делать и то, и другое без необходимости делать единичный выбор.

2) Мобильные данные. С понятием «соединенных и смешанных данных» связано понятие мобильных данных. В современном цифровом мире сотрудники проводят меньше времени за своими столами и одновременно увеличивают объем производства.Это стало возможным благодаря тому, что мобильные решения для аналитических инструментов больше не являются автономными. Сегодня мобильные аналитические приложения легко интегрируются с повседневными бизнес-инструментами. В свою очередь, как количественные, так и качественные данные теперь доступны по запросу, где они нужны, когда они нужны и по мере необходимости.

3) Визуализация. Информационные панели объединяют пробелы в данных между качественными и количественными методами интерпретации данных с помощью науки визуализации.Решения для информационных панелей поставляются «из коробки», хорошо оснащенные для создания простых для понимания демонстраций данных. Современные онлайн-инструменты визуализации данных предоставляют различные цвета и шаблоны фильтров, поощряют взаимодействие с пользователем и разработаны для повышения предсказуемости будущих тенденций. Все эти визуальные характеристики облегчают переход между методами обработки данных - вам нужно только найти правильные типы визуализации данных, чтобы рассказать историю данных наилучшим образом.

Чтобы дать вам представление о том, как панель мониторинга маркетинговых исследований удовлетворяет потребность в соединении количественного и качественного анализа и помогает понять, как интерпретировать данные в исследовании благодаря визуализации, взгляните на следующую.Он объединяет качественные и количественные данные, проанализированные со знанием дела, и визуализирует их значимым образом, понятным каждому, что дает возможность любому зрителю интерпретировать их:

** нажмите, чтобы увеличить **
Чтобы увидеть больше примеров анализа и интерпретации данных, посетите нашу библиотеку бизнес-панелей. Теперь, когда у нас есть понимание того, как информационные панели бизнес-аналитики могут помочь преодолеть разрыв между традиционными количественными и качественными методами данных, давайте сделаем небольшой обзор методов интерпретации данных, упомянутых в этой статье.

Сводный список методов интерпретации данных и советы

Анализ и интерпретация данных имеют решающее значение для выработки обоснованных выводов и принятия более обоснованных решений. Как мы видели на протяжении всей этой статьи, интерпретация данных - это искусство и наука. Ниже приводится краткий список способов интерпретации данных и некоторые советы:

  • Соберите свои данные и сделайте их максимально чистыми.
  • Выберите тип анализа: качественный или количественный, и примените методы соответственно к каждому.
  • Качественный анализ: наблюдайте, документируйте и собеседуйте уведомления, собирайте и думайте о вещах.
  • Количественный анализ: вы проводите исследование с большим количеством числовых данных, которые нужно проанализировать с помощью различных статистических методов - например, среднего, стандартного отклонения или частотного распределения.
  • Сделайте шаг назад: подумайте о своих данных с разных точек зрения и о том, что они значат для различных участников или действующих лиц проекта.
  • Подумайте о собственном мышлении и рассуждениях и помните о многих подводных камнях, которые несет в себе анализ и интерпретация данных.Корреляция против причинной связи, субъективная предвзятость, ложная информация и неточные данные и т. Д.

Заключение…

Важность интерпретации данных неоспорима. Информационные панели не только устраняют информационный разрыв между традиционными методами и технологиями интерпретации данных, но и могут помочь исправить и предотвратить основные ошибки интерпретации. В качестве решения эпохи цифровых технологий они сочетают в себе лучшее из прошлого и настоящего, позволяя принимать обоснованные решения с максимальной рентабельностью инвестиций в интерпретацию данных.

Чтобы начать визуализировать свою аналитическую информацию значимым и действенным способом, протестируйте наше программное обеспечение для онлайн-отчетов бесплатно с помощью нашей 14-дневной пробной версии!

.

Как интерпретировать отношения шансов в логистической регрессии?

Введение

Когда двоичная переменная результата моделируется с использованием логистической регрессии, предполагается, что логит-преобразование переменной результата имеет линейную связь с переменными-предикторами. Это делает интерпретацию коэффициенты регрессии несколько хитрые. На этой странице мы рассмотрим концепцию отношения шансов и попытаемся интерпретировать результаты логистической регрессии, используя концепцию отношения шансов на нескольких примерах.

От вероятности к размеру к логарифму шансов

Все начинается с понятия вероятности. Допустим, вероятность успеха какого-либо мероприятия составляет 0,8. Тогда вероятность отказа составляет 1 - 0,8 = 0,2. Шансы на успех определяются как отношение вероятности успеха к вероятности неудачи. В нашем примере шансы на успех равны 0,8 / 0,2 = 4. То есть шансы на успех равны 4: 1. Если вероятность успеха составляет 0,5, то есть вероятность 50-50%, то шансы на успех - 1 к 1.

Преобразование вероятности в шансы - это монотонное преобразование, означающее, что шансы увеличиваются с увеличением вероятности или наоборот. Вероятность колеблется от 0 до 1. Шансы колеблются от 0 до положительной бесконечности. Ниже представлена ​​таблица преобразования вероятности в шансы, и мы также построили график для диапазона p, меньшего или равного 0,9.

 p шансы .001 .001001 .01 .010101 .15 .1764706 .2 .25 .25 .3333333 .3 .4285714 .35 .5384616 .4 .6666667 .45 .8181818 .5 1 0,55 1,222222 .6 1.5 .65 1.857143 0,7 2,333333 0,75 3 .8 4 0,85 5,666667 .9 9 0,999 999 .9999 9999 

Преобразование шансов в логарифм шансов - это преобразование журнала.Опять же, это монотонное преобразование. То есть, чем больше шансы, тем больше логарифм шансов, и наоборот. В таблице ниже показано соотношение между вероятностью, шансами и логарифмом шансов. Мы также показали график зависимости логарифма от шансов.

 p шансы logodds .001 .001001 -6.906755 .01 .010101 -4.59512 .15 .1764706 -1.734601 .2 .25 -1.386294 .25 .3333333 -1.098612 .3 .4285714 -.8472978 .35 .5384616 -.6190392 .4 .6666667 -.4054651 .45 .8181818 -.2006707 .5 1 0 .55 1.222222 .2006707 .6 1.5 .4054651 .65 1.857143 .6190392 .7 2,333333 .8472978 0,75 3 1,098612 .8 4 1,386294 0,85 5,666667 1,734601 .9 9 2,197225 .999 999 6.906755 .9999 9999 9.21024 

Почему мы так стараемся преобразовать вероятность в логарифм? Одна из причин в том, что обычно сложно смоделировать переменную с ограниченным диапазоном, например вероятность. Это преобразование - попытка обойти проблему ограниченного диапазона. Он отображает вероятность в диапазоне от 0 до 1 с логарифмическими шансами в диапазоне от отрицательного. бесконечность к положительной бесконечности. Другая причина в том, что среди всего бесконечного множества вариантов трансформации логарифм шансов является одним из самых простых для понимания и интерпретации.Это преобразование называется преобразованием логита. Другой распространенный выбор - преобразование пробит, которое здесь не рассматривается.

Модель логистической регрессии позволяет нам установить связь между двоичной переменной результата и группой предикторов. переменные. Он моделирует логит-преобразованную вероятность как линейную связь с переменными-предикторами. Более формально, пусть $ Y $ будет двоичной переменной результата, указывающей неудачу / успех с $ \ {0,1 \} $, а $ p $ будет вероятностью того, что $ y $ будет $ 1 $, $ p = P (Y = 1 ) $.Пусть $ x_1, \ cdots, x_k $ будет набором переменных-предикторов. Затем логистическая регрессия $ Y $ на $ x_1, \ cdots, x_k $ оценивает значения параметров для $ \ beta_0, \ beta_1, \ cdots, \ beta_k $ с помощью метода максимального правдоподобия следующего уравнения

$$ logit (p) = log (\ frac {p} {1-p}) = \ beta_0 + \ beta_1 x_1 + \ cdots + \ beta_k x_k. $$

Возведем в степень и возьмем мультипликативную обратную обе стороны,

$$ \ frac {1-p} {p} = \ frac {1} {exp (\ beta_0 + \ beta_1 x_1 + \ cdots + \ beta_k x_k)}.

$

Выделите дробь в левой части уравнения и прибавьте единицу к обеим частям,

$$ \ frac {1} {p} = 1 + \ frac {1} {exp (\ beta_0 + \ beta_1 x_1 + \ cdots + \ beta_k x_k)}. $$

Заменить 1 на общий знаменатель,

$$ \ frac {1} {p} = \ frac {exp (\ beta_0 + \ beta_1 x_1 + \ cdots + \ beta_k x_k) +1} {exp (\ beta_0 + \ beta_1 x_1 + \ cdots + \ beta_k x_k )}. $$

Наконец, снова возьмем мультипликативную обратную величину, чтобы получить формулу для вероятности $ P (Y = 1) $,

$$ {p} = \ frac {exp (\ beta_0 + \ beta_1 x_1 + \ cdots + \ beta_k x_k)} {1 + exp (\ beta_0 + \ beta_1 x_1 + \ cdots + \ beta_k x_k)}.

$

Теперь мы готовы рассмотреть несколько примеров логистической регрессии. Мы будем используйте образец набора данных https://stats.idre.ucla.edu/wp-content/uploads/2016/02/sample.csv для иллюстрации. Данные набор имеет 200 наблюдений, и используемая переменная результата будет hon , указывая, находится ли студент в класс с отличием или нет. Итак, наш p = prob ( hon = 1). Мы будем намеренно игнорируйте все тесты значимости и сосредотачивайтесь на значении коэффициенты регрессии.Вывод на этой странице был создан с использованием Stata с некоторыми редактирование.

Логистическая регрессия без переменных-предикторов

Начнем с простейшей логистической регрессии, модели без каких-либо переменные-предикторы. В уравнении мы моделируем

логит (p) = β 0

 Логистическая регрессия Количество обсл. = 200 LR chi2 (0) = 0.00 Вероятно> chi2 =. Логарифмическое правдоподобие = -111,35502 Псевдо R2 = 0,0000 -------------------------------------------------- ---------------------------- хон | Коэф. Стд. Err. z P> | z | [95% конф. Интервал] ------------- + ------------------------------------ ---------------------------- перехватить | -1,12546,1644101 -6,85 0,000 -1,447697 -.8032217 -------------------------------------------------- ---------------------------- 

Это означает, что log (p / (1-p)) = -1,12546. Что здесь p? Оказывается, p равно общая вероятность попасть в класс с отличием ( hon = 1). Давайте посмотрим на частоту стол для hon .

 hon | Freq. Процент Cum. ------------ + ----------------------------------- 0 | 151 75,50 75.50 1 | 49 24,50 100,00 ------------ + ----------------------------------- Итого | 200 100,00 

Итак, p = 49/200 = 0,245. Шансы составляют 0,245 / (1-245) = 0,3245, а логарифм шансы (logit) - это журнал (.3245) = -1,12546. Другими словами, перехват от модели без переменные-предикторы - это оценочные логарифмические шансы попасть в класс с отличием для всего населения представляет интерес. Мы может также преобразовать логарифм шансов обратно в вероятность: p = exp (-1.12546) / (1 + ехр (-1,12546)) = .245, если угодно.

Логистическая регрессия с одной дихотомической переменной-предиктором

А теперь давайте сделаем еще один шаг и добавим двоичную переменную-предиктор . женский , к модели. Записав это в уравнение, модель описывает следующие линейные отношения.

logit (p) = β 0 + β 1 * внутренняя часть

 Логистическая регрессия Количество обсл. = 200 LR chi2 (1) = 3.10 Вероятность> chi2 = 0,0781 Логическая вероятность = -109.80312 Псевдо R2 = 0,0139 -------------------------------------------------- ---------------------------- хон | Коэф. Стд. Err. z P> | z | [95% конф. Интервал] ------------- + ------------------------------------ ---------------------------- женский | .5927822 .3414294 1,74 0,083 -0764072 1.261972 перехватить | -1,470852 .2689555 -5,47 0,000 -1,997995 -,9437087 -------------------------------------------------- ---------------------------- 

Прежде чем пытаться интерпретировать два оцененных выше параметра, давайте возьмем посмотрите на кросс-таблицу переменной hon с female .

 | женщина хон | мужской женский | Всего ----------- + ---------------------- + ---------- 0 | 74 77 | 151 1 | 17 32 | 49 ----------- + ---------------------- + ---------- Итого | 91 109 | 200 

В нашем наборе данных, каковы шансы, что мужчина попадет в класс с отличием, и каковы шансы женщины в классе с отличием? Мы можем вручную рассчитать эти шансы из таблица: для мужчин шансы попасть в класс с отличием составляют (17/91) / (74/91) = 17/74 =.23; а для женщин шансы попасть в класс с отличием составляют (32/109) / (77/109) = 32/77 = .42. Отношение шансов для женщин к шансам для мужчин равно (32/77) / (17/74) = (32 * 74) / (77 * 17) = 1,809. Таким образом, шансы для мужчин 17 к 74, шансы для женщин от 32 до 77, а для женщин примерно на 81% выше, чем шансы для мужчин.

Теперь мы можем соотнести шансы для мужчин и женщин и результат логистики. регресс. Перехват -1,471 - это логарифмический коэффициент для мужчин, поскольку мужчина - это контрольная группа ( женщин, = 0).Используя рассчитанные выше коэффициенты для мужчин, мы можем подтвердить это: log (.23) = -1,47. Коэффициент для женщин - логарифм шансов. соотношение между женской и мужской группой: log (1,809) = 0,593. Итак, мы можем получить отношение шансов путем возведения в степень коэффициента для женщин. Наиболее статистические пакеты отображают коэффициенты необработанной регрессии и экспоненциальные коэффициенты для моделей логистической регрессии. В таблице ниже созданный Stata.

 Логистическая регрессия Количество обсл. = 200 LR chi2 (1) = 3.10 Вероятность> chi2 = 0,0781 Логическая вероятность = -109.80312 Псевдо R2 = 0,0139 -------------------------------------------------- ---------------------------- хон | Соотношение шансов Стд. Err. z P> | z | [95% конф. Интервал] ------------- + ------------------------------------ ---------------------------- женский | 1,809015 .6176508 1,74 0,083 .9264389 3.532379 -------------------------------------------------- ---------------------------- 

Логистическая регрессия с одной непрерывной переменной-предиктором

Другой простой пример - модель с одной непрерывной переменной-предиктором. например, модель ниже. Он описывает отношения между студентами математика оценки и шансы попасть в класс с отличием.

логит (p) = β 0 + β 1 * математика

 Логистическая регрессия Количество обсл. = 200 LR chi2 (1) = 55.64 Вероятность> chi2 = 0,0000 Логарифмическое правдоподобие = -83,536619 Псевдо R2 = 0,2498 -------------------------------------------------- ---------------------------- хон | Коэф. Стд. Err. z P> | z | [95% конф. Интервал] ------------- + ------------------------------------ ---------------------------- математика | .1563404 .0256095 6.10 0.000 .1061467.206534 перехватить | -9,793942 1,481745 -6,61 0,000 -12,69811 -6,889775 -------------------------------------------------- ---------------------------- 

В этом случае оценочный коэффициент для точки пересечения представляет собой логарифмическую вероятность студент с нулевым баллом по математике, посещающий класс с отличием. Другими словами, шансы попасть в класс с отличием при нулевом балле по математике составляют ехр (-9,793942) = 0,00005579. Эти шансы очень низкие, но если мы посмотрим на распределение переменной math , мы увидим, что ни у кого из выборки нет оценок ниже 30.В Фактически, все результаты тестов в наборе данных были стандартизированы около среднего значения 50 и стандартное отклонение 10. Таким образом, точка пересечения в этой модели соответствует логарифмическим шансам пребывание в классе с отличием, когда math имеет гипотетическое значение , равное нулю.

Как мы интерпретируем коэффициент по математике? Коэффициент и оценки точки пересечения дают нам следующее уравнение:

журнал (p / (1-p)) = logit (p) = - 9,793942 + .1563404 * математика

Давайте зафиксируем math на некотором значении.Мы будем использовать 54. Тогда условный логит бытия в классе с отличием, когда оценка по математике на 54 -

журнал (p / (1-p)) ( math = 54) = - 9,793942 + .1563404 * 54 .

Мы можем изучить эффект увеличения на одну единицу оценок по математике. Когда оценка по математике составляет 55, условный логит нахождения в классе с отличием это

журнал (p / (1-p)) ( math = 55) = - 9,793942 + .1563404 * 55 .

Принимая во внимание разницу двух уравнений, мы иметь:

журнал (p / (1-p)) ( math = 55) - журнал (p / (1-p)) ( math = 54) =.1563404.

Теперь мы можем сказать, что коэффициент для math - это разница в журнале шансы. Другими словами, для увеличения на одну единицу результата по математике ожидаемое коэффициент изменения журнала составляет 0,1563404.

Можем ли мы перевести это изменение логарифмических коэффициентов на изменение коэффициентов? Действительно, можем. Напомним, что логарифм преобразует умножение и деление в сложение и вычитание. Его обратное, возведение в степень преобразует сложение и вычитание обратно в умножение и деление.Если мы возведем в степень обе части нашего последнего уравнения, мы получим следующее:

exp [журнал (p / (1-p)) ( math = 55) - log (p / (1-p)) ( math = 54)] = exp (log (p / (1-p)) ( math = 55)) / exp (log (p / (1-p)) ( math = 54)) = шансы ( по математике = 55) / шансы ( по математике = 54) = exp (0,1563404) = 1.1692241.

Таким образом, мы можем сказать, что для увеличения математики на одну единицу , мы ожидаем, что шансы получить награду увеличатся примерно на 17%. учебный класс.Эти 17% увеличения не зависят от ценности математики.

Логистическая регрессия с несколькими переменными-предикторами и без взаимодействия условия

В общем, мы можем иметь несколько переменных-предикторов в логистической регрессии. модель.

логит (p) = log (p / (1-p)) = β 0 + β 1 * x1 +… + Β k * xk

Применяя такую ​​модель к нашему набору данных, каждый оценочный коэффициент представляет собой ожидаемое изменение логарифмических шансов на получение награды. класс для единичного увеличения соответствующей переменной-предиктора, удерживающей другой предсказатель переменные постоянны при определенном значении.Каждый экспоненциальный коэффициент - это отношение двух шансы, или изменение шансов в мультипликативной шкале для увеличения единицы соответствующая переменная-предиктор, содержащая другие переменные при определенном значении. Вот пример.

логит (p) = log (p / (1-p)) = β 0 + β 1 * математика + β 2 * женский + β 3 * читать

 Логистическая регрессия Количество обсл. = 200 LR chi2 (3) = 66.54 Вероятность> chi2 = 0,0000 Логарифмическая вероятность = -78,084776 Псевдо R2 = 0,2988 -------------------------------------------------- ---------------------------- хон | Коэф. Стд. Err. z P> | z | [95% конф. Интервал] ------------- + ------------------------------------ ---------------------------- математика | .1229589 .0312756 3,93 0,000 .0616599.1842578 женский | .979948 .4216264 2.32 0.020 .1535755 1.80632 читать | .0590632 .0265528 2,22 0,026 .0070207 .1111058 перехватить | -11,77025 1,710679 -6,88 0,000 -15,12311 -8,417376 -------------------------------------------------- ---------------------------- 

В этой подогнанной модели говорится, что при фиксированном значении math и , читающем , вероятность попадание в класс с отличием для женщин ( женщин, = 1) по шансам попасть в класс с отличием класс для мужчин ( женщин = 0) - exp (.979948) = 2,66. Что касается процентного изменения, мы можем сказать что шансы для женщин на 166% выше, чем для мужчин. В коэффициент для по математике говорит, что, имея женщин и , читая в фиксированное значение, мы увидим увеличение шансов попасть в класс с отличием на 13% для увеличения на одну единицу результата по математике, поскольку exp (0,1229589) = 1,13.

Логистическая регрессия с членом взаимодействия двух переменных-предикторов

Во всех предыдущих примерах мы говорили, что коэффициент регрессии переменная соответствует изменению логарифмических коэффициентов и ее экспоненциальной форме соответствует отношению шансов.Это верно только тогда, когда в нашей модели нет любые условия взаимодействия. Когда модель имеет член (ы) взаимодействия двух предсказателей переменных, он пытается описать, как эффект переменной-предиктора зависит от уровня / значения другой переменной-предиктора. В интерпретация коэффициентов регрессии становится более сложной.

Рассмотрим простой пример.

логит (p) = log (p / (1-p)) = β 0 + β 1 * гнездовой + β 2 * математический + β 3 * женский * математический

 Логистическая регрессия Количество обсл. = 200 LR chi2 (3) = 62.94 Вероятность> chi2 = 0,0000 Логарифмическое правдоподобие = -79,883301 Псевдо R2 = 0,2826 -------------------------------------------------- ---------------------------- хон | Коэф. Стд. Err. z P> | z | [95% конф. Интервал] ------------- + ------------------------------------ ---------------------------- женский | -2,899863 3,094186 -0,94 0,349 -8,964357 3.164631 математика | .1293781 .0358834 3.61 0.000 .0590479 .1997082 femalexmath | .0669951 .05346 1,25 0,210 -0377846 .1717749 перехватить | -8,745841 2,12913 -4,11 0,000 -12,91886 -4,572823 -------------------------------------------------- ---------------------------- 

При наличии члена взаимодействия женщин на по математике , мы можем больше не говорят о влиянии женщин на , удерживая все другие переменные на уровне определенное значение, так как нет смысла исправлять math и femalexmath на определенное значение и все еще разрешает женское изменение от 0 до 1!

В этом простом примере, где мы исследуем взаимодействие двоичного переменной и непрерывной переменной, мы можем думать, что на самом деле у нас есть два уравнения: одно для мужчин и одно для женщин.Для мужчин ( женщин = 0) уравнение выглядит следующим образом: просто

логит (p) = log (p / (1-p)) = β 0 + β 2 * математ.

Для женщин уравнение

логит (p) = log (p / (1-p)) = (β 0 + β 1 ) + (β 2 + β 3 ) * математ.

Теперь мы можем отобразить результат логистической регрессии на эти два уравнения. Таким образом, мы можем сказать, что коэффициент по математике - это эффект математики, когда женщин = 0.Более конкретно, мы можем сказать, что для студентов мужского пола Увеличение балла по математике на одну единицу дает изменение логарифмического коэффициента на 0,13. С другой С другой стороны, для студенток увеличение баллов по математике на одну единицу приводит к изменению логарифмические шансы (0,13 + 0,067) = 0,197. Что касается отношения шансов, мы можем сказать, что для студенты мужского пола, отношение шансов exp (0,13) = 1,14 для увеличения на одну единицу по математике и отношение шансов для студенток exp (0,197) = 1,22 для увеличение на одну единицу результатов по математике. Отношение этих двух коэффициентов шансов (женщины над мужчиной) оказывается экспоненциальным коэффициентом для члена взаимодействия из женщин по математике : 1.22 / 1,14 = ехр (0,067) = 1,07.

.

Интерпретировать всю статистику и графики для описательной статистики

Стандартная ошибка среднего (SE Mean) оценивает изменчивость между средними значениями выборки, которые вы получили бы, если бы вы брали повторные выборки из одной и той же совокупности. В то время как стандартная ошибка среднего оценивает изменчивость между выборками, стандартное отклонение измеряет изменчивость в пределах одной выборки.

Например, у вас средний срок доставки 3,80 дня со стандартным отклонением 1.43 дня, из случайной выборки из 312 сроков доставки. Эти числа дают стандартную ошибку среднего 0,08 дня (1,43, деленное на квадратный корень из 312). Если вы взяли несколько случайных выборок одного и того же размера из одной и той же совокупности, стандартное отклонение этих разных выборочных средних составило бы около 0,08 дня.

Устный перевод

Используйте стандартную ошибку среднего, чтобы определить, насколько точно среднее значение выборки оценивает среднее значение генеральной совокупности.

Меньшее значение стандартной ошибки среднего указывает на более точную оценку среднего значения для генеральной совокупности.Обычно большее стандартное отклонение приводит к большей стандартной ошибке среднего и менее точной оценке среднего для генеральной совокупности. Больший размер выборки приводит к меньшей стандартной ошибке среднего и более точной оценке среднего генерального значения.

Minitab использует стандартную ошибку среднего для вычисления доверительного интервала.

.

Смотрите также

НА ВЕРХ