Часть 4. Почему смещение происходит при корректировке оптимизма?

  1. связанные с

В предыдущих частях серии мы демонстрировали положительные результаты смещения в корректируемой оптимизмом начальной загрузке, просто добавляя случайные функции к нашим меткам. Эта проблема связана с «утечкой информации» в алгоритме, что означает, что обучающие и тестовые наборы данных не разделяются при оценке оптимизма. В связи с этим оптимизм при некоторых условиях может быть очень недооценен. Давайте проанализируем код, понять его довольно просто, тогда мы сможем увидеть, откуда возникла проблема.

  1. Подгоните модель M ко всем данным S и оцените прогнозирующую способность C. ## эта часть является нашей переоцененной оценкой производительности (может быть AUC, точность и т. Д.)
  2. Итерация от b = 1… B: ## теперь мы делаем повторную выборку данных, чтобы оценить ошибку
    1. Возьмите повторную выборку из исходных данных, S *
    2. Подгоните загрузочную модель M * к S * и получите прогнозирующую способность, C_boot ##, это, несомненно, даст нам другую перегруженную модель, что хорошо
    3. Используйте загрузочную модель M *, чтобы получить прогнозирующую способность на S, C_orig ## мы используем те же данные (образцы), которые использовались для обучения модели для ее тестирования, поэтому неудивительно, что у нас есть значения с лучшей производительностью, чем ожидалось. Значения C_orig будут слишком высокими.
  3. Оптимизм O рассчитывается как среднее значение (C_boot - C_orig)
  4. Рассчитать оптимизм с поправкой производительности как СО.

Одним из способов исправить это было бы изменение шага 3 начальной загрузки вместо проверки исходных данных, чтобы проверить оставленные (невидимые) данные в начальной загрузке. Таким образом, данные об обучении и тестировании сохраняются полностью раздельно с точки зрения выборок, что устраняет наше смещение в сторону завышенной производительности модели на нулевых наборах данных с высокими характеристиками. Вероятно, в любом случае нет смысла делать это, когда у нас есть такие методы, как LOOCV и K-перекрестная валидация.

В качестве p (функции) >> N (образцы) мы получим все более и более хорошие возможности для достижения хорошей производительности модели, используя загруженные данные на исходных данных. Зачем? Поскольку исходные данные содержат те же примеры, что и при начальной загрузке, и по мере того, как мы получаем больше функций, больше шансов получить случайную корреляцию с нашей переменной отклика. Когда мы тестируем начальную загрузку на исходных данных (плюс больше выборок), мы сохраняем некоторые из этих случайных способностей предсказать реальные метки. Это типичная проблема переоснащения, когда у нас больше функций, а процедура неисправна.

Давайте еще раз экспериментально рассмотрим проблему, этот код можно напрямую скопировать и вставить в R для повторения анализа и графиков. У нас есть две реализации метода, первая для меня для glmnet (лассо-логистическая регрессия), вторая для glm (логистическая регрессия) с этого сайта ( http://cainarchaeology.weebly.com/r-function-for-optimism-adjusted-auc.html ). Не стесняйтесь пробовать разные алгоритмы машинного обучения и играть с параметрами.

библиотека (glmnet) библиотека (pROC) библиотека (каретка) библиотека (ggplot) библиотека (kimisc) ### ТЕСТ 1: оптимизация начальной загрузки с glmnet cc
Итак, вот результаты, так как количество только шумовых элементов на оси x увеличивает нашу «скорректированную» оценку AUC (на оси y), также увеличивается, когда мы начинаем получать достаточно, чтобы этот шум мог случайным образом предсказать метки. Таким образом, это показывает, что проблема начинается примерно с 40-50 функций, а затем ухудшается до примерно 75+. Это с помощью функции 'glmnet'.
библиотека (glmnet) библиотека (pROC) библиотека (каретка) библиотека (ggplot) библиотека (kimisc) ### ТЕСТ 1: оптимизация начальной загрузки с glmnet cc   Итак, вот результаты, так как количество только шумовых элементов на оси x увеличивает нашу «скорректированную» оценку AUC (на оси y), также увеличивается, когда мы начинаем получать достаточно, чтобы этот шум мог случайным образом предсказать метки
Давайте посмотрим на метод с использованием glm, мы обнаружим ту же тенденцию, другую реализацию. ## TEST2 auc.adjust
Итак, у нас это есть, метод имеет проблему с ним и не должен использоваться с более чем 40 функциями. К сожалению, этот метод в настоящее время используется для наборов данных с количеством измерений, превышающим это число (более 40), потому что люди думают, что это опубликованный метод, который безопасен, к сожалению, это не то, как мир работает с R читателями. Помните, что система коррумпирована, наука и статистика полны лжи, и, если сомневаетесь, проведите собственные тесты на положительный и отрицательный контроль.
Это с функцией «glm». Случайные объекты добавлены по оси x, исправлены AUC по оси y.

Что если ты не веришь в это? Я имею в виду, что это метод учебника. Что ж, читатели R, если это так, я предлагаю написать это самостоятельно и попробовать код здесь, провести эксперименты с нулевыми (только случайные данные) наборами данных с растущими возможностями.
Это последняя часть серии статей о разоблачении метода начальной загрузки с исправленным оптимизмом. Я считаю это развенчанным.

связанные с

R-bloggers.com

предложения ежедневные обновления по электронной почте около р новости и учебные пособия на такие темы, как: Наука о данных , Большие данные, R рабочих мест визуализация ( ggplot2 , присущи рефлективный, вербальный , карты , анимация ), программирование ( RStudio , Sweave , Латекс , SQL , Затмение , мерзавец , Hadoop , Web Scraping ) статистика ( регрессия , PCA , Временные ряды , торговый ) и многое другое ... Если вы зашли так далеко, почему бы не подписаться на обновления с сайта? Выберите свой вкус: Эл. почта , щебет , RSS , или же facebook ...

Похожие

Какой рождественский подарок? Камера для подростков
Конец ноября не за горами, поэтому пришло время осмотреть рождественские подарки . Может ли один из них быть камерой? Конечно, если вы просто выберете подходящую модель. И вот мы появляемся. Чтобы помочь вам, мы решили осмотреть польский рынок FOTO и выбрать наиболее разумные на наш взгляд предложения для звездного подарка. Обновление от 20 ноября 2011 г. Примечание. Рынок и доступные модели, рекомендуемые techManiaK.pl,
Почему фильтрация воздуха является преимуществом в вентиляции с рекуператором?
... пример, в офисных зданиях или учебных заведениях), в значительной степени зависят от качества воздуха, которым они дышат. Каждый из нас хотел бы иметь возможность наслаждаться свежим воздухом и не беспокоиться о смоге, который влияет на наше здоровье и благополучие. К счастью, доступные в настоящее время технологии позволяют использовать решения, которые обеспечивают пользователей помещения чистым воздухом, свободным от аллергенов и других загрязнителей. Решением, которое, помимо
Как связать Баф шаль
Популярность многофункциональных платков Buff увеличивается с каждым годом. Хотя бренд из Испании на рынке существует на рынке с 1992 года, он приобрел огромную популярность среди любителей спорта на открытом воздухе и многое другое. Поскольку человек «пустой» и всегда стремится обеспечить себе идеальный комфорт, это позволило запустить новый, чрезвычайно популярный и полезный гаджет. Несколько слов о бренде
Мы создаем мини-компьютер для потоковых игр из Steam - веб-руководство Spider
... ��тва игры, известной из приставок? Вы не покупаете консоль, потому что у вас есть богатая библиотека игр в Steam? Если так, то это руководство только для вас. Мы построим второй миниатюрный компьютер, на который будут транслироваться игры с более мощной машины, например, из другой комнаты. Но как это происходит, что происходит? В последние месяцы произошли два события, которые, казалось бы, не имели ничего общего друг
Как найти хорошие кроссовки по доступной цене? Обувь для фитнеса 360
Одна из основных ошибок, которую я замечаю почти у всех людей, занимающихся спортом - будь то дома или в клубе, часто также неважных, начинающих или уже сидящих в буях, - это полное игнорирование предмета обуви. Нам кажется, что иметь хорошую спортивную обувь не так важно (в конце концов, на уроках физкультуры вы можете практиковаться пополам), и вы можете практиковаться во всем или босиком. Это страшный миф, который рано или поздно приводит к одному - травме и травме, которые часто исключают
Беговые часы, часы с GPS для бегунов
Новое в Календжи от Decathlon. Монитор сердечного ритма с измерением пульса на запястье ONrythm 900 позволяет определять в любой зоне частоту сердечных сокращений, обнаруженную при определенных усилиях. Это позволяет лучше настроить уровень интенсивности тренировок с учетом
Вкусная дыня - с удивительной пользой для здоровья
... приходится всего 34 калории) и жиров. Тем не менее, плод богат разнообразными полезными веществами - полифенольными растительными производными, витаминами и минералами, которые абсолютно необходимы для оптимального здоровья. Плод является отличным источником витамина А (100 г обеспечивает 3382 МЕ или около 112% рекомендуемой суточной дозы) и является одним из самых высоких уровней в семействе Кукурбиты. Витамин А является мощным антиоксидантом и необходим для
Sony Xperia Z5: лучший смартфон или потраченные впустую деньги? (Обзор)
20000 за телефон, который выглядит "пластиковым"? Они без ума от Sony, или новый флагман Sony Xperia Z5 должен показать мир и стать лучшим в мире смартфоном с его первоклассным оборудованием? Мы ответим на эти вопросы в нашем обзоре, который мы сегодня приняли немного необычно. Давайте оставим скучные отрывки, которые являются общими для всех телефонов - давайте сосредоточимся только на важных качествах и реалиях. указательный столб Дизайн и конструкция - меняемся в лучшую

Комментарии

Но как это происходит, что происходит?
Но как это происходит, что происходит? В последние месяцы произошли два события, которые, казалось бы, не имели ничего общего друг с другом, но были связаны друг с другом, полностью изменив игровой рынок. Первым из них является появление чрезвычайно дешевой платформы AM1, которая позволяет создавать мини-ПК стоимостью всего несколько сотен злотых. Второе - позволить Steam транслировать игры с более сильной машины на более слабую. Дело в том, что игра работает на более мощном компьютере
Почему?
Почему? Поскольку ранее описанная технология электронной бумаги, в отличие от ЖК-экранов, не генерирует никакого света, что делает читателей близкими к традиционным книгам и в том, что им нужен дополнительный источник света. Какая электронная книга с подсветкой? Мы должны искать в первую очередь модели с диодами, расположенными таким образом, чтобы они освещали текст сверху (так называемое переднее освещение). Конечно, интенсивность, цвет и качество подсветки у каждого ридера разные,
Если вы уже плакат продать с вашей графикой, почему бы не тогда чашки ?
Почему регулярная замена фильтра так важна? Имейте в виду, что использование воздушных фильтров в рекуператоре недостаточно, чтобы гарантировать своим пользователям свежий, здоровый воздух 365 дней в году. Владельцы вентиляционных установок у себя дома или в офисе должны помнить о регулярном обслуживании устройства и замене фильтрующих картриджей. Частота замены фильтрующих картриджей зависит от условий, в которых работает устройство. Чем больше загрязняется воздух возле здания, тем
Почему вы должны практиковаться в обуви?
Почему вы должны практиковаться в обуви? В конце концов, может быть, один из вас практиковал много раз босиком или в халовке, и с ним ничего не случилось. Я отвечу на этот вопрос: по-видимому, ему повезло. 🙂 Подходящая обувь обеспечивает амортизацию, защищает наши суставы (и особенно лодыжку) и сухожилия, защищает позвоночник, но также предотвращает такие травмы, как проблемы с периостерами (поверьте мне на слово, очень больно - я прошла это) ). Это очень важно, потому что некоторых
СМОТРЕТЬ С GPS - почему мотивирует вас бежать?
СМОТРЕТЬ С GPS - почему мотивирует вас бежать? Спортивные часы, оснащенные передатчиком GPS, - это, самое простое, часы GPS. Это более совершенное электронное устройство по сравнению с пульсометром, поскольку оно может измерять пройденное расстояние, текущую скорость или высоту над уровнем моря. GPS-часы подключаются к сети спутников, вращающихся вокруг Земли, что позволяет определять местоположение. Точность спортивных часов с GPS зависит не только от качества самого устройства, но
Почему регулярная замена фильтра так важна?
Почему регулярная замена фильтра так важна? Имейте в виду, что использование воздушных фильтров в рекуператоре недостаточно, чтобы гарантировать своим пользователям свежий, здоровый воздух 365 дней в году. Владельцы вентиляционных установок у себя дома или в офисе должны помнить о регулярном обслуживании устройства и замене фильтрующих картриджей. Частота замены фильтрующих картриджей зависит от условий, в которых работает устройство. Чем больше загрязняется воздух возле здания, тем
Почему стоит покупать?
Почему стоит покупать? Olympus TG-810 - это настоящий титан. Он устойчив к давлению до 100 кг, влагонепроницаем на глубине до 10 м, устойчив к падению с высоты до 2 м и морозоустойчив до -10 ° C. Компакт - это идеальное предложение для активных подростков, которые в полной мере используют жизнь. TG-810 оснащен многими современными технологиями : HD-съемка,
Почему Бафф такой классный?
Почему Бафф такой классный? Многофункциональные шарфы имеют широкий спектр применения во время занятий спортом и активного отдыха. Благодаря своим необычным свойствам, они также охотно используются в повседневной жизни людьми, которые ищут комфорт, комфорт и защиту от неблагоприятных погодных явлений. Благодаря использованию мягкого, эластичного и приятного на ощупь микрофибры, продукты испанского потенциата прекрасно впитывают пот, они не вызывают потертости нежной кожи шеи. Они защищают
Com: Вы представляете много новых персонажей, как студентов, так и преподавателей - кто из ваших любимых и почему?
com: Вы представляете много новых персонажей, как студентов, так и преподавателей - кто из ваших любимых и почему? Jarrett J. Krosoczka: Мне действительно нравится P-10, утилитарный дроид, который обеспечивает бесперебойную работу объектов. В колледже у нас был этот хранитель, который знал дело каждого. Мы убирали наши подносы в кафетерии, и он догонял нас по поводу последних сплетен. Хранитель видит и знает все, и P-10 выполняет эту функцию в этой истории.
Если вы все еще не уверены в своем размере и идеальном крое, почему бы не попробовать наш Tailor Me оказание услуг?
Почему телефоны Sony не так хороши, как конкуренты?
Почему телефоны Sony не так хороши, как конкуренты? Выражение будет развлекать вас Система - веселый леденец со скоростью молнии Нам нравится редактировать систему Android под руководством Sony - она ​​не агрессивная,

Зачем?
Что если ты не веришь в это?
Может ли один из них быть камерой?
?тва игры, известной из приставок?
Вы не покупаете консоль, потому что у вас есть богатая библиотека игр в Steam?
Но как это происходит, что происходит?
Они без ума от Sony, или новый флагман Sony Xperia Z5 должен показать мир и стать лучшим в мире смартфоном с его первоклассным оборудованием?
Но как это происходит, что происходит?
Почему?
Какая электронная книга с подсветкой?