Вмененка ип: Единый налог на вмененный доход (ЕНВД) в 2020 году

Содержание

Эксперты: предприниматели в РФ после отмены ЕНВД будут переходить на «упрощенку» и патент — Экономика и бизнес

МОСКВА, 10 августа. /ТАСС/. Российские предприниматели, которые применяют единый налог на вмененный доход (ЕНВД), после отмены этого режима в 2021 году будут переходить на упрощенную или патентную системы налогообложения. Такое мнение высказали опрошенные ТАСС представители бизнес-объединений и эксперты.

Решение об отмене ЕНВД с 1 января 2021 года много раз обсуждалось и является принятым, заявил в конце июля председатель правительства РФ Михаил Мишустин.

ЕНВД (или так называемая вмененка) является одной из самых простых и выгодных систем налогообложения для малого и среднего бизнеса. Налог не зависит от полученной выручки, он рассчитывается исходя из предполагаемого — вмененного дохода по ставке от 7% до 15% в зависимости от региона России. При этом те предприниматели, которые пользуются ЕНВД, освобождаются от уплаты налога на прибыль, НДС, кроме импортного, и налога на имущество, кроме рассчитываемого по кадастровой стоимости.

Данный режим в России применяют около 280 тыс. организаций и 1,8 млн индивидуальных предпринимателей.

Преимущества «упрощенки» и патента

Перейти можно на два режима: упрощенную систему налогообложения (УСН) и патент (не работает для юридических лиц), а можно уйти в самозанятые, если позволяют параметры, сказал ТАСС советник уполномоченного при президенте России по защите прав предпринимателей Антон Свириденко.

«В последнее время параметры применения патентной системы сильно модифицировали, расширив торговую площадь и дав право зачитывать страховые взносы. И патент стал удобнее для применения. Ставки упрощенной системы налогообложения в этом году во многих регионах в качестве антикризисной меры снижены, поэтому есть много случаев, когда предприниматели хотят перейти на УСН уже сейчас. Однако не решен главный вопрос — общее снижение ставок в федеральном законе, хотя бы для отдельных видов деятельности», — отметил он.

Член генерального совета бизнес-объединения «Деловая Россия» Сергей Гебель также убежден, что бизнес выберет «упрощенку» или патент, что приведет к «увеличению налогового бремени, но не к радикальному, а с минимально возможными потерями». «Недавние изменения налогового законодательства коснулись этих спецрежимов, что, очевидно, делает их более гибкими и адаптированными к бизнесу», — сказал он.

Гебель не исключил, что с учетом последствий пандемии коронавируса многие предприниматели с небольшими оборотами перейдут на режим для самозанятых — налог на профессиональный доход. «Налог для самозанятых получает распространение, пользуется популярностью среди «мелкого» бизнеса. Все это, полагаю, вполне достойные альтернативы. Но нужно помнить, что указанные спецрежимы могут применяться не ко всем видам деятельности и при соответствии определенным условиям. Следовательно, некоторые предприниматели будут вынуждены перейти на применение общей системы, что существенно увеличит налоговую нагрузку», — уточнил собеседник агентства.

Процесс перехода на новый режим

С точки зрения перехода к применению другой системы налогообложения особых сложностей не должно возникнуть, уверены представители бизнес-объединений.

«Так, для перехода на «упрощенку» достаточно уведомить об этом налоговый орган по месту учета, но сделать это нужно до 31 декабря 2020 года, то есть, можно и сейчас. Главное — соответствовать критериям для применения этого спецрежима. Для перехода к применению патентной системы необходимо не позднее чем за 10 дней до начала ее применения направить почтой с описью вложения или по телекоммуникационным каналам связи в налоговый орган заявление на получение патента. Для применения режима для самозанятых необходимо встать на учет плательщика этого налога с использованием приложения «Мой налог», — рассказал Гебель.

Однако есть и исключения. Если субъект бизнеса в этом году перестал быть плательщиком налога на вмененный доход, то перейти на «упрощенку» можно с начала того месяца, когда была прекращена обязанность по уплате ЕНВД. «В этом случае надо подать заявление о выборе системы налогообложения не позднее 30 дней со дня прекращения обязанности по ЕНВД», — сказал ТАСС доцент Российского экономического университета им.

Плеханова, член «Партии роста» Вадим Ковригин.

«Я бы посоветовал бизнесу взвесить все «за» и «против». Если переход пока не является выгодным — дождаться официальной отмены ЕНВД и до 31 декабря подать заявление о выборе системы налогообложения. Если УСН окажется меньше, то можно подумать о переходе сейчас, но понимая бухгалтерские и административные риски», — советует эксперт.

Глава «Опоры России» Александр Калинин отметил, что правительство и депутатский корпус сделали достаточно для «бесшовного» перехода с ЕНВД на другие режимы. В частности, расширили для индивидуальных предпринимателей возможность применения патентной системы, распространили возможность вводить режим самозанятых на все регионы.

«Необходима большая разъяснительная работа со стороны Минфина и ФНС, которая должна основываться на конкретных примерах и расчетах для различных отраслей, направлений и сфер деятельности, доказывающая представителям бизнес-сообщества, что переход с ЕНВД на другие системы налогообложения действительно является «бесшовным», что он не бьет по карману и не создает проблемы по подготовке дополнительной отчетности», — сказал ТАСС президент Торгово-промышленной палаты России Сергей Катырин.

Риски для бизнеса

Главное достоинство ЕНВД состоит не в том, что эта система позволяла платить меньше, ведь в некоторых случаях размер уплачиваемого налога был даже больше, чем при использовании традиционной системы налогообложения, а в возможности малого бизнеса заметно экономить на бухгалтерских и административных операциях. Так, при «вмененке» субъекты малого бизнеса были освобождены почти от всех отчетностей, напомнил Ковригин.

«В целом, можно предположить, что отмена ЕНВД, безусловно, негативно скажется на стартапах, микробизнесе — ведь бухгалтерские и административные издержки для них могут оказаться неподъемными», — считает он.

Сергей Гебель, напротив, не видит существенных рисков в отмене ЕНВД, кроме потенциального увеличения налоговой нагрузки. И то за исключением более выгодного налога для самозанятых. «Вместе с тем, на мой взгляд, применение в одной отрасли одинаковой системы налогообложения может обеспечить баланс и конкурентную предпринимательскую среду.

Сейчас, например, одни в отрасли применяют ЕНВД, другие, в силу ограничений — общую систему. Налоговая нагрузка при относительно одинаковой норме прибыли разная, то есть одни имеют преимущество перед другими. Полагаю, применение одинакового режима позволит предпринимателям на конкурентных условиях осуществлять деятельность и совместно на равных условиях развивать отрасль экономики», — полагает он.

Что такое вмененка и как по ней работать 🚩 вмененка ип 🚩 Налоги

Вам понадобится

  • — заявление о постановке на учет ЕНВД-1 или ЕНВД-2;
  • — декларация по ЕНВД;
  • — учет физических показателей по ЕНВД.

Инструкция

Ранее применение ЕНВД носило обязательный характер. Предприниматель, который попадал под применение данного налогового режима, обязан был в течение пяти дней после начала деятельности встать на учет. Иначе ему грозил штраф. Теперь у предпринимателей есть свобода выбора — применять УСН (ОСНО) или ЕНВД.

Для того, чтобы начать применять ЕНВД, необходимо написать заявление, в котором уведомить налоговую об этом. Заявление подается по строго установленной форме, для ИП — это ЕНВД-2, для организаций — ЕНВД-1. Передавать его нужно в налоговую по месту регистрации ИП и ООО или по месту ведения деятельности. Датой начала использования ЕНВД будет дата, указанная в заявлении налогоплательщика. Главное, чтобы налогоплательщик успел встать на учет по ЕНВД в течение 5 дней после начала такой деятельности. Перейти на вмененку по закону не могут налогоплательщики с численностью свыше 100 человек, а также компании с долей участия в них других организаций не менее 25%.

Налоговая ставка по ЕНВД установлена в размере 15%. При этом налогооблагаемая база зависит не от реального дохода, а от физических показателей: количества работников, посадочных мест, транспортных средств, площади помещения и пр. При расчете налога учитывается фактическое количество дней, в которых компания (ИП) вела свою деятельность. Налоги ЕНВД уплачиваются по итогам каждого квартала до 25 числа месяца, следующего за кварталом.

Для расчета налога ЕНВД за месяц базовую доходность (она зафиксирована законодательно для каждого вида деятельности) необходимо умножить на величину физического показателя и на коэффициенты К1 (в 2014 г. он составляет 1,672) и К2 (в каждом регионе он свой). Затем нужно полученное число разделить на количество календарных дней месяца и умножить на количество дней, когда компания вела вмененную деятельность.

Плательщики ЕНВД освобождены от уплаты НДС, налога на прибыль или НДФЛ, имущественного налога. Стоит учесть, что на ЕНВД невозможно учесть понесенные расходы.

Вмененные налоги можно уменьшить на уплаченные страховые взносы в фонды за ИП и работников. При этом ИП с работниками и ООО могут уменьшить налог с ограничениями до 50%. Для ИП без работников ограничений не предусмотрено, они уменьшают налог до 100%.

Бухгалтерская и налоговая отчетности при ЕНВД сведены к минимуму. Предпринимателям достаточно по итогам квартала сдавать декларацию по ЕНВД (до 20 числа месяца, следующего за концом квартала). Вести учет доходов и расходов им не нужно, только в случае совмещения нескольких налоговых режимов.

Особый контроль налоговая устанавливает за учетом физических показателей на ЕНВД. Если в таком качестве выступает количество работников, то необходимо вести все кадровые документы и учет рабочего времени. Для розничной торговли физическим показателем является торговая площадь, поэтому у компании должен быть на руках договор аренды с указанием площади магазина.

ИП и ООО на ЕНВД, которые занимаются розничной торговлей, могут работать без кассового аппарата. Это связано с тем, что их налоги не зависят от объема полученных доходов. При этом они в любом случае обязаны выдавать покупателям бланки строгой отчетности (при оказании услуг) или товарные чеки (при продаже товаров).

При завершении или приостановке деятельности по ЕНВД предпринимателю необходимо сняться с учета. Если ООО или ИП это не сделают, они должны будут платить все предусмотренные ЕНВД налоги. Даже если фактически они не получили в квартале доходов, либо понесли убытки.

ЕНВД в 2020-2021 году для ИП. Изменения и отмена — Финансы на vc.ru

Какие изменения ЕНВД ожидают ИП и организации в 2020 году? На какую систему налогообложения перейти в 2021 году? Что известно об отмене ЕНВД для розничной торговли? Вот главные вопросы о вмененке, которыми задаются те, кто применяет спецрежим. Ответы на эти вопросы — в статье.

Кто не сможет применять ЕНВД в 2020 году?

Правительство отменяет единый налог на вмененный доход с 2020 года для компаний, которые реализуют лекарства, обувь и одежду из меха, так как эти товары сопровождаются обязательной маркировкой, согласно п.

58 ст. 2, п. 3 ст. 3 Закона от 29.09.2019 № 325-ФЗ.
Даже если такая продажа будет проведена, организация признается утратившей право на ЕНВД и переводится на ОСНО. Перевод выполняется с начала того периода в котором такой товар реализован, согласно п. 2.3 ст. 346.26 и абз. 12 ст. 346.27 НК.

Кому разрешат работать на ЕНВД с учетом изменений?

ИП или организация может добровольно перейти на ЕНВД в соответствии с п. 2 ст. 346.28 НК, но с некоторыми ограничениями.
Перейти на режим можно, если ЕНВД действует на территории муниципального образования, в котором работает организация.
Деятельность ИП или организации должна соответствовать перечню видов деятельности (приведен в п. 2 ст. 346.26 НК), которые можно перевести на ЕНВД. К такой деятельности относятся:

  • бытовые услуги;
  • ветеринарные услуги;
  • услуги по ремонту, техническому обслуживанию и мойке автомототранспо

Вмененка для ИП

Вмененка для ИП – одна из наиболее приемлемых систем налогообложения в России. Освобождение от многих налогов минимизирует затраты предпринимателя. Также есть возможность прогнозировать уровень своих расходов. Возможно, к этому почти все привыкли, но вмененка стала добровольное не так давно, и её возможности многим не были доступны. Но, как и другие спецрежимы, вмененка для ИП имеет свои плюсы и минусы.

Вмененка для ИП – положительные и отрицательные моменты

В плане затрат для ИП – это очень предсказуемый налог. Расчет не зависит ни от уровня доходов, ни от уровня расходов, а при неизменном физическом показателе из квартала в квартал налог к уплате одинаков. Переменной частью является сумма, на которую его можно уменьшить. Еще одним существенным плюсом можно считать освобождение от уплаты таких налогов, как прибыль и НДС. Ранее в этот перечень еще входил и налог на имущество. Но с 1 июля 2014 года он подлежит уплате в отношении объектов недвижимого имущества. Т.е. в остальном, все осталось по-прежнему: с основных средств, не попадающих под вышеуказанную категорию платить налог не нужно. Также преимуществом ЕНВД можно считать возможность вести предпринимательскую деятельность без использования ККМ.

Что касается минусов, то, пожалуй, основным из них является все та же стабильность при расчете. Другими словами, если предприниматель не ведет деятельность и не получает доход, или он очень небольшой, в любом случае придется заплатить налог. Еще один недостаток спецрежима, особенно если сравнивать его с УСН, – обязанность сдавать ежеквартальную отчетность по ЕНВД. Много головной боли приносит постоянный контроль за условиями соблюдения законодательства, нарушив которые можно «слететь» с ЕНВД. Также проблемы могут возникнуть, если в качестве клиентов выступают юридические лица. В этом случае деятельность может квалифицироватьсяся как вмененка. Для ИП сложность состоит в том, чтобы доказать, что приобретаемые товары другой фирмой предназначены для собственного потребления, а не для перепродажи (можно заручиться постановления ФАС Восточно-Сибирского округа от 11.09.2008 № А33-2085/08-Ф02-4473/08).

Вмененка для ИП: как рассчитать и уменьшить налог

ЕНВД рассчитывается на основании базовой доходности и физического показателя. Эти значения можно найти в ст. 346.29 НК РФ. Сумма физических показателей за отработанные в квартале месяцы умноженная на базовую доходность и коэффициенты К1 и К2 дает нам налогооблагаемую базу. Ее можно уменьшить на уплаченные страховые взносы. Вмененка для ИП будет рассчитываться, как:

Н = НБ х 15% – СВ

НБ = БД х ФП(м1+м2+м3) х К1 х К2

НБнм = (ФП/ КД х ОД)х БД х К1 х К2

Где Н – налог ЕНВД к уплате

НБ – налогооблагаемая база

СВ – страховые взносы

БД – базовая доходность

ФП – физический показатель

М1 (м2, м3) – значение физического показателя в каждом месяце квартала, за который осуществляется расчет

К1 – коэффициент, равный в 2014 году 1,672

К2 – коэффициент, устанавливаемый властями субъектов РФ (уточнить в налоговой)

НБнм – налоговая база за неполный месяц предпринимательской деятельности (при постановке/снятии с учета)

КД – количество календарных дней

ОД – фактически отработанные дня в неполном месяце

Предприниматель без работников может вычесть из налога всю сумму фактически уплаченных в течение квартала за себя взносов. Оставшаяся сумма и будет перечислена в бюджет. Если ИП перечислил взносов больше, чем получился налог к уплате, вмененку в этом квартале он платить не будет, но разницу на следующий период «перекинуть» не получится. Предприниматели, которые являются работодателями, уменьшают налог до 50% на сумму взносов, уплаченных только за работников. При том, что коммерсант обязан платить взносы и за себя, в данном случае они не могут быть включены в сумму уменьшающих налог к уплате.

Страшные цифры и формулы? Едва ли. Но считать с помощью калькулятора практически невозможно. Не в том смысле, что не получится, а в том, что придётся немыслимо долго сидеть за расчетами. Можно искать половинчатые решения – одна программа служит для учета, другая для чего-то ещё, третья для отчетности и т.д. Набор программ может быть как сравнительно небольшой, так и весьма внушительный. Идеальным инструментом для ИП на ЕНВД была бы программа, которая бы умела делать всё. Конечно, нужно пробовать, примерять, чтобы программа подошла по всем параметрам, чтобы понравилась и, как говорится, стоила своих денег. Можно совершенно уверенно порекомендовать знакомство с веб-сервисом Контур Эльба, практически это эталон для предпринимателей в России – почти 1 млн пользователей за первые 10 лет (сервис запущен в январе 2010 года), в сервисе можно вести торговлю, склад, платить зарплату сотрудникам, общаться (!) с контролирующими органами, формировать и отправлять онлайн отчетность, и многое другое. После отмены ЕНВД в 2021 году, или при невозможности использования ЕНВД раньше, в Эльбе можно продолжать работать, переведя все данные на учет для УСН. Большим плюсом является длительный период для знакомства с сервисом – месяц после регистрации, а для впервые зарегистрированных ИП и того больше. Регистрация в Контур Эльбе:

 

Попробовать Эльбу 30 дней бесплатно

 

Что такое единый налог на вмененный доход для ИП

Система ЕНВД (единый налог на вмененный доход) применяется ИП малого или среднего уровня бизнеса. Перейти на режим можно добровольно при регистрации или в любом периоде ведения деятельности. Выбрать систему при регистрации не всегда оправдано. Платить единый налог необходимо со дня постановки на учет лица как плательщика ЕНВД.

Успешность применения специальной системы основана на особенностях условий, при реализации которых предприниматели:

  • Должны уплачивать только фиксированную сумму, не зависящую от величины полученного дохода.
  • Имеют возможность снизить налог на обязательные платежи во внебюджетные фонды.
  • Могут не использовать ККМ при расчетах с населением при получении дохода.
  • Имеют возможность иметь в штате минимальное число счетных работников благодаря отсутствию значительных требований к учету.

Фиксированные суммы, которые необходимо платить при вмененке, позволяют планировать расходы. При определении затрат учитываются ежегодные индексации коэффициентов-дефляторов, влияющие на величину налога. Какие суммы обязательств необходимо платить в новом календарном году требуется узнавать в ИФНС.

Применение ЕНВД оправдано для розничной торговли и аналогичных видов деятельности при условиях:

  • Наличия больших оборотов дохода.
  • Отсутствия значительной прибыли, позволяющей иметь большой штат работников для ведения учета.
  • Отсутствия возможности ведения подробного номенклатурного учета.

Предприниматели на вмененке должны вести учет только физического показателя, лежащего в основе вмененного дохода. Что такое физический показатель? Это величина численности работников, числа мест, транспортных единиц, метража и иных параметров, по размеру или количеству которых определяется сумма вмененного дохода. Предприниматель не может самостоятельно выбрать параметр. Определение показателя находится в ведении законодательства.

Как воспользоваться правом применить систему

В случае соответствия данных ИП требованиям лицо может перейти на режим путем подачи уведомления. Регистрация ИП как плательщика ЕНВД производится в течение 5 дней. По окончании срока предприниматель может получить уведомление о постановке на учет.

Встать на учет и применить систему можно сразу после подачи уведомления. Если первый расчетный квартал оказался неполным, платить налог необходимо пропорционально дням периода.

Ограничения применения системы

Режим имеет налоговые послабления, что определяет ограничительные требования к налогоплательщикам. Встать на учет по ЕНВД предприниматель имеет право при выполнении условия по ограничению числа сотрудников.

Штат наемных работников не должен превышать 100 человек. Для расчета принимается штат всех сотрудников ИП вне зависимости от числа совмещаемых режимов. Какие категории работников учитываются в среднесписочной численности, можно узнать из инструкций органов Статистики.

Кроме ограничения численности, регистрация в качестве плательщика ЕНВД не применяется для деятельности:

  • По организации общепита в лечебных и социальных учреждениях.
  • Ведения медицинских или образовательных заведений.
  • По передаче в аренду заправочных станций.

Для отсутствия нареканий со стороны ИФНС и возникновения возможных проблем при подаче отчетности надо выбрать, какие виды деятельности будут применяться у ИП. Ряд кодов используется только для вмененки, что необходимо учесть при регистрации.

Внимание! Применение режима доступно для ограниченных видов деятельности, установленных по регионах.

Востребованные виды деятельности для ведения ЕНВД

Распространенными видами, которые попадают под налогообложение, являются:

  • Розничная торговля с населением и предприятиями, приобретающими товары для личного пользования. Размер зала ограничен в пределах в 150 кв. м.
  • Оказание бытовых услуг физическим лицам.
  • Услуги транспортных перевозок при условии ограничения единиц техники в количестве 20 штук.
  • Иные виды, выбрать которые разрешено региональными законами.

Предприниматель на вмененке имеет возможность применять несколько видов вмененной деятельности, при использовании которых необходимо платить налог по каждому типу работ или услуг. В декларации разные виды доходности потребуется рассчитать отдельно. По каждому виду необходимо встать на учет и пройти регистрацию как плательщика ЕНВД.

Налоговые льготы режима

Предприниматель при ведении системы получает освобождение от налогообложения:

  • НДФЛ, уплачиваемого при реализации общеустановленного режима. За лицом сохраняется обязанность налогового агента по уплате НДФЛ с вознаграждений работников.
  • Налога, уплачиваемого на имущество, используемого в получении дохода. Если имущество относится к объектам недвижимости, в отношении которых установлен порядок обложения, налог уплачивается. Здания должны иметь установленную кадастровую стоимость и указаны в реестре облагаемых объектов.
  • НДС, начисленного потребителям товаров, работ, услуг. Исключение составляет налог, уплаченный при ввозе на территорию страны.

Льгота не применяется в отношении обязательств, которые ИП платит как физическое лицо – транспортного и налога на землю. Не освобождаются предприниматели от уплаты начислений на вознаграждение работников. В обязательном порядке ИП должен платить отчисления на собственное пенсионное и медицинское страхование.

Налогообложение при ЕНВД

Величина налога и состав разрешенных типов деятельности отличаются в каждом отдельном регионе.

ИП должен платить единый налог, сумма которого зависит от параметров:

  • Базовой доходности, установленной отдельно для каждого вида деятельности.
  • Физического показателя, величина которого определяет кратность вмененного дохода.
  • Корректирующих коэффициентов К1 и К2, одинаковых для разных форм деятельности.
  • Сумм, снижающих величину начисленного налога.

Отчетность представляется ежеквартально до 20 числа месяца, следующего за окончанием налогового периода (квартала). Отчетность подается со дня регистрации вмененщика. Уплата производится не позднее 25 числа месяца. Если даты приходятся на нерабочие дни, срок переносится на следующую рабочую дату.

Внимание! Срок подачи декларации позволяет ИП рассчитать уплаченные в фонды взносы и снизить налог на размер платежей.

Резервы для снижения налога

Законодательство предоставляет возможность снизить единый налог на отчисления в фонды:

  • При наличии работников – на суммы, начисленные с вознаграждения и уплаченные в фонды. Предельная сумма снижения имеет ограничение в размере 50% обязательства.
  • При отсутствии у ИП работников – на взносы, уплаченные в ПФР на собственное страхование. Величина обязательства по ЕНВД снижается на всю сумму отчислений.

Для снижения налога необходимо планировать платежи в фонды. Для равномерного уменьшения сумм в каждом квартале отчисления в фонды платят ежеквартальными частями. Предельный срок для платежа предпринимателя на собственное страхование наступает 31 декабря. Оптимальным вариантом служит разбивка платежей на квартальные взносы.

Внимание! Снизить обязательства можно только на суммы, уплаченные в конкретном налоговом периоде (квартале).

Возможность совмещения режимов

Одним из преимуществ ЕНВД служит возможность совмещения режима с другими формами. Что такое совмещение и насколько выгодно организовать учет?

Объединение позволяет:

  • Правильно использовать резервы ИП для оптимизации налогообложения.
  • Отсутствие необходимости в регистрации при потребности ведения форм деятельности, попадающей под разные режимы обложения дохода.
  • Упрощенно перейти на общий или упрощенный режим при отказе применения ЕНВД.

Для прекращения использования учета в налоговую инспекцию необходимо подать уведомление. На процедуру снятия с регистрации плательщика ЕНВД налоговым органам предоставлено 5 дней. Рассчитать окончательный налог необходимо пропорционально дням квартала. Определить, какие суммы необходимо уплатить, можно в ИФНС.

Утрата права на использование режима

Если ИП превысил допустимые нормы численности работников, теряется право на ЕНВД, что влечет автоматический переход на общий режим или УСН, если система принята ранее.

Потребуется произвести действия:

  • Представить отчетность по общей или упрощенной системе с обложением дохода.
  • Внести необходимые налоги. Платить допускается с учетом платежей единого налога при условии совпадения бюджетов. В ином случае переплаченные суммы нужно вернуть на счет.
  • Рассчитать и платить положенные пени.

Внимание! Для предотвращения превышения лимита численности работников необходим ежемесячный расчет.

определение вменения в The Free Dictionary

Но я не могу согласиться с вами в предположении, что я никогда больше не столкнусь с такими незаслуженными несчастьями, как те, которые я уже испытал, но, чтобы избежать обвинений в упорстве или дурном характере, я удовлетворю любопытство вашей дочери; и пусть сила духа, с которой я перенес многие невзгоды моей прошлой жизни, станет для нее полезным уроком для поддержки тех, кто может выпасть на ее долю в ее собственном. Даже из-за едва намекаемого обвинения в узурпации и возможных последствий такое подавленное впечатление набирало силу, Ахав, должно быть, очень хотел защитить себя.Из всех князей, новый принц не может избежать обвинения в жестокости из-за того, что новые государства полны опасностей. Я принимаю это вменение в полной мере, как комплимент к справедливому описанию моих женских персонажей; и хотя я вынужден приписывать этому подозрению большую часть суровости своих цензоров, я не предпринимаю никаких усилий, чтобы опровергнуть его, потому что, по моему собственному мнению, я убежден, что если книга хорошая, то она такова, как бы там ни было Таким образом, чтобы избежать всякого обвинения в установлении правила для потомков, основанного только на авторитете ipse dixit — к которому, по правде говоря, мы не испытываем глубочайшего почитания — мы будем здесь отказываемся от упомянутой выше привилегии и переходим к изложению читателю причин, которые побудили нас перемежать эти несколько отступающих эссе в ходе этой работы.Ллойд; Я напишу ему; если его ответ согласуется с вашим утверждением, вы должны быть публично освобождены от любых обвинений; для меня, Джейн, теперь с тобой все ясно «. Чтобы защитить мужа от любых обвинений в его проявлении недоброжелательности, она взяла двадцать пять из пятидесяти фунтов, которые Клэр дала ей, и передала их матери, как будто жена такого человека, как Анхель Клэр, вполне могла себе это позволить, говоря, что это была небольшая компенсация за проблемы и унижения, которые она навлекла на них в прошлом.Затем, когда у нас кончились боеприпасы и Клондайкер, еще несколько трезвый, снова начал лепетать о Милли, Крафт прошептал ему на ухо такое вежливое, резкое оскорбление в отношении людей, которые скупо распоряжались своими деньгами, что шахтер рухнул через несколько минут Пригоршня серебра и банкнот, призывающая все флюиды мира заглушить это обвинение. Она возмущается для всего мира, как некая высокая маленькая особа, на обвинение в ее правдивости и, так сказать, ее респектабельности. они могли, слуги никогда не смогли бы убедить его, что он был пьян; он всегда презирал обвинения.Он даже отказался принять эту идею в свой разум, пока он не проверил свое состояние с помощью собственного безошибочного критерия. в той стране (к несчастью для меня не было), которая, хотя она может быть более милой четвероногой, чем YAHOO, не может, как я смиренно понимаю, справедливости, претендовать на большую чистоту; и поэтому его честь, должно быть, принадлежала ему, если бы он видел их грязный способ кормления и их обычай валяться и спать в грязи.Так что, не имея другого ответа, я просто молчал, но чувствовал, что отдыхаю от обвинения в вине, и что мое молчание истолковывается как признание.

определение вменения по The Free Dictionary

Недоверие естественным образом порождает недоверие, и ничто не может изменить доброжелательность и доброе поведение быстрее, чем оскорбительная зависть и необоснованные вменения, выраженные или подразумеваемые. Справедливые вменения в нашу собственную веру в отношении одного и того же договора должны сначала быть удалено.Как бы я ни был раздражен их глупым весельем и досадными обвинениями, беспокойство длилось недолго: когда они рассмеялись, они снова вернулись к капитану и лейтенанту; и пока они спорили и комментировали их, мое негодование быстро остывало; причина этого была быстро забыта, и я обратил свои мысли в более приятное русло. «Я не могу согласиться с вами в предположении, что я никогда больше не столкнусь с такими незаслуженными несчастьями, как те, которые я уже испытал, но чтобы избежать обвинений. из-за упрямства или злобности я удовлетворю любопытство вашей дочери; и пусть сила духа, с которой я перенес многие невзгоды моей прошлой Жизни, станет для нее полезным уроком для поддержки тех, кто может выпасть на ее долю.Даже из-за едва намекаемого обвинения в узурпации и возможных последствий такого подавленного впечатления, набирающего силу, Ахав, конечно, должен был больше всего беспокоиться о том, чтобы защитить себя. И из всех князей для нового князя невозможно избежать вменения в жестокость из-за того, что новые состояния полны опасностей. Я принимаю вменение в хорошей части, как комплимент к справедливому обрисованию моих женских персонажей; и хотя я вынужден приписывать этому подозрению большую часть суровости своих цензоров, я не предпринимаю никаких усилий, чтобы опровергнуть его, потому что, по моему собственному мнению, я убежден, что если книга хорошая, то она такова, как бы там ни было пол автора может быть.Поэтому, чтобы избежать всякого обвинения в установлении правила для потомков, основанного только на авторитете ipse dixit — к которому, по правде говоря, мы не испытываем глубочайшего почитания, — мы откажемся от привилегии, о которой говорилось выше. , и продолжаем изложить читателю причины, побудившие нас перемежать эти несколько отступающих эссе в ходе этой работы. Ллойд; Я напишу ему; если его ответ согласуется с вашим утверждением, вы должны быть публично освобождены от любых обвинений; для меня, Джейн, теперь ты чист.»Еще больше, чтобы оградить своего мужа от любого обвинения в недоброжелательности по отношению к ней, она взяла двадцать пять из пятидесяти фунтов, которые Клэр дала ей, и передала сумму своей матери, как если бы жена такого человека, как Ангел Клэр, вполне могла позволить себе это, сказав, что это была небольшая компенсация за проблемы и унижение, которые она навлекла на них в прошлые годы. Затем, когда наши боеприпасы закончились и Клондайкер, все еще несколько трезвый, снова начал лепетать Милли, Крафт шепнул ему Выслушайте такое вежливое, резкое оскорбление в отношении людей, которые скупо распоряжались своими деньгами, что шахтер разбил горстку за пригоршней серебра и банкнот, призывая все жидкости мира заглушить вменение.Она возмущается, как некий высокий маленький персонаж, обвинением в ее правдивости и как бы ее респектабельности.

Определение и значение вменения — Библейский словарь

Переключить навигацию
  • Библия Переключить раскрывающийся список
    • Версии Библии
    • Стих дня
    • Стихи по теме
    • Планы чтения
    • Параллельная Библия
    • Книги Библии
    • Сравнить переводы
    • Аудио Библия
    • Подстрочная Библия
  • Исследование Toggle Dropdown
    • Библиотека
    • Комментарии
    • Согласований
    • Словари
    • Энциклопедии
    • Библейские рассказы
    • Апокриф Книги
    • Словари
  • Инструменты Переключить раскрывающийся список
    • Библейские живые статьи
    • Посвящения
    • Вдохновения
    • Видео
    • Аудиокниги
    • Библейские мелочи
    • Пасторы

6.4. Подстановка пропущенных значений — документация scikit-learn 0.23.2

По разным причинам многие наборы данных реального мира содержат пропущенные значения, часто закодированы как пробелы, NaN или другие заполнители. Однако такие наборы данных несовместим с оценками scikit-learn, которые предполагают, что все значения в array являются числовыми, и все они имеют и имеют значение. Базовая стратегия использовать неполные наборы данных — это отбрасывать целые строки и / или столбцы, содержащие отсутствующие значения. Однако это происходит за счет потери данных, которые могут быть ценный (хотя и неполный).Лучшая стратегия — вменять недостающие значения, т. е. чтобы вывести их из известной части данных. Увидеть Глоссарий общих терминов и элементов API для вменения.

6.4.1. Одномерный и многомерный расчет

Один из типов алгоритма вменения — одномерный, который вычисляет значения в i-й размер объекта, использующий только непропущенные значения в этом измерении объекта (например, impute.SimpleImputer ). Напротив, многомерное вменение алгоритмы используют весь набор доступных размеров элементов для оценки отсутствующие значения (например,грамм. вмененный. Итеративный импульс ).

6.4.2. Вменение одномерного признака

Класс SimpleImputer предоставляет базовые стратегии для вменения пропавших без вести ценности. Пропущенные значения могут быть вменены заданным постоянным значением или с помощью статистика (среднее, медианное или наиболее частое) каждого столбца, в котором находятся недостающие значения. Этот класс также допускает разные пропущенные значения кодировки.

Следующий фрагмент демонстрирует, как заменить отсутствующие значения, закодировано как np.nan , используя среднее значение столбцов (ось 0) которые содержат пропущенные значения:

 >>> импортировать numpy как np
>>> из sklearn.impute import SimpleImputer
>>> imp = SimpleImputer (missing_values ​​= np.nan, strategy = 'mean')
>>> imp.fit ([[1, 2], [np.nan, 3], [7, 6]])
SimpleImputer ()
>>> X = [[np.nan, 2], [6, np.nan], [7, 6]]
>>> print (imp.transform (X))
[[4. 2.]
 [6. 3.666 ...]
 [7. 6.]]
 

Класс SimpleImputer также поддерживает разреженные матрицы:

 >>> import scipy.редкий как зр
>>> X = sp.csc_matrix ([[1, 2], [0, -1], [8, 4]])
>>> imp = SimpleImputer (missing_values ​​= -1, стратегия = 'среднее')
>>> imp.fit (X)
SimpleImputer (missing_values ​​= -1)
>>> X_test = sp.csc_matrix ([[- 1, 2], [6, - 
Величина режима

(Как вычислить категориальные переменные с помощью R)

Режим вменения легко применить, но неправильное его использование может испортить качество ваших данных.

В следующей статье я покажу вам , как и когда использовать режим вменения.

Прежде чем мы начнем, короткое определение:

Определение:
Вменение режима (или подстановка режима) заменяет отсутствующие значения категориальной переменной на режим без пропущенных случаев этой переменной.

Impute with Mode in R (Пример программирования)

Ввести недостающие данные по режимам довольно просто. В этом примере я использую язык статистического программирования R (RStudio). Однако условное исчисление режима можно проводить практически во всех программных пакетах, таких как Python, SAS, Stata, SPSS и так далее…

Рассмотрим следующий пример переменной (т.е.е. вектор в R):

 set.seed (951) # Set seed
N <- 1000 # Количество наблюдений
vec <- round (runif (N, 0, 5)) # Создать вектор без пропусков
vec_miss <- vec # Реплицировать вектор
vec_miss [rbinom (N, 1, 0.1) == 1] <- NA # Вставить отсутствующие значения

table (vec_miss) # Количество каждой категории
# 0 1 2 3 4 5
# 86 183 207 170 174 90

сумма (есть.na (vec_miss)) # Подсчет значений NA
# 90 

set.seed (951) # Set seed N <- 1000 # Количество наблюдений vec <- round (runif (N, 0, 5)) # Создать вектор без пропусков vec_miss <- vec # Реплицировать вектор vec_miss [rbinom (N, 1, 0.1) == 1] <- NA # Вставить отсутствующие значения table (vec_miss) # Количество каждой категории # 0 1 2 3 4 5 # 86 183 207 170 174 90 сумма (есть.na (vec_miss)) # Подсчет значений NA # 90

Наш примерный вектор состоит из 1000 наблюдений, 90 из которых являются NA (т.е. пропущенными значениями).

Теперь давайте заменим эти пропущенные значения с помощью вменения режима. Во-первых, нам нужно определить режим нашего вектора данных:

 val <- unique (vec_miss [! Is.na (vec_miss)]) # Значения в vec_miss
mode <- val [which.max (tabulate (match (vec_miss, val)))] # Режим vec_miss 

val <- unique (vec_miss [! is.na (vec_miss)]) # Значения в vec_miss mode <- val [which.max (tabulate (match (vec_miss, val)))] # Режим vec_miss

Режим нашей переменной равен 2. В следующем коде все отсутствующие значения заменяются на 2 (т.е. режим):

 vec_imp <- vec_miss # Реплицировать vec_miss
vec_imp [is.na (vec_imp)] <- mode # Импультировать по режиму 

vec_imp <- vec_miss # Реплицировать vec_miss vec_imp [есть.na (vec_imp)] <- режим # Импьютировать по режиму

Вот и все. Вменение закончено.

Но вносят ли условно исчисленные значения смещение в наши данные? Я собираюсь проверить это следующим образом…

Мы облажались?

Не ухудшило ли условное исчисление качество наших данных? Следующий рисунок отвечает на этот вопрос:

 Отсутствие <- c (rep («Отсутствие пропущенных», 6), rep («Post Imputation», 6)) # Пре / пост вменения
Категория <- как.factor (rep (names (table (vec)), 2)) # Категории
Count <- c (as.numeric (table (vec)), as.numeric (table (vec_imp))) # Подсчет категорий

data_barplot <- data.frame (missingness, Category, Count) # Объединить данные для построения графика

ggplot (data_barplot, aes (Category, Count, fill = missingness)) + # Создать график
  geom_bar (stat = "identity", position = "dodge") +
  scale_fill_brewer (palette = "Set2") +
  theme (legend.title = element_blank ()) 

missingness <- c (rep («Отсутствие пропущенных», 6), rep («Post Imputation», 6)) # Pre / post imputation Категория <- как.factor (rep (names (table (vec)), 2)) # Категории Count <- c (as.numeric (table (vec)), as.numeric (table (vec_imp))) # Подсчет категорий data_barplot <- data.frame (missingness, Category, Count) # Объединить данные для построения графика ggplot (data_barplot, aes (Category, Count, fill = missingness)) + # Создать график geom_bar (stat = "identity", position = "dodge") + scale_fill_brewer (palette = "Set2") + тема (legend.title = element_blank ())

График 1: Полный пример вектора (до вставки отсутствующих) vs.Вмененный вектор

График 1 показывает проблему условного исчисления режима :

Зеленые полосы отражают, как вектор нашего примера был распределен до того, как мы вставили пропущенные значения. Идеальный метод вменения воспроизводит зеленые полосы.

Однако после применения вменения режима вмененный вектор (оранжевые полосы) сильно отличается. В то время как категория 2 сильно перепредставлена ​​, все другие категории недопредставлены.

Другими словами: распределение наших условно исчисленных данных сильно смещено !

Есть ли лучшие альтернативы?

Как вы видели, вменение мод обычно не является хорошей идеей. Этот метод следует использовать только в том случае, если у вас есть веские теоретические аргументы (аналогично вменению среднего в случае непрерывных переменных).

Можно сказать: Хорошо, понятно! Но что мне делать вместо этого ?!

Недавняя исследовательская литература рекомендует два метода вменения категориальных переменных:

  1. Вменение полиномиальной логистической регрессии
  2. Вменение полиномиальной логистической регрессии - это метод выбора для категориальных целевых переменных, когда это возможно с вычислительной точки зрения.Однако, если вы хотите присвоить переменной слишком много категорий , использование этого метода может оказаться невозможным (по вычислительным причинам). В этом случае может помочь расчетное вменение с сопоставлением прогнозного среднего:

  3. Прогнозирующее среднее сопоставление вменения
  4. Соответствие прогнозного среднего изначально было разработано для числовых переменных . Однако недавняя литература показала, что прогнозируемое сопоставление среднего также хорошо работает для категориальных переменных, особенно когда категории упорядочены (van Buure & Groothuis-Oudshoorn, 2011).Даже несмотря на то, что согласование с прогнозируемым средним должно быть с осторожностью использоваться для категориальных переменных, оно может быть хорошим решением для проблематичных в вычислительном отношении вменений.

Хотелось бы услышать ваше мнение!

Я показал вам, как работает условное исчисление, почему это обычно не лучший метод для условного расчета ваших данных и какие альтернативы вы могли бы использовать.

Я хотел бы услышать ваш опыт!

Вы сами уже вменяли через режим? Вы бы сделали это снова?

Оставьте мне комментарий ниже и поделитесь своими мыслями (вопросы приветствуются)!

Список литературы

an Buuren, S.и Groothuis-Oudshoorn, C.G. (2011). MICE: многомерный расчет с помощью цепных уравнений в R. Журнал статистического программного обеспечения , 45 (3).

Приложение

Как создать изображение заголовка? Ну вот:

 par (bg = "# 1b98e0") # Цвет фона
par (mar = c (0, 0, 0, 0)) # Убираем пространство вокруг графика

N <- 5000 # Размер выборки
x <- round (runif (N, 1, 100)) # Равномерное распределение

x <- c (x, rep (60, 35)) # Добавляем несколько значений, равных 60

hist_save <- hist (x, breaks = 100) # Сохранить гистограмму
col <- cut (h $ breaks, c (- Inf, 58, 59, Inf)) # Цвета гистограммы

plot (hist_save, # Построить гистограмму
     col = c ("# 353436",
             "красный",
             "# 353436") [col],
     ylim = c (0, 110),
     main = "",
     xaxs = "я",
     yaxs = "i") 

par (bg = "# 1b98e0") # Цвет фона par (mar = c (0, 0, 0, 0)) # Убираем пространство вокруг графика N <- 5000 # Размер выборки x <- round (runif (N, 1, 100)) # Равномерное распределение x <- c (x, rep (60, 35)) # Добавляем несколько значений, равных 60 hist_save <- hist (x, breaks = 100) # Сохранить гистограмму col <- cut (h $ breaks, c (- Inf, 58, 59, Inf)) # Цвета гистограммы plot (hist_save, # Построить гистограмму col = c ("# 353436", "красный", "# 353436") [col], ylim = c (0, 110), main = "", xaxs = "я", yaxs = "i")

/ * Добавьте свои собственные переопределения стиля формы MailChimp в таблицу стилей вашего сайта или в этот блок стилей.
Мы рекомендуем переместить этот блок и предыдущую ссылку CSS в HEAD вашего HTML-файла. * /
]]>

Множественное вменение в Stata: вменение

Это четвертая часть серии «Множественное вменение в Stata». Список тем, рассматриваемых в этой серии, см. Во введении.

В этом разделе подробно рассказывается о процессе вменения. Убедитесь, что вы прочитали хотя бы предыдущий раздел «Создание моделей вменения», чтобы иметь представление о том, какие проблемы могут повлиять на достоверность ваших результатов.

Пример данных

Чтобы проиллюстрировать процесс, мы будем использовать сфабрикованный набор данных. В отличие от приведенных в разделе примеров, этот набор данных призван иметь некоторое сходство с данными из реального мира.

Файл, создающий этот набор данных

Набор данных в виде файла данных Stata

Наблюдения : 3,000

Переменные :

  • розетка (двоичная)
  • гонка (категориальная, три значения)
  • городской (бинарный)
  • edu (упорядочено по категориям, четыре значения)
  • exp (непрерывный)
  • заработная плата (непрерывная)

Отсутствие : Каждое значение всех переменных, кроме женского, имеет 10% шанс быть полностью случайно пропущенным, но, конечно, в реальном мире мы не узнаем заранее, что это MCAR.Таким образом, мы проверим, является ли это MCAR или MAR (MNAR нельзя проверить, глядя на наблюдаемые данные), используя процедуру, описанную в разделе «Решение о вменении»:

unab numvars: *
unab missvars: городская заработная плата
misstable sum, gen (miss_)

foreach var локальных missvars {
local covars: list numvars - var
display _newline (3) "logit missing of` var 'on `covars'"
logit miss_`var '`covars'
для каждой nvar локальных коваров {
display _newline (3) "ttest of` nvar 'by missing of `var'"
ttest `nvar ', by (miss_`var')
}
}

См. Файл журнала для результатов.

Наша цель - уменьшить заработную плату в зависимости от пола, расы, уровня образования и опыта. Чтобы увидеть «правильные» ответы, откройте файл do, который создает набор данных, и проверьте команду gen, которая определяет заработную плату.

Полный код для процесса вменения можно найти в следующем файле:

Импутация до файла

Процесс условного исчисления дает много результатов. Мы выделим основные моменты на этой странице, однако полный файл журнала, включая соответствующие графики, можно найти здесь:

Файл журнала импутации с графиками

В каждом разделе этой статьи есть ссылки на соответствующий раздел журнала.Нажмите «назад» в вашем браузере, чтобы вернуться на эту страницу.

Настройка

Первым шагом в использовании команд mi является установка данных mi. Это несколько похоже на svyset, tsset или xtset. Команда mi set сообщает Stata, как он должен хранить дополнительные вменения, которые вы создадите. Мы предлагаем использовать широкий формат, так как он немного быстрее. С другой стороны, млонг использует чуть меньше памяти.

Чтобы Stata использовала широкую структуру данных, введите:

mi набор шириной

Чтобы Stata использовала структуру данных mlong (маргинальный длинный), введите:

mi set mlong

Широкий vs.длинная терминология заимствована из reshape, и структуры похожи. Однако они не эквивалентны, и вы никогда не будете использовать reshape для изменения структуры данных, используемой mi. Вместо этого введите mi convert wide или mi convert mlong (добавьте, очистите, если данные не были сохранены с момента последнего изменения).

В большинстве случаев вам не нужно беспокоиться о том, как хранятся вменения: команды mi автоматически определяют, как применить все, что вы делаете, к каждому вменению. Но если вам нужно манипулировать данными так, как mi не может сделать для вас, тогда вам нужно будет узнать детали структуры, которую вы используете.Вам также нужно быть очень и очень осторожным. Если вас интересуют такие вещи (включая редко используемые форматы flong и flongsep), запустите этот do-файл и прочтите комментарии, которые он содержит, изучая браузер данных, чтобы увидеть, как данные выглядят в каждой форме.

Регистрация переменных

Команды mi распознают три типа переменных:

Вмененные переменных - это переменные, которые mi должен вменять или которые были вменены.

Обычные переменные - это переменные, которым mi не следует вменять, либо по выбору, либо потому, что они не пропускают никаких значений.

Пассивные переменные - это переменные, которые полностью определяются другими переменными. Например, логарифмическая заработная плата определяется заработной платой, или показатель ожирения может определяться функцией веса и роста. Термины взаимодействия также являются пассивными переменными , хотя, если вы используете синтаксис взаимодействия Stata, вам не нужно объявлять их как таковые. Пассивные переменные часто вызывают проблемы - примеры преобразований, нелинейности и взаимодействий показывают, как их ненадлежащее использование может привести к смещенным оценкам.

Если пассивная переменная определяется обычными переменными , то ее можно рассматривать как обычную переменную , поскольку вменение не требуется. Пассивные переменные должны рассматриваться как таковые, только если они зависят от условно исчисленных переменных.

Регистрация переменной сообщает Stata, что это за переменная. Всегда должны регистрироваться вмененные переменных:

mi регистр вмененный список переменных

, где список переменных должен быть заменен фактическим списком переменных, которые должны быть вычислены.

Обычные переменные часто не нужно регистрировать, но это хорошая идея:

mi реестр штатный varlist

Необходимо зарегистрировать пассивные переменные:

mi регистр пассивный varlist

Однако пассивных переменных чаще создаются после вменения. Сделайте это с mi passive, и они будут автоматически зарегистрированы как passive .

В данных нашего примера необходимо условно исчислить все переменные, кроме женщин. Соответствующая команда регистра mi:

mi регистр вмененной расовой оплаты

(Обратите внимание, что вы не можете использовать * в качестве своего varlist , даже если вам нужно вменять все свои переменные, потому что это будет включать системные переменные, добавленные mi, установленными для отслеживания структуры вменения.)

Зарегистрировать женщину как обычную необязательно, но это хорошая идея:

ми регистр штатный женский

Проверка модели вменения

На основе типов переменных очевидными методами вменения являются:

  • гонка (категориальная, три значения): mlogit
  • городской (двоичный): logit
  • edu (упорядочено по категориям, четыре значения): ologit
  • exp (непрерывный): регресс
  • заработная плата (непрерывная): регресс

женщина не нуждается в вменении, но должна быть включена в модели вменения как потому, что она входит в модель анализа, так и потому, что она может быть актуальной.

Прежде чем приступить к вменению, мы проверим каждую из моделей вменения. Всегда запускайте каждую из ваших моделей вменения индивидуально, вне контекста mi вмененной цепочки, чтобы увидеть, сходятся ли они и (насколько это возможно) убедиться, что они указаны правильно.

Код для запуска каждой из этих моделей:

mlogit race i.urban exp заработок i.edu i. женский
logit urban i.race exp заработная плата i.edu i.женский
ologit edu i.urban i.race exp заработок i. женский
regress exp i.urban i.race заработок i.edu i. женский
регресс заработной платы i.urban i.race exp i.edu i. женский

Обратите внимание, что когда категориальные переменные (упорядоченные или нет) отображаются как ковариаты i. расширяет их до наборов индикаторных переменных.

Как мы увидим позже, выходные данные команды mi impute chained включают команды для отдельных моделей, которые она запускает.Таким образом, полезный ярлык, особенно если у вас есть много переменных для вменения, состоит в том, чтобы настроить вашу команду mi impute chained с опцией dryrun, чтобы предотвратить ее фактическое вменение, запустить ее, а затем скопировать команды из выходных данных в ваш файл do для тестирования.

Проблемы сходимости

Прежде всего следует отметить, что все эти модели работают успешно. Сложные модели, такие как mlogit, могут не сойтись, если у вас большое количество категориальных переменных, потому что это часто приводит к маленьким размерам ячеек.Чтобы определить причину проблемы, удалите большинство переменных, убедитесь, что модель работает с тем, что осталось, а затем добавляйте переменные обратно по одной или небольшими группами, пока она не перестанет работать. Поэкспериментировав, вы сможете определить проблемную переменную или комбинацию переменных. На этом этапе вам нужно будет решить, можете ли вы объединить категории, удалить переменные или внести другие изменения, чтобы создать работоспособную модель.

Прогноз префекта

Идеальное предсказание - еще одна проблема, на которую стоит обратить внимание.Процесс вменения не может просто отбросить идеально предсказанные наблюдения, как это может делать логит. Вы можете отбросить их перед вменением, но, похоже, это противоречит цели множественного вменения. Альтернативой является добавление опции дополнения (или просто увеличения) к затронутым методам. Это говорит mi impute chained использовать подход «расширенной регрессии», который добавляет ложные наблюдения с очень малым весом таким образом, что они оказывают незначительное влияние на результаты, но не позволяют совершать точные прогнозы. Подробнее см. В разделе «Проблема точного прогнозирования при вменении категориальных данных» в документации Stata MI.

Проверка на предмет неправильной спецификации

Также следует попытаться оценить, правильно ли указаны модели. Полное обсуждение того, как определить, правильно ли указана регрессионная модель, выходит далеко за рамки этой статьи, но используйте любые инструменты, которые сочтете подходящими. Вот несколько примеров:

Графики зависимости остаточной стоимости от приведенной стоимости

Для непрерывных переменных, остаток vs.графики подобранных значений (легко выполняемые с помощью rvfplot) могут быть полезны - некоторые примеры используют их для обнаружения проблем. Рассмотрим сюжет на опыт:

regress exp i.urban i.race заработная плата i.edu i. женский
rvfplot

Обратите внимание на то, как несколько точек сгруппированы вдоль линии в нижнем левом углу, и нет точек ниже нее:

Это отражает ограничение, заключающееся в том, что опыт не может быть меньше нуля, что означает, что подогнанные значения всегда должны быть больше или равны остаткам, или, в качестве альтернативы, остатки должны быть больше или равны отрицательному из подогнанных значений.(Если бы график имел одинаковый масштаб по обеим осям, линия ограничения была бы линией под углом 45 градусов.) Если бы все точки были ниже аналогичной линии, а не выше нее, это сообщило бы вам, что существует верхняя граница переменной а не нижнюю границу. Y-пересечение линии ограничения указывает предел в любом случае. Вы также можете иметь как нижнюю, так и верхнюю границы, поместив все точки в полосу между ними.

«Очевидная» модель, регресс, не подходит для опыта, потому что она не применяет это ограничение.По той же причине это неуместно и для заработной платы. Альтернативы включают truncreg, ll (0) и pmm (мы будем использовать pmm).

Добавление взаимодействий

В этом примере кажется правдоподобным, что отношения между переменными могут различаться между расой, полом и городскими / сельскими группами. Таким образом, один из способов проверить правильность спецификации - добавить в модели условия взаимодействия и посмотреть, окажутся ли они важными. Для примера сравним очевидную модель:

regress exp i.гоночная заработная плата i.edu i.urban i. женский

с тем, который включает взаимодействия:

regress exp (i.race i.urban i.female) ## (c.wage i.edu)

Мы проведем аналогичные сравнения для моделей других переменных. Это создает большой объем вывода, поэтому смотрите результаты в файле журнала. Взаимодействие между женщинами и другими переменными значимо в моделях опыта, заработной платы, образования и городского хозяйства. Существует несколько значимых взаимодействий между расой или городом и другими переменными, но не так много (и имейте в виду, что с таким количеством коэффициентов мы ожидаем ложных срабатываний, используя уровень значимости.05). Таким образом, мы будем вменять мужчин и женщин отдельно. Это особенно хороший вариант для этого набора данных, потому что самки никогда не пропадают. Если бы это было так, нам пришлось бы отбросить те наблюдения, в которых отсутствуют самки, потому что они не могли быть помещены в ту или иную группу.

В команде вменения это означает добавление опции by (женский). При тестировании моделей это означает запуск команд с префиксом by female: (и удаление female из списков ковариат). Таким образом, улучшенные модели вменения:

bysort female: reg exp i.городская i.race заработная плата i.edu
по женщинам: logit urban exp i.race заработная плата i.edu
от женщины: mlogit race exp i. заработная плата в городе i.edu
по женщинам: reg wage exp i.urban i.race i.edu
от женщины: ologit edu exp i.urban i.race заработная плата

Сам

pmm не может быть запущен вне контекста вменения, но, поскольку он основан на регрессии, вы можете использовать обычную регрессию для его тестирования.

Эти модели следует протестировать еще раз, но мы опустим этот процесс.

Расчет

Базовый синтаксис для mi impute chained:

mi вмененная цепочка (method1) varlist1 (method2) varlist2 ... = regvars

Каждый метод определяет метод, который будет использоваться для вменения следующего списка переменных. Возможные варианты метода: regress, pmm, truncreg, intreg, logit, ologit, mlogit, poisson и nbreg. regvars - это список обычных переменных, которые будут использоваться в качестве ковариат в моделях вменения, но не вменяться (их может и не быть).

Основные варианты:

, добавить (N) rseed (R) savetrace (файл трассировки, заменить)

N - количество вменений, добавляемых к набору данных. R - это начальное число, которое будет использоваться для генератора случайных чисел - если вы не установите его, вы будете получать несколько разные вменения при каждом запуске команды. Файл трассировки - это набор данных, в котором mi impute chained будет хранить информацию о процессе вменения. Мы будем использовать этот набор данных для проверки сходимости.

Параметры, относящиеся к конкретному методу, указываются вместе с методом в круглых скобках, но после запятой (например, (mlogit, aug)). Параметры, которые имеют отношение к процессу вменения в целом (например, по (женский)), идут в конце после запятой.

В нашем примере это команда:

mi вмененная цепочка (logit) городская (mlogit) гонка (ologit) edu (pmm) exp заработная плата, прибавить (5) rseed (4409) от (жен.)

Обратите внимание, что здесь нет опции savetrace ().На момент написания статьи by () и savetrace () не могут использоваться одновременно, предположительно потому, что для каждой группы на потребуется один файл трассировки. Stata знает об этой проблеме, и мы надеемся, что это скоро изменится. Для целей этой статьи мы удалим опцию by (), когда придет время проиллюстрировать использование файла трассировки. Если эта проблема возникнет в ходе вашего исследования, поговорите с нами о возможных решениях.

Выбор количества вменений

Между официальными органами существуют некоторые разногласия по поводу того, сколько вменений является достаточным.Некоторые говорят, что 3-10 почти во всех обстоятельствах, документация Stata предлагает не менее 20, в то время как Уайт, Ройстон и Вуд утверждают, что количество вменений должно быть примерно равно проценту случаев с пропущенными значениями. Однако мы не знаем ни одного аргумента о том, что увеличение числа вменений когда-либо вызывает проблемы (просто предельная выгода от другого вменения асимптотически приближается к нулю).

Увеличение количества вменений в вашем анализе практически не требует с вашей стороны работы.Просто измените число в опции add () на большее. С другой стороны, для компьютера может потребоваться много работы - множественное вменение ввело многих исследователей в мир работ, выполнение которых требует часов или дней. Как правило, вы можете предположить, что количество необходимого времени будет пропорционально количеству используемых вменений (например, если выполнение файла do занимает два часа с пятью вменениями, вероятно, потребуется около четырех часов для выполнения с десятью вменениями). Итак, вот наше предложение:

  1. Начните с пяти вменений (нижний предел того, что в целом считается законным).
  2. Работайте над своим исследовательским проектом до тех пор, пока вы не будете достаточно уверены, что у вас есть анализ в его окончательной форме. Обязательно проделайте все с do-файлами, чтобы вы могли запустить его снова по желанию.
  3. Отметьте, сколько времени занимает процесс от вменения до окончательного анализа.
  4. Подумайте, сколько времени у вас есть, и решите, сколько вменений вы можете позволить себе выполнить, используя практическое правило, согласно которому необходимое время пропорционально количеству вменений.Если возможно, сделайте количество вменений примерно равным проценту случаев с отсутствующими данными (верхняя оценка того, что требуется). Дайте время прийти в себя, если что-то пойдет не так, как обычно.
  5. Увеличьте количество вменений в вашем do-файле и запустите его.
  6. Сделайте что-нибудь еще во время выполнения файла do, например напишите статью. Добавление вменений не должно существенно изменить ваши результаты - и, если это маловероятно, считайте, что вам повезло, узнав об этом до публикации.

Ускорение процесса вменения

Множественное вменение познакомило многих исследователей с миром рабочих мест, выполнение которых требует часов, дней или даже недель. Обычно не стоит тратить время на ускорение работы кода Stata, но множественное вменение может быть исключением.

Используйте самый быстрый из доступных вам компьютеров. Для членов SSCC это означает научиться выполнять задания в Linstat, вычислительном кластере SSCC Linux.Linux не так сложен, как вы думаете - в Linstat есть инструкции.

Множественное вменение подразумевает больше операций чтения и записи на диск, чем большинство команд Stata. Иногда это включает запись временных файлов в текущий рабочий каталог. Используйте максимально доступное дисковое пространство как для набора данных, так и для рабочего каталога. В общем, пространство на локальном диске будет быстрее, чем пространство на сетевом диске, а на Linstat / ramdisk («каталог», который фактически хранится в ОЗУ) будет быстрее, чем на локальном диске.С другой стороны, вы не захотите постоянно хранить наборы данных где-либо, кроме сетевого дискового пространства. Поэтому подумайте о том, чтобы ваш файл do делал что-то вроде следующего:

Windows (Winstat или ваш собственный компьютер)

копировать x: \ mydata \ dataset c: \ windows \ temp \ dataset
компакт-диск c: \ windows \ temp
использовать набор данных
{делать что угодно, в том числе сохранять результаты в сети по мере необходимости}
стереть c: \ windows \ temp \ dataset

Linstat

копия / проект / mydata / набор данных / виртуальный диск / набор данных
CD / RAM-диск
использовать набор данных
{делать что угодно, в том числе сохранять результаты в сети по мере необходимости}
стереть / ramdisk / набор данных

Это применимо также, когда вы используете вмененные данные.Если ваш набор данных достаточно велик, чтобы работать с ним после вменения медленно, может помочь описанная выше процедура.

Проверка сходимости

MICE - это итеративный процесс. На каждой итерации mi impute chained сначала оценивает модель вменения, используя как наблюдаемые данные, так и вмененные данные из предыдущей итерации. Затем он извлекает новые условные значения из полученных распределений. Обратите внимание, что в результате каждая итерация имеет некоторую автокорреляцию с предыдущим вменением.

Первая итерация должна быть особым случаем: в ней mi impute chained сначала оценивает модель вменения для переменной с наименьшим количеством пропущенных значений, основываясь только на наблюдаемых данных, и рисует вмененные значения для этой переменной. Затем он оценивает модель для переменной со следующим наименьшим числом пропущенных значений, используя как наблюдаемые значения, так и вмененные значения первой переменной, и действует аналогичным образом для остальных переменных. Таким образом, первая итерация часто бывает нетипичной, а поскольку итерации коррелированы, это может сделать последующие итерации нетипичными.

Чтобы избежать этого, условно-условный расчет mi, связанный по умолчанию, проходит десять итераций для каждого запрашиваемого вами набора условно исчисленных данных, сохраняя только результаты десятой итерации. Первые девять итераций называются периодом приработки. Обычно этого достаточно для того, чтобы эффекты первой итерации стали несущественными и процесс пришел к стационарному состоянию. Однако вам следует проверить сходимость и при необходимости увеличить количество итераций, чтобы обеспечить ее с помощью опции burnin ().

Для этого проверьте файл трассировки, сохраненный функцией mi impute chained. Он содержит среднее значение и стандартное отклонение каждой вмененной переменной на каждой итерации. Они будут варьироваться случайным образом, но не должны показывать тенденции. Легче всего проверить это с помощью tsline, но сначала необходимо изменить форму данных.

В нашей предпочтительной модели вменения используется by (), поэтому она не может сохранить файл трассировки. Таким образом, на данный момент мы удалим с помощью (). Мы также увеличим параметр burnin () до 100, чтобы было легче увидеть, как выглядит стабильная трассировка.Затем мы воспользуемся reshape и tsline для проверки сходимости:

заповедник
mi вмененная цепочка (logit) городская (mlogit) гонка (ologit) edu (pmm) exp wage = female, add (5) rseed (88) savetrace (extrace, replace) burnin (100)
использовать extrace, заменить
изменить форму в ширину * среднее * sd, i (iter) j (m)
цсет итер
tsline exp_mean *, title («Среднее значение вмененного опыта») примечание («Каждая строка предназначена для одного вменения») легенда (выкл.)
экспорт графика conv1.png заменить
tsline exp_sd *, title («Стандартное отклонение вмененных значений опыта») примечание («Каждая строка предназначена для одного вменения») легенда (выкл.)
графический экспорт conv2.png, заменить
восстановить

На полученных графиках явных проблем не видно:

Если вы действительно видите признаки того, что процесс, возможно, не сходимся после десяти итераций по умолчанию, увеличьте количество выполняемых итераций перед сохранением вмененных значений с помощью опции burnin ().Если сходимость никогда не достигается, это указывает на проблему с моделью вменения.

Проверка вмененных значений

После импутации вы должны проверить, похожи ли импутированные данные на наблюдаемые. К сожалению, не существует формального теста, чтобы определить, что «достаточно близко». Конечно, если это данные MAR, но не MCAR, вмененные данные должны систематически отличаться от наблюдаемых данных. По иронии судьбы, чем меньше пропущенных значений вам придется вменять, тем больше будет различий между вмененными данными и наблюдаемыми данными (и между вменениями).

Сравните таблицы частот для двоичных и категориальных переменных. Для непрерывных переменных хорошей отправной точкой является сравнение средних значений и стандартных отклонений, но вы также должны смотреть на общую форму распределения. Для этого мы предлагаем графики плотности ядра или, возможно, гистограммы. Взгляните на каждое вменение по отдельности, а не объединяйте все вмененные значения, чтобы увидеть, не произошло ли какое-либо из них.

миль xeq:

Префикс mi xeq: указывает Stata применять последующую команду к каждому вменению индивидуально.Это также относится к исходным данным - «нулевому условию». Таким образом:

mi xeq: tab race

предоставит вам шесть частотных таблиц: одну для исходных данных и по одной для каждого из пяти условных значений.

Однако мы хотим сравнить наблюдаемые данные только с вмененными данными, а не со всем набором данных. Это требует добавления условия , если в команды вкладки для вменения, но не для наблюдаемых данных. Добавьте число или numlist , чтобы mi xeq действовал на определенные вменения:

mi xeq 0: tab race
mi xeq 1/5: гонка табуляции, если miss_race

Это создает таблицы частот для наблюдаемых значений расы, а затем вмененных значений для всех пяти вменений.

Если вам нужно изучить значительное количество переменных, вы можете легко их перебрать:

foreach var из списка varlist urban race edu {
mi xeq 0: tab `var '
mi xeq 1/5: tab` var' if miss_`var '
}

Результаты см. В файле журнала.

Запуск сводной статистики по непрерывным переменным выполняется так же, но создание графиков плотности ядра добавляет сложности: вам нужно либо сохранить графики, либо дать себе возможность посмотреть на них.mi xeq: может выполнять несколько команд для каждого вменения: просто поместите их все в одну строку с точкой с запятой (;) в конце каждой. (Это не сработает, если вы изменили общий разделитель конца команды на точку с запятой.) Команда сна указывает Stata сделать паузу на определенный период, измеряемый в миллисекундах.

mi xeq 0: kдельная заработная плата; спать 1000
mi xeq 1/5: kплотность заработной платы, если miss_`var '; спать 1000

Опять же, все это можно автоматизировать:

для каждой переменной varlist wage exp {
mi xeq 0: сумма `var '
mi xeq 1/5: сумма` var' if miss_`var '
mi xeq 0: kde density `var'; sleep 1000
mi xeq 1/5: kde density `var 'if miss_`var'; спать 1000
}

Сохранение графиков оказывается немного сложнее, потому что вам нужно дать графику из каждого вменения другое имя файла.К сожалению, вы не можете получить доступ к условному номеру в mi xeq. Однако вы можете выполнить цикл forvalues ​​по числам вменения, а затем заставить mi xeq воздействовать на каждое из них:

forval i = 1/5 {
mi xeq `i ': kde density exp if miss_exp; graph export exp`i'.png, заменить
}

Интеграция с предыдущей версией дает:

для каждой переменной varlist wage exp {
mi xeq 0: сумма `var '
mi xeq 1/5: сумма` var' if miss_`var '
mi xeq 0: kde density `var'; экспорт графика chk`var'0.png заменить
forval i = 1/5 {
mi xeq `i ': kde density` var' if miss_`var '; экспорт графика chk`var'`i'.png, заменить
}
}

Результаты см. В файле журнала.

Вызывает беспокойство то, что при всех вменениях среднее значение вмененных значений заработной платы выше, чем среднее из наблюдаемых значений заработной платы, а среднее значение вмененных значений exp ниже, чем среднее из наблюдаемых значений exp. Мы не нашли доказательств того, что данные относятся к MAR, но не к MCAR, поэтому мы ожидаем, что средние значения импутированных данных будут сгруппированы вокруг средних значений наблюдаемых данных.Не существует формального теста, чтобы окончательно сказать нам, проблема это или нет.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *