Гаусс б такого не схвалив

  1. Як порушення передумов змінюють оцінку порушень?
  2. Як отримати спроможні оцінки?

На минулих виборах російські політичні аналітики вивчили слово «Гаусс». Сподіваюся, що після цих виборів вони вивчать ще одне слово - «ендогенні». Весь аналіз фальсифікацій російських виборів побудований на припущенні, що ділянки, на яких відбувалися фальсифікації, принципово не відрізняються від ділянок, де фальсифікацій не було. Тому, якщо ми віднімемо «аномальні» голоси на дільницях з фальсифікаціями, то ми можемо оцінити і чесну явку, і чесні голоси по кожній партії. Однак якщо у нас є підстави вважати, що фальсифікації відбуваються на ділянках певного типу, які відрізняються від інших ділянок, то подібний метод оцінки вже веде до зміщеним оцінками, які не прагнуть до своїх істинним значенням навіть при великій кількості спостережень. Ця проблема в економетрики відома як ендогенні.

У першій частині цієї статті я обговорю, які передумови використовуваних оціночних моделей можуть порушуватися. У другій я покажу, що дані порушення можуть призвести до завищених оцінок фальсифікацій. У третій частині я розповім, які методи можна використовувати, щоб отримати коректні оцінки. Так як якість електоральної статистики в Росії за останні 10-15 років дуже сумнівно, я буду часто посилатися на досвід США. Цю країну я вибрав з кількох причин. По-перше, вона найбільше схоже на Росію - президентська республіка, федерація з 50 регіонів, великий розкид у доходах між штатами, 6 часових поясів. По-друге, я непогано знайомий з цією країною - прожив там кілька років і об'їздив уздовж і поперек (відвідав близько 40 штатів).
аналіз передумов
Передумова про однорідність переваг чесно сформульована Сергієм Шпількин в інтерв'ю Новой Газете: «Російське суспільство досить однорідне: воно знаходиться в однорідному інформаційному полі, створеному телевізором, і мало різниться по вихованню та освіті ... Виняток - умовний« московський освічений клас »- це досить вузький прошарок , яка в різній мірі представлена ​​в Москві, Санкт-Петербурзі і деяких інших містах ». ( http://www.novayagazeta.ru/politics/74630.html ). З неї випливає, що розподіл голосів по УІКам має бути схоже на нормальний розподіл (або розподіл Гауса). Наскільки це припущення обгрунтовано? Звернемося до досвіду США:
У першій частині цієї статті я обговорю, які передумови використовуваних оціночних моделей можуть порушуватися
червоні штати підтримують Трампа, сині - Клінтон, сірі - коливаються. Як видно, західне узбережжя і північ східного - за Клінтон, центральні штати в основній своїй масі за Трампа, причому різниця в підтримці досить значна. Наприклад, в Каліфорнії рейтинг Трампа зараз 32%, Клінтон - 51.3%, а в Арканзасі (звідки родом чоловік Клінтон, і де він був губернатором) - рейтинг Трампа 56%, а Клінтон - 31.5%. Чи можемо ми очікувати подібного розкиду переваг усередині Росії? Різниця по ВРП на душу населення між найбагатшим суб'єктом США округом Колумбія (по суті це Вашингтон з передмістями) і найбіднішим - штатом Міссісіпі - становить приблизно 5 раз. Якщо прибрати очевидний викид - округ Колумбія, то різниця Міссісіпі з найбагатшим штатом (Делавер) скоротиться до 3-х разів. У Росії різниця між найбагатшим суб'єктом, Ненецькому Автономним округом, і найбіднішим - містом Севастополь, становить майже 100 раз (дані за 2014 г.). Якщо ми навіть приберемо найбагатші (НАО, ЯНАО, ХМАО, Сахалінську область, Чукотський АТ, Москва) і найбідніші (Кабардино-Балкарія, Інгушетія, Чечня, Крим, Севастополь) регіони, то різниця між Якутією і Іванівській областю по ВРП на душу населення складе близько 5 разів. Разом, розкид доходів всередині Росії між суб'єктами істотно більше, ніж в США, тому ми можемо також очікувати істотних відмінностей в політичних уподобаннях. Я не хочу вступати в дискусію з приводу різниці цін, вона, безумовно, дещо згладжує відмінності. Однак в США також життя в багатих суб'єктах (Каліфорнія, Нью-Йорк, Вашингтон) істотно дорожче, ніж життя в Оклахомі, Арканзасі або Міссісіпі.
Чи можна передбачити, які суб'єкти будуть більше підтримувати Путіна і ЕР? Звернемося знову ж до досвіду США. Трампа багато хто порівнює з Путіним. Він публічно назвав Путіна своїм кумиром. Russia Today, особливо не соромлячись, топить за Трампа. Він дозволяє собі неполіткоректні жарти. Виборці Трампа - red necks (аналог «ватники» на місцевому жаргоні). Про його прихильників знімають смішні ролики, які показують їх інтелектуальний рівень (наприклад https://youtu.be/eFQhw3VVToQ?t=215 ). Багаті штати (Округ Колумбія, Нью-Йорк, Делавер, Массачусетс, Коннектітут, Нью-Джерсі, Орегон, Вашингтон, Каліфорнія) підтримують Клінтон. Бідні штати (Арканзас, Міссісіпі, Оклахома, Кентукі, Західна Вірджинія, Теннесі, Південна Кароліна, Айдахо) - Трампа. Є винятки з цього правила - Аляска, Техас, Нью-Мексико, і деякі інші штати, проте негативна кореляція між доходом і підтримкою Трампа яскраво виражена. Тому ми цілком можемо очікувати, що бідні суб'єкти будуть надавати набагато більшу підтримку Путіну (як російському аналогу Трампа), ніж багаті. Іншими словами, навіть без всяких фальсифікацій, підтримка ЕР на Північному Кавказі цілком може бути в два рази вище, ніж в Москві (рейтинг Трампа між Арканзас і Каліфорнією відрізняється в 1.8 раз).
Але, може, не дивлячись на значні відмінності серед штатів, всередині російських регіонів таких відмінностей немає? Наприклад, російський політолог Дмитро Орєшкін, вважає, що між виборцями Алтайського краю, Новосибірської, Томської, Кемеровської областей і Хакасії немає особливої ​​різниці ( http://echo.msk.ru/blog/oreshkin/1842936-echo/ ) На свій сором, по Росії я подорожував набагато менше, ніж США, але в Новосибірську прожив більшу частину свого життя. У справах свого бізнесу часто їздив на Алтай. У Кузбасі теж кілька разів доводилося бувати. Можу сказати, що між поведінкою виборців Кемеровської і Новосибірської областей - принципова відмінність. У 1995 р на виборах губернатора в Новосибірській обрости, Індінок набрав 22.8%, Муха - 18.1% і був другий тур. У 1997 р Аман Тулєєв на виборах губернатора Кемеровської області набрав 94.5%. Причому всі мої знайомі з Кемерово або Новокузнецька, з якими я спілкувався, говорили, що вони голосували за Тулєєва, тобто навіть якщо фальсифікації були, все одно підтримка Тулєєва в Кузбасі була дуже висока, хоча в Новосибірській області тоді йшла жорстка боротьба між різними політиками . Алтайський край був скоріше ближче до Новосибірської області. У 1996 р Суриков набрав 46.9%, Коршунов - 43.4%. Вибори президента 1996 теж розділили Росію. Бідні і депресивні регіони в основній своїй масі підтримали Зюганова, багаті - Єльцина:

Тому і з досвіду США, і з голосування 90-х (коли вибори були відносно вільними), слід, що передумова про однорідність електоральних переваг, швидше за все, не спроможна.
Друга важлива передумова, на яку спираються аналітики, це некоррелірованні між явкою і голосами за Єдину Росію. Відомий графік, на який всі посилаються, побудований фактично з припущення, що всі зайві голоси, виявлені на ділянках з аномальною явкою, є приписками:

{C}

Наскільки припущення, що підтримка ЕР і явка некорреліровани, коректно? Припустимо, що проти ЕР голосує молодь, а за ЕР - люди більш старшого віку. Дані показують, що явка серед людей до 30 років істотно нижче, ніж явка серед тих, хто старше 50. Припустимо, у нас є дві ділянки. На одному більшість молодь, на іншому, більшість тих, кому за 50. Де буде більше явка? Там, де більше представників старшого покоління. Де буде більше голосів (у відсотках) за ЕР? Теж на ділянках, де більше живе тих, кому за 50. Я взяв приклад з віком як умовний. Якщо ми взагалі припустимо, що виборець ЕР більш дисциплінований (тобто серед них явка більше), то ми отримаємо позитивну кореляцію між явкою і відсотком голосування за ЕР. Крім віку, це може бути багато інших характеристик. Наприклад, вважається, що сільські жителі більше схильні брати участь у виборах (для них це більш вагома подія в житті, ніж для жителів великих міст). Вони також є більш консервативними і у них крім телевізора менше доступ до альтернативних джерел інформації (незалежні засоби масової інформації, інтернет). Тому вони менш схильні підтримувати опозицію, ніж жителі великих міст. Разом, отримуємо позитивну кореляцію між голосами за ЕР і явкою. Позитивна кореляція може спостерігатися і завдяки «специфічних ділянок». Уявіть, у вас є ділянка, де проголосувало близько до 100%. Які це можуть бути ділянки? Швидше за все, де голосують люди підневільні - наприклад, військова частина, курсанти, ще якийсь заклад подібного типу. Який відсоток за ЕР ми очікуємо на таких ділянках? Цілком реально спостерігати голоси за ЕР 90% і вище, причому без всяких вкидань. Просто Батьківщина сказала «треба», комсомол відповів «є». Наскільки гіпотеза про позитивну кореляцію голосуванні за ЕР і явку підтверджується емпірично? Так як достовірних даних за останні 15 років не існує, ми знову ж змушені звернутися до даних в 90-ті роки. Більшість «особливих» регіонів, які зараз показують аномально високі результати за ЕР, в 90-ті показували відносно високу явку. Наприклад, Мордовія 1998 р (тут і далі вибори глави суб'єкта) - явка 75.6%. Інгушетія 1998 - 64.4%, Башкортостан 1998 - 78.8%, Тива 1997 - 70.9%, Татарстан випуску 1996 - 77.8%, тоді як переважна більшість інших регіонів показували явку від 30% до 60%. Отже, історичні емпіричні дані дозволяють зробити висновок, що гіпотеза про позитивну кореляцію за ЕР і явкою має право на існування.

Третя передумова, на яку спираються в підрахунку фальсифікацій, це що основний метод фальсифікацій - це вкидання, тобто всі інші партії страждають однаково. Виходячи з цієї передумови, виходить наступний перерахунок голосів по партіях ( http://podmoskovnik.livejournal.com/175574.html ):

Офіційний Реальний

КПРФ 13.42% 17.56%

ЛДПР 13.24% 17.32%

Попит 6.18% 8.09%

Яблуко 1.94% 2.54%

Парнас 0.72% 0.94%

Комуністи Росії 2.31% 3.02%

Якщо фальсифікації були шляхом вкидання, або перерисовка протоколів на користь ЕР мала випадковий характер (або як варіант перекладання бюлетенів з пачки в пачки), тобто колись більше відняли у Парнас, колись у КПРФ і т.д., то подібний метод використовувати можна - оцінка буде спроможна. Однак є серйозні підстави вважати, що це може бути не зовсім вірно. Наприклад, Petrachkova (2016) на підставі експерименту Enikolopov et al. (2013) проведеного під час виборів до Держдуми 2011, показала, що у Яблука відняли 30% голосів, у СР 21% голосів, у ЛДПР 20% у Комуністів 16%, тобто у Яблука відняли майже в 2 рази більше голосів, ніж у комуністів і в 1.5 рази більше, ніж у СР і ЛДПР.Почему у Яблука відняли істотно більше голосів? Можливо, з точки зору мінімізації скандалів, простіше забирати голоси у партій, які не мають шансів пройти в Держдуму. Я не знаю, як справи йдуть по всій Росії, але як мінімум в Москві передумова, що всі опозиційні партії страждають однаково не працювала. Якщо ми припустимо, що на цих виборах у Яблука теж забрали голосів в 2 рази більше, ніж у інших (як у Москві в 2011 р), то Яблуко цілком могло подолати 3% бар'єр.

Єдине спостереження, яке не допускає подвійного тлумачення, це сплески на певних цифрах. Наприклад, сплеск на 62.2% в Саратовській області - це очевидно фальсифікація. Щербини на інших цифрах теж. Однак наявність зазубрин не дає достатніх даних, щоб оцінити розмір фальсифікацій. Це може бути з 50% до 62%, з 40% до 62% або навіть з 30% до 62%.

Як порушення передумов змінюють оцінку порушень?

Припустимо, що у нас є два типи регіонів - слабо підтримують ЕР (умовно назвемо їх багаті) і сильно підтримують ЕР (назвемо їх бідними). У багатьох регіонах ЕР підтримують 30% -40% населення, в бідних 60% -70% (розкид підтримки Трампа в штатах дозволяє припустити, що різниця в 30% між російськими регіонами цілком імовірна). Тоді, якщо ми побудуємо розподіл голосів по дільницях на гістограмі, то буде два горба - один горб побільше в районі 35% і один поменше, в районі 65% (35% горб буде побільше, тому що все-таки багатих регіонів у нас більше, тільки Москва і Петербург по населенню з лишком покривають всі бідні «особливі» регіони). Тобто навіть у відсутності фальсифікацій при неоднорідних перевагах можливо два горба, і горб в 65% ні в якому разі не свідчить про наявність фальсифікацій. Якщо у вас є три типи регіонів - бідні, багаті і середні, то буде три горба, і знову ж таки, не тому що, були якісь фальсифікації.

Тепер розглянемо варіант з фальсифікаціями. Уявіть, що ви хитромудрий едінороссовскіх політтехнолог і хочете здійснити вкидання. В яких регіонах ви віддасте перевагу докидали голосу, в регіонах зі слабкою підтримкою, або з сильною підтримкою? Те, що відбувається, коли докидали голосу в регіоні зі слабкою підтримкою, ми всі спостерігали 5 років тому. Москвичам не сподобалося. Тому раціональний політтехнолог докинути голосу швидше в регіонах з сильною підтримкою, умовно кажучи, замість 65% намалює 95%, а не буде випробовувати терпіння тих, де ЕР набирає всього третину голосів.

Тоді ми дивимося на графік і бачимо два горба - один на 35%, інший на 95%. Очевидно, що 95% - це фальсифікат. Отримання чесно таких результатів нереально, навіть в російських умовах. Тоді аналітик дивиться, скільки голосів отримала ЕР на ділянках без фальсифікату - це 35% (адже піка65% ніхто не бачить, тому що шляхом вкидання його змістили в бік 95%). І він робить висновок, що різниця між офіційною і реальною підтримкою ЕР становить 60% (95% -35%). Насправді, ця різниця 30%, але її поміряти ніяк неможливо, тому що «горб» в 65% припадають - саме в цій області відбуваються активні вкидання.

Якщо явка і голоси за ЕР того ж позитивно корелюють, то проблема посилюється. Припустимо, у нас є дві ділянки, до кожного приписано по 1000 виборців. На першій ділянці явка 30% і відсоток підтримки 35%, на другій ділянці явка 50% і відсоток за ЕР 65% (решта голосів віддані іншим партіям)

Разом. Перша ділянка - прийшло 300 чоловік, 105 проголосувало за ЕР

Друга ділянка - прийшло 500 чоловік, 325 проголосувало за ЕР.

Припустимо, що едросовскій політтехнолог вирішив вкинути 400 голосів за ЕР на другій ділянці. Тоді на цій ділянці буде 900 тих, хто проголосував, 725 за ЕР, явка 90% з них 80.5% за ЕР. Дослідник не знає, скільки насправді проголосувало на другій ділянці. Він бачить, що на чесному ділянці була явка 30% і 35% за ЕР, там, де очевидно були фальсифікації - явка 90% з них 80.5% за ЕР. Тепер припустимо, що дослідник робить припущення, що переваги виборців однорідні, тобто істинний відсоток голосів за ЕР на другий ділянці повинен бути такий же, як на першому. Тоді, на другій ділянці повинно було бути вкинуто 630 голосів за ЕР. Загальна кількість тих, хто проголосував 270 (900-630), і кількість голосів за ЕР - 95 (725-630). Тоді ми отримуємо «очищену» явку в 27% (що не сильно відрізняється від 30%), і такий же відсоток голосів за ЕР - 35% .Отже, якщо ми припустимо, що переваги однорідні, ми отримаємо оцінку вкидання за ЕР в 630 голосів , тоді як істинний вкидання був 400, тобто наша оцінка фальсифікацій загального числа голосів завищена в 1.6 раз. «По-чесному» явка була завищена на 40% (90% -50%), а аналіз видає на 63% (90% -27%), рівень фальсифікацій на користь ЕР був 15.5% (80.5% -65%), а аналіз видав 45.5% (80.5% -35%).

Я ні в якому разі не ставлю під сумнів наявність фальсифікацій. Вони, безумовно, були. Однак якщо ми припустимо, що переваги виборців неоднорідні і / або є кореляція між голосами за ЕР і явкою, то з великою ймовірністю ми отримаємо завищені оцінки фальсифікацій.

Як отримати спроможні оцінки?

Існує три основні методи, які дозволяють виправити описані мною проблеми: метод інструментальних змінних, натуральний експеримент і експеримент.

Я не бачу, як застосувати інструментальні змінні до даної задачі, тому не буду вдаватися в детальний опис цього методу. Що таке натуральний експеримент було наочно продемонстровано британським кореспондентом Reuters (див. Опис цього кейса, наприклад, тут http://kireev.livejournal.com/1303660.html ). В результаті натурального експерименту можна порівняти результати голосування на дільниці, куди випадково забрів спостерігач, з іншими ділянками, і зробити висновок про фальсифікацію. Проте достатньої кількості туристів, які заблукали кореспондентів на всю Росію не напасешся. Тому, щоб систематично виміряти розмір фальсифікацій, потрібно проводити експеримент.

Enikolopov et al (2013) опісують подібний експеримент, коли смороду Випадкове чином розставілі наблюдателей на УІКах во время віборів до Держдума 2011 р цілому наблюдатели були розставлені примерно на 5% дільніць. Вони показали, що на ділянках, де були спостерігачі і не було порушень, було однопікову розподіл голосів за ЕР. Однак там, де не було спостерігачів, є яскраво виражений другий горб в голосах за ЕР. Вони оцінили, що ЕР в Москві приписали 11.5% голосів.

Бажано подібний експеримент повторити для всієї Росії. Наступні федеральні вибори будуть вже через півтора року (якщо президентські вибори, звичайно, не перенесуть на 2017 г.). Для вимірювання загального рівня фальсифікацій по Росії досить взяти 50 найбільших суб'єктів (де проживає 87% населення). Щоб оцінити рівень фальсифікацій на рівні суб'єкта федерації, досить в кожен суб'єкт направити в середньому 20 спостерігачів, разом 1000 чоловік. Якщо в кожен суб'єкт в середньому направити по 60 спостерігачів (3000 всього), то можна оцінити рівень фальсифікацій всередині кожного суб'єкта - по різних районах. Важливо спостерігачів розставити випадковим чином, відповідно до певних правил, щоб ніхто (включаючи спостерігачів) до останнього моменту не знав, де вони будуть стояти. Бюджет такого проекту можна оцінити від 150 тис. Доларів (20 спостерігачів на суб'єкт) до 400 тис. Доларів (60 спостерігачів на суб'єкт). У Росії вже є достатня кількість натренованих спостерігачів і бюджети подібного порядку теж цілком підйомні для громадянського суспільства.

Чому це важліво? Щоб після майбутніх виборів була якась об'єктивна картина, який рівень справжньої підтримки влади, який рівень справжньої явки, фальсифікацій, голосування за опозиційні партії, і т.д. Для чого це потрібно? Для планування майбутніх кампаній. У опозиції ресурси дуже обмежені, і витрачати їх має сенс тільки там, де рівень підтримки влади відносно невисокий. Я впевнений, що якби в опозиції була об'єктивна електоральна статистика, то вони б не сунулися в Кострому і не зазнали б нищівної поразки. Якщо продовжувати слідувати парадигмі «у нас все голоси вкрали, насправді нас населення любить, потрібно тільки організувати спостереження», подібні принизливі поразки триватимуть знову і знову. Щоб перемогти ЕР на її полі, потрібно спочатку зрозуміти яка конфігурація «її поля». А для цього потрібне розуміння об'єктивної електоральної підтримки.

Цей пост ні в якому разі не ставить за мету принизити заслуги Сергія Шпількіна та інших вчених, які працюють над цією проблемою. Насправді це їх велика заслуга, що дані цифри, графіки та концепти знайшли шлях до широкої громадськості. Це, скоріше, запрошення до діалогу. Можливо, у Сергія Шпількіна, Олександра Кірєєва та інших вчених є ідеї, як вирішити зазначені мною проблеми (або довести, що їх не існує). Хотілося б, щоб діалог про фальсифікації та реальну підтримку ЕР попрямував в конструктивне русло, а не обмежувався емоційними постами «наш виборець не прийшов», «підтримка ЕР повсюдно падає», «скоро вдарить буря», і т.д.
ПОСИЛАННЯ
Enikolopov R., Korovkin V., Petrova M., Sonin K., Zakharov A., 2013, Field experiment estimate of electoral fraud in Russian parliamentary elections, Proceedings of the National Academy of Sciences, 110 (2), pp.448- 452
Petrachkova A., 2016, Where observers are more effective? Evidence from Russia. Working paper


Як порушення передумов змінюють оцінку порушень?
Як отримати спроможні оцінки?
Наскільки це припущення обгрунтовано?
Чи можемо ми очікувати подібного розкиду переваг усередині Росії?
Чи можна передбачити, які суб'єкти будуть більше підтримувати Путіна і ЕР?
Be/eFQhw3VVToQ?
Але, може, не дивлячись на значні відмінності серед штатів, всередині російських регіонів таких відмінностей немає?
50. Де буде більше явка?
Де буде більше голосів (у відсотках) за ЕР?
Які це можуть бути ділянки?
Навигация сайта
Новости
Реклама
Панель управления
Информация