9 августа в Беларуси прошел основной день голосования по выборам президента Республики. Было и досрочное голосование, оно прошло 4-8 августа.
Полученная от наблюдательского сообщества Беларуси таблица содержит 5366 записей о количестве проголосовавших на избирательных участках Беларуси за 4, 5, 6, 7, 8 августа по данным официальных протоколов и/или наблюдателей (каждая запись — один участок за одно число с ненулевыми данными как минимум от наблюдателя и/или из официального протокола):
В условиях, когда контроль явки на избирательных участках сильно затруднен и обеспечить сплошной контроль в течение всего досрочного голосования сложно, возникает задача оценки явки досрочного голосования на основании имеющихся фрагментарных (не обязательно покрывающих все дни голосования целиком) данных.
Рассмотрение имеющихся данных показывает, что в подавляющем большинстве случаев явка по данным официального протокола либо равна явке по данным наблюдателей, либо превышает ее. В качестве иллюстрации приведем гистограмму распределения избирательных участков по всей Беларуси по количеству проголосовавших на участке за 6 августа по данным официальных протоколов и по данным наблюдателей (шаг гистограммы 10).
Распределение участков по числу проголосовавших по данным наблюдателей имеет вид узкого колокола, в то время как распределение по данным избирательных протоколов, совпадая по моде с распределением по данным наблюдателей, имеет сильно затянутый хвост в сторону высоких явок. Длительный опыт исследования российских выборов показывает, что такой хвост с большой вероятностью свидетельствует о наличии приписок явки с целью фальсификации результатов голосования. Аналогичная картина наблюдается и для остальных дат.
Чтобы исключить влияние фальсификации на оценку, ограничимся теми записями из имеющегося массива данных, для которых результаты официальных протоколов подтверждаются данными наблюдателей. Считаем данные протокола о числе проголосовавших надежными, если они отклоняются от данных наблюдателя не более чем на 10% (оставляем допуск на ошибки подсчета наблюдателем).
Таких записей в имеющемся массиве данных имеется 1804 (примерно 1/3):
Гистограммы распределения числа участков по количеству проголосовавших для «надежных» участков приведены ниже.
По набору надежных участков можно вычислить значения медианного и среднего количества проголосовавших на участке на каждую дату, а также межквартильное расстояние IQR и на его основании робастную оценку стандартного отклонения (IQR/1.35).
Медианное и среднее значение количества проголосовавших на участках за весь срок голосования можно приближенно оценить как сумму медианных и средних значений для отдельных дат соответственно. В качестве оценки статистической погрешности можно взять квадратный корень из суммы квадратов оценок стандартных отклонений по отдельным датам, (учитывая, что разброс количества проголосовавших включает в себя систематическую составляющую, связанную с неодинаковой численностью участков, полученная погрешность скорее является оценкой сверху).
Следует учесть, что выборка проконтролированных участков, по-видимому, является смещенной в сторону городских (более крупных) участков с численностью больше средней по Беларуси (которая составляет примерно 1150 человек).
Округляя, количество проголосовавших на попавших под контроль наблюдателей и аналогичных им участках можно оценить как:
На конец дня 07.08:
На конец дня 08.08:
Если исходить из средней по Беларуси численности избирателей на участке (1150 человек), это соответствует досрочной явке:
Учитывая, что проконтролированные участки, по-видимому, имеют численность выше средней, эти числа следует рассматривать как оценки сверху. Таким образом, официально заявленное значение досрочной явки (41.7%) со всей очевидностью является грубо завышенным (в 2 и более раза).
Абсолютное завышение числа досрочно проголосовавших можно оценить как (42% (официальная досрочная явка) — 24% (оценка средней досрочной явки на 8 августа))*6.8 млн избирателей = 1.2 миллиона избирателей (учитывая приведенные выше оговорки, это, видимо, оценка снизу с большим запасом).
Поступил второй набор данных для 258 участков, на которых наблюдателям удалось проконтролировать явку с первого до последнего дня досрочного голосования. Соответственно количество проголосовавших можно оценить напрямую по данным наблюдателей.
По этому набору результаты такие:
На конец дня 07.08:
На конец дня 08.08:
Итого прямая оценка совпадает с непрямой в пределах заявленной погрешности. Так что явку досрочного голосования действительно можно оценивать по фрагментарным данным с удовлетворительной точностью.