Юлия Дмитриевна СВЯЖИТЕСЬ СО МНОЙ ПО E-MAIL УКАЗАННОМУ ВО WHOIS.

Центр содействия демократии и правам человека "ГЕЛИКС"
Форум и виртуальная консультация
 
 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 

Статистический анализ итогов голосования

 
Начать новую тему   Ответить на тему    Список форумов Центр "Геликс" -> Статистический анализ итогов голосования
Предыдущая тема :: Следующая тема  
Автор Сообщение
вопрос



Зарегистрирован: 13.11.2008
Сообщения: 155

СообщениеДобавлено: Ср Мар 11, 2009 12:39 am    Заголовок сообщения: Статистический анализ итогов голосования Ответить с цитатой

Вопрос 1: Можно ли выявлять фальсификации с помощью статистического анализа?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
ответ



Зарегистрирован: 13.11.2008
Сообщения: 153

СообщениеДобавлено: Ср Мар 11, 2009 12:43 am    Заголовок сообщения: Ответить с цитатой

Ответ: Статистические методы весьма полезны для выявления участков и территорий, подозрительных с точки зрения фальсификаций. Хотя сами по себе аномалии в итогах голосования не являются юридическим доказательством фальсификаций, тем не менее, они могут (а по нашему мнению – и должны) быть основанием для проведения проверок избирательными комиссиями, прокуратурой, судом.

Действительно, если, например, на избирательном участке вне помещения для голосования проголосовало 200 избирателей, то у вышестоящей избирательной комиссии должен возникать резонный вопрос: как можно было за 12 часов «обслужить» такое количество избирателей.

При тщательном анализе протоколов участковых избирательных комиссий, сравнении их друг с другом порой выявляются удивительные факты. Иногда требуется только изучить и сравнить протоколы, иногда имеет смысл использовать методы статистического анализа. Использование последних возможно потому, что голосование является массовым процессом, подчиняющимся не только воле людей, но и объективным законам, которые не дано изменить никакой партии или кандидату.

Кроме того, статистические методы могут использоваться для оценки масштаба фальсификаций в тех случаях, когда факты фальсификаций выявлены и нужно решить, могли ли они повлиять на результаты выборов. К сожалению, пока статистические методы игнорируются государственными органами, призванными обеспечивать избирательные права граждан, что связано как с низким уровнем математической подготовки их сотрудников, так и с их ангажированностью.

Примером всестороннего исследования официальной электоральной статистики на территории Москвы может служить публикация А. Бузина «Курс аномальной электоральной статистики (рекорды и награды московских выборов)».
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
вопрос



Зарегистрирован: 13.11.2008
Сообщения: 155

СообщениеДобавлено: Ср Мар 11, 2009 12:44 am    Заголовок сообщения: Ответить с цитатой

Вопрос 2: Что может выявить сравнение итогов голосования на различных избирательных участках или территориях?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
ответ



Зарегистрирован: 13.11.2008
Сообщения: 153

СообщениеДобавлено: Ср Мар 11, 2009 12:47 am    Заголовок сообщения: Ответить с цитатой

Ответ: Сравнение итогов голосования на различных избирательных участках или территориях является одним из наиболее простых и доступных методов статистического анализа. Однако надо понимать, что сильные различия в итогах голосования являются индикатором неблагополучия только в тех случаях, когда сравниваемые участки или территории близки по составу электората. Очевидно, что результаты голосования в больнице и тем более в воинской части или СИЗО вполне могут отличаться от результатов голосования жителей расположенных рядом домов. Да и два соседних дома, построенные по одинаковому проекту, могут оказаться заселены по-разному: например, один из них – ЖСК, а другой – заводское общежитие. Поэтому при сравнении нужно иметь представление о том, какие избиратели проживают на данном участке или территории, а еще лучше – иметь данные о результатах голосования на них на предыдущих выборах.

Очень полезным бывает сравнение итогов голосования на разных выборах, проходивших одновременно, или на выборах в один и тот же орган с использованием нескольких бюллетеней (например, когда законодательный орган избирается по смешанной системе).

Итоги голосования удобно сравнивать, имея сводную таблицу по многим избирательным участкам на территории (сводная таблица включает в себя итоги голосования из всех протоколов УИК). При исследовании итогов голосования надо сравнивать не только голоса, поданные за кандидатов или партии, но и другие показатели, отражаемые в итоговом протоколе избирательной комиссии или вычисляемые на его основе.

Например, хорошим индикатором является доля недействительных бюллетеней: ее повышенное значение может указывать на «порчу» бюллетеней, поданных за определенного кандидата, а пониженное – на то, что такие бюллетени были зачтены кому-то из кандидатов; в некоторых случаях оно в сочетании с другими факторами наводит на подозрения во вбросе бюллетеней.

Важным показателем является «унос» бюллетеней, вычисляемый как разность между числом бюллетеней, выданных избирателям, и числом бюллетеней, извлеченных из избирательных ящиков. Высокое значение «уноса» может означать изъятие бюллетеней, поданных за одного из кандидатов, или занижение при подсчете числа подданных за него голосов. Еще одна строка, сравнение значений которой может быть полезно, – количество избирателей, проголосовавших «на дому».

Такое сравнение удобно осуществлять с помощью таблиц или, что более наглядно, с помощью гистограмм. Математически разброс результатов голосования может быть выражен таким показателем как дисперсия (мера отклонения от среднего значения); его легко вычислить с помощью электронных таблиц (например, Excel), которые содержат дисперсию в качестве одной из своих внутренних функций.

В качестве примера ниже приведена гистограмма, отражающая голосование за «Единую Россию» на выборах депутатов Законодательного Собрания Санкт-Петербурга 11 марта 2007 года на территории № 16. На ней хорошо виден резкий разрыв между результатами одной группы избирательных участков (первые 25) и другой группы участков (последние 10). Аналогичная гистограмма получается и для явки. Из этих данных напрашиваются подозрения во вбросе, которые подтверждаются и сообщениями наблюдателей.


Примечание: избирательные участки отсортированы по возрастанию доли голосов за «Единую Россию»
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
вопрос



Зарегистрирован: 13.11.2008
Сообщения: 155

СообщениеДобавлено: Ср Мар 11, 2009 12:52 am    Заголовок сообщения: Ответить с цитатой

Вопрос 3: Какие выводы можно сделать, исследуя связь показателя явки и результатов, полученных кандидатами или партиями?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
ответ



Зарегистрирован: 13.11.2008
Сообщения: 153

СообщениеДобавлено: Ср Мар 11, 2009 12:55 am    Заголовок сообщения: Ответить с цитатой

Ответ: Метод выявления фальсификаций с помощью корреляций между явкой и голосованием за кандидатов (партии) был подробно описан А.А. Собяниным и В.Г. Суховольским в 1995 году в книге «Демократия, ограниченная фальсификациями» (текст этой книги можно найти по адресу http://www.hrights.ru/text/sob/).

Суть метода состоит в нанесении на координатную плоскость точек, соответствующих достаточно большому количеству избирательных комиссий (обычно используются УИК, но могут использоваться и комиссии более высокого уровня). Абсцисса (значение по оси x) каждой точки равна явке (доле избирателей, принявших участие в выборах), отраженной в протоколе данной комиссии, а ордината (значение по оси y) – результату партии или кандидата, но выраженному не в привычной доле от числа избирателей, принявших участие в голосовании, а в доле от общего (списочного) числа избирателей.

Для использования метода требуются данные достаточно большого числа избирательных комиссий, чем больше – тем лучше. Практика показывает, что для получения надежных результатов надо брать не менее 30 точек (избирательных участков на определенной территории или территорий в определенном регионе).

Получается совокупность («облако») точек, для которых может быть определена прямая, наиболее близко (обычно – в смысле так называемого метода наименьших квадратов) лежащая к этой совокупности точек. Такая прямая называется регрессионной линией (или интерполирующей прямой).

Одновременно могут быть вычислены (например, с помощью функций Excel) параметры приближения: коэффициент наклона регрессионной линии; отрезок, отсекаемый регрессионной линией на оси ординат; коэффициент корреляции.

Мы будем называть коэффициент наклона регрессионной линии коэффициентом поддержки дополнительных избирателей (ПДИ), поскольку он показывает, какая часть голосов «дополнительно пришедших» (по сравнению с минимальной явкой) избирателей голосует за данного кандидата (партию). Отрезок, отсекаемый регрессионной линией на оси ординат, будем называть смещением регрессионной линии (СРЛ). Эти значения показаны на графике, приведенном ниже.



Коэффициент корреляции (который может иметь значения по модулю от 0 до 1) показывает, насколько хорошо регрессионная линия приближена к «облаку» точек. Чем он ближе по модулю к 1, тем с большей уверенностью можно говорить о наличии статистической закономерности.

Важно отметить, что результаты такого анализа могут существенно искажаться из-за точек, которые имеют значения, сильно отличающиеся от основной массы по обеим координатам. Это хорошо видно на графиках. Такие точки (это могут быть участки, сильно отличающиеся от остальных по составу электората, например, воинские части) нужно анализировать отдельно и одновременно для проверки необходимо строить графики и вычислять значения ПДИ и СРЛ без данных точек.

По мнению А.А. Собянина и В.Г. Суховольского, в условиях честных выборов интерполирующая прямая должна проходить рядом с началом координат (т.е. значение СРЛ равно или близко к 0) и ее наклон (т.е. значение ПДИ) должен соответствовать (или близок) доле голосов, полученных кандидатом или партией, вычисленной от числа избирателей, принявших участие в голосовании (будем называть такой график «нормальным»). Так же должны себя вести и графики, отражающие зависимость от явки доли недействительных бюллетеней.

Наш анализ показал, что на выборах, проходивших в 1991–2003 годах, такие «нормальные» графики были характерны для большинства городских территорий. Значения СРЛ для всех кандидатов на этих территориях обычно не превышали по модулю 10%.

«Аномальными» мы считаем графики, на которых регрессионная линия для одной из партий или одного из кандидатов имеет наклон, близкий к единице (значение ПДИ около 1), а для остальных кандидатов и для недействительных бюллетеней эти линии близки к горизонтальным (значение ПДИ около 0). Это означает, что все «дополнительно пришедшие» избиратели голосуют только за одну партию или одного кандидата. Одновременно у этой партии (этого кандидата) отрицательное значение СРЛ (обычно превышающее по модулю 10%), а у остальных значение СРЛ положительное.

Пример «аномального» графика приведен выше. На нем показана и формула регрессионной линии, из которой видно, что значение ПДИ равно 0,996 (или 99,6%), а значение СРЛ равно –0,2561 (или –25,61%).

«Супераномальными» можно считать графики, на которых регрессионная линия для одной из партий или одного из кандидатов имеет наклон, превышающий единицу (значение ПДИ больше 1), а для остальных кандидатов и для недействительных бюллетеней наклон этих линий отрицательный (значение ПДИ меньше 0). Это означает, на каждого «дополнительно пришедшего» избирателя приходится больше одного голоса за одну из партий (одного из кандидатов).

«Аномальные» (реже, «супераномальные») графики можно было наблюдать на выборах, проходивших в 1991–2003 годах, для многих (но не для всех) сельских территорий. Начиная с президентских выборов 2004 года, и особенно на президентских выборах 2008 года «аномальные» и «супераномальные» графики встречаются все чаще, в том числе и для городских территорий (этот материал подробно изложен в книге А.Ю. Бузина и А.Е. Любарева «Преступление без наказания: Административные технологии федеральных выборов 2007–2008 годов»).

Анализ показывает, что «аномальные» и особенно «супераномальные» графики являются индикатором использования административного ресурса в ходе голосования и подсчета голосов. Это может быть как несвободное голосование значительной части избирателей (например, голосование под контролем), так и фальсификации типа «вброса» (или эквивалентных «вбросу» приписок голосов за счет не явившихся избирателей).
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
вопрос



Зарегистрирован: 13.11.2008
Сообщения: 155

СообщениеДобавлено: Ср Мар 11, 2009 1:03 am    Заголовок сообщения: Ответить с цитатой

Вопрос 4: Есть ли метод, позволяющий оценить масштаб возможных фальсификаций?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
ответ



Зарегистрирован: 13.11.2008
Сообщения: 153

СообщениеДобавлено: Ср Мар 11, 2009 1:06 am    Заголовок сообщения: Ответить с цитатой

Ответ: Недавно С.А. Шпилькиным был предложен метод, основанный на тех же принципах, что и метод Собянина–Суховольского. Он также может использоваться для выявления фальсификаций типа «вброса».

В отличие от метода Собянина–Суховольского, метод Шпилькина позволяет оценить и количество «аномальных» голосов. Однако этот метод может применяться только на большом массиве данных (более 2 тыс. избирательных участков), т.е. им можно пользоваться для оценки уровня фальсификаций в больших регионах или в целом по России.
Метод основан на распределении по явке числа голосов, поданных за кандидатов или партии. Для этого интервал возможных значений явки (от 0 до 100%) разбивается на небольшие интервалы (точнее, открытые справа полуинтервалы). Наиболее удобным оказалось разбиение на однопроцентные интервалы, при этом отдельным интервалом считается значение 100%, то есть всего получается 101 интервал. Для каждого такого интервала вычисляется суммарное значение исследуемого электорального показателя (в данном случае, числа голосов, поданных за кандидатов или партии) для всех избирательных комиссий, у которых явка попадает в данный интервал. Далее строится график распределения, то есть зависимости показателя (показателей) от явки.

Применение этого метода для анализа результатов федеральных выборов 2007 и 2008 годов показало, что распределения голосов за все партии, кроме «Единой России», и за всех кандидатов, кроме Д.А. Медведева, подобны, т.е. отличаются только масштабным коэффициентом. Это означает, что распределение поданных голосов между этими партиями и кандидатами фактически не зависит от явки избирателей.

В то же время распределения голосов за «Единую Россию» и Д.А. Медведева были подобны остальным только при низких значениях явки, а при высоких наблюдались «дополнительные» голоса.

С.А. Шпилькин сделал предположение, что голоса, поданные за «Единую Россию» или Д.А. Медведева, состоят из двух составляющих – «нормальной» и «аномальной». При этом «нормальная» часть должна представлять собой кривую, подобную кривым голосования за все остальные партии или за всех остальных кандидатов, а «аномальная» – остаток, не описываемый такой кривой. Таким образом, «нормальная» часть была получена умножением распределения суммы голосов, поданных за все партии (или всех кандидатов), на поправочный коэффициент, а «аномальная» – вычитанием «нормальной» части из кривой распределения голосов, поданных за «Единую Россию» (или Д.А. Медведева).

Результат разделения голосов, поданных за «Единую Россию», на «нормальную» и «аномальную» составляющие показан ниже на графике. На основании этого разделения можно затем путем суммирования вычислить количество «нормальных» и «аномальных» голосов.

Более подробно с методом и его результатами можно ознакомиться по адресу: http://podmoskovnik.livejournal.com/21615.html.

Вернуться к началу
Посмотреть профиль Отправить личное сообщение
вопрос



Зарегистрирован: 13.11.2008
Сообщения: 155

СообщениеДобавлено: Ср Мар 11, 2009 1:07 am    Заголовок сообщения: Ответить с цитатой

Вопрос 5: Какие еще можно использовать статистические методы?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
ответ



Зарегистрирован: 13.11.2008
Сообщения: 153

СообщениеДобавлено: Ср Мар 11, 2009 1:11 am    Заголовок сообщения: Ответить с цитатой

Ответ: Есть еще ряд методов, которые можно использовать в особых случаях.

В тех случаях, когда на части территории выборы проходят с использованием технических средств (например, Комплексов обработки избирательных бюллетеней, КОИБ, или в просторечье, сканеров), а на другой части – обычным способом, полезно сравнить между собой результаты, полученные на этих частях. Правда, при этом необходимо для контроля сравнить результаты на этих же частях на выборах, когда технические средства не использовались.

Так, в Москве такое сравнение показало, что на федеральных выборах 2007 и особенно 2008 года на территориях, где использовались сканеры, результаты «Единой России» и Д.А. Медведева, а также явка были существенно ниже, чем на территориях, где голоса считались вручную.

В случае, когда голосование производится несколькими видами бюллетеней (например, за партийный список и за одномандатного кандидата, или за кандидата в законодательный орган субъекта РФ и представительный орган местного самоуправления) полезно произвести сравнительный анализ данных протоколов по разным видам голосования. Есть строки протокола, которые должны быть одинаковыми на одних и тех же выборах при голосовании за партийный список и за одномандатного кандидата. Другие строки протокола связаны между собой определенными соотношениями, которые либо должны строго выполняться, либо могут иметь небольшие отклонения при определенных обстоятельствах (например, в тех редких случаях, когда избиратель отказывается взять один из бюллетеней). Пример такого анализа можно найти в публикации А. Бузина «Бесконтрольные соотношения протоколов избирательных комиссий».

В случае голосования в многомандатных избирательных округах среднее количество голосов, поданных за кандидатов в действительных избирательных бюллетенях, не может превышать установленное законом число голосов, которые имеет избиратель (ранее это число повсеместно было равно числу распределяемых в округе мандатов; в настоящее время иногда применяется система, при которой избиратель имеет меньше голосов, чем число мандатов в округе). Это контрольное соотношение не упоминается в большинстве региональных законов, часто о нем забывают и в местных инструкциях, а бывает, что предлагается проверять неправильное контрольное соотношение. Поэтому даже в официальных данных это соотношение может быть не выполнено, что свидетельствует, по меньшей мере, о неправильном подсчете голосов.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов Центр "Геликс" -> Статистический анализ итогов голосования Часовой пояс: GMT + 3
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2005 phpBB Group
Русская поддержка phpBB
Абузоустойчивый хостинг и домены