Przejdź do treści

Sondaże przedwyborcze

Komu rośnie, a komu spada? Czy PSL przekroczy próg 5% i załapie się do Sejmu? Czy “totalna opozycja” już przegrywa z partią rządzącą czy jeszcze nie? Takie pytania rozgrzewają komentatorów polskiej sceny politycznej mniej więcej raz w tygodniu, przy okazji publikacji kolejnych sondaży przedwyborczych.

Zajmiemy się więc tymi sondażami.

Długo szukałem archiwalnych danych sondażowych, aż w końcu na Twitterze ktoś podrzucił linka do serwisu ewybory.eu. Przeglądając stronę znalazłem tabelę z tym co mnie interesowało – pełną historią sondaży. Po zerknięciu w kod strony okazuje się, że jest to osadzony arkusz Google Spreadsheets i wystarczy się do niego dobrać. Do samego arkusza się nie dostałem (więc nie udało się wykorzystać mechanizmów jak w poście z podsumowaniem wyników mojej ankiety), ale dane można pobrać z publicznego widoku HTML tego arkusza:

Mamy pobrane dane, zobaczmy notowania dla jednej z partii – czy wyglądają sensownie (czyli czy pobraliśmy to co chcieliśmy)? Niech będzie PiS:

Trend jest wyraźny (i zgodny z tym co słyszymy w mediach), mimo że rozstrzał pomiędzy różnymi ośrodkami jest całkiem spory. Spróbujmy wybrać konkretną metodę przygotowania sondażu oraz ośrodki badawcze robiące najwięcej pomiarów (z czego – trochę może na wyrost – można wnioskować, że są to ośrodki dobre, znające się na swojej robocie).

Zatem który ośrodek badawczy i jaką metodą przygotował najwięcej sondaży?

Widzimy, że metoda CATI (czyli wywiad przez telefon) jest najpopularniejsza w ośmiu sondażowniach:

Ośrodek badawczy Liczba sondaży
przeprowadzonych
metodą CATI
IBRiS 62
MillwardBrown 14
Kantar Public 13
IPSOS 11
TNS Polska 8
Kantar MB 6
Estymator 4
Kantar TNS 1

Tutaj uwaga – pary:

  • Millward Brown i Kantar MB
  • TNS Polska, Kantar Public oraz Kantar TNS

to są te same podmioty (zmiana nazw ze względu na przekształcenia na rynku badawczym), wybierzemy więc do dalszych prac po prostu wszystkie sondaże przeprowadzone metodą CATI.

Jak wyglądały notowania poszczególnych partii?

Kolor punktu oznacza sondażownię (dla porządku), ale interesują nas trendy. Co widzimy (idąc od góry):

  • Kukiz’15 powoli, falami zyskuje poparcie – w moim odczuciu to ciekawe, bo osobiście sądziłem, że ugrupowanie czeka los Samoobrony i Ruchu Palikota z poprzednich kadencji: wejście do Sejmu na poziomie około 10% i brak posłów w kolejnej kadencji
  • Nowoczesna straciła po “wycieczce na Maderę” rok temu i właściwie została na poziomie około 10%. To nie wróży niczego dobrego dla partii, którą chyba najczęściej widać w TVN24 (widzowie tej stacji to potencjalni wyborcy .N)…
  • Niezdecydowani – nie w każdym sondażu są uwzględniani (co jest błędem – to o tych ludzi toczy się gra), a jak widać jest to poziom porównywalny z poparciem dla Kukiz’15 przez całą kadencję czy też obecnym poparciem dla Nowoczesnej. Ugrupowanie “Niezdecydowani” przy obecnych notowaniach wchodzi do Sejmu (próg to 5%)
  • Prawo i Sprawiedliwość – tutaj od tegorocznych wakacji widać szaloną jazdę w górę, wygrana w kolejnych wyborach jest niezagrożona, co więcej – może okazać się, że PiS zdobędzie 2/3 miejsc w parlamencie (miejsca w Sejmie nie przeliczają się łatwo z poparcia). To mnie wcale nie zdziwi.
  • Platforma Obywatelska w 2017 roku nieco zyskała, najprawdopodobniej kosztem Nowoczesnej. To największa siła opozycyjna, chociaż w moim odczuciu medialnie lepiej wypada Nowoczesna. Brak konkretnych programów czy działań (to dotyczy również .N) a jedynie retoryka anty-PiS partii nie pomaga, co widać na zagięciu trendu w dół w ostatnim czasie
  • PSL zawsze łapie się do Sejmu, zawsze lekko mijając próg (i prawie zawsze jest w koalicji ;) – tym razem wygląda na dokładnie to samo. Brak PSL w kolejnej kadencji były niespodzianką. Wynik ponad 6% również.
  • Partia Razem – to taka partia, która dobrze sobie radzi w internecie, ale na niewiele się to przekłada w notowaniach. Oczywiście możemy powiedzieć, że z jakichś 2.7% urosło do 3.2% (co oznacza wzrost liczby popierających o jakąś 1/6), ale nadal nie daje to miejsc w Parlamencie. Nawet w połączeniu z SLD (wówczas potrzeba 8%)
  • z SLD jest trochę jak PSL (w kontekście notowań): o ile PSL się łapie lekko przekraczając próg, o tyle SLD lekko brakuje do progu. Nic z ugrupowań lewicowych w tym kraju nie będzie w najbliższym czasie…
  • Wolność, czyli partia Korwin-Mikke – poziom jak zawsze w okolicach 2-3%, tutaj nie ma żadnych zaskoczeń

Jaka będzie przyszłość?

Zanim przejdziemy dalej potrzebujemy lekkiej transformacji danych – uśrednimy je po miesiącach, odrywając się od sondażowni. Policzymy również poparcie w czterech grupach:

  • PiS jako partia rządząca,
  • Kukiz’15 jako taka nie do końca partia koalicyjna i jednocześnie nie do końca opozycja,
  • Wolność – ja nie wiem czy to opozycja? to swego rodzaju fenomen,
  • Opozycja – czyli połączone PO, Nowoczesna, PSL oraz ugrupowania lewicowe (SLD i Razem).

Czas na wykres nadający się idealnie do Wiadomości TVP: Opozycja vs PiS vs Kukiz vs Korwin, uśrednione miesięcznie. Totalne zwycięstwo nad totalną opozycją powinien się ten wykres nazywać:

Pozwolę sobie tego nie komentować. Zastanówcie się sami (zgodnie ze swoimi poglądami politycznymi) dlaczego tak jest.

Bo najciekawsze są nie tyle same wyniki co stojące za nimi powody. Dlaczego ludzie chcą głosować tak, a nie inaczej? Tego z sondaży się nie dowiemy, chociaż sondażownie pewnie mają takie dane, chociażby dodatkowo: miejsce zamieszkania (powiat, wielkość miejscowości), płeć, wiek, wykształcenie, średni dochód (najlepiej rozporządzalny) na członka rodziny i jak zmienił się w ostatnich dwóch latach (co dało 500+). Ale takich danych nie mamy. Chyba, że jakiś insider z sondażowni się podzieli…

Spróbujmy za to przewidzieć w jakiś prosty sposób co będzie dalej.

Najpierw trochę gimnastyki:

Predykcje dla każdej z kolejnych partii przeprowadzimy korzystając z modelu typu ARIMA.

Wyniki (uśrednione miesięcznie) dla każdej z partii potraktujemy jak szereg czasowy (zaczynający się w październiku 2015, z 12 wartościami na rok) i na nim przeprowadzimy prognozowanie. Współczynniki do ARIMA dobrałem testowo, wcześniej próbując inne (automatyczne – auto.arima() czy też ets()) modele. ARIMA(2, 0, 0) dała coś więcej niż linię prostą na aktualnym poziomie. Przyznam szczerze, że nie weryfikowałem poprawności predykcji (na próbkach testowych wyciągniętych z danych historycznych). Dla zainteresowanych: współczynnik AIC był w okolicach 60 dla większości z partii. Próbowałem też agregacji do tygodni – wyniki były podobne (trend taki sam, dokładność większa).

Co wychodzi w predykcji?

Ogólnie rzecz biorąc: jednym nieco urośnie, innym nieco spadnie, na koniec się wypłaszczy w okolicach obecnego wyniku. Ale to wynik zastosowanej metody.

Sprawdźmy jeszcze raz PiS, Opozycję, Kukiza i Korwina dodając predykcję:

Wychodzi na to, że właściwie niewiele się zmieni. Czy to trafne przewidywania? Dowiemy się z biegiem kolejnych miesięcy.

Problem z takim podejściem do prognozy jest jeden, ale bardzo ważny: poparcie dla partii nie podlega zmianom okresowym, więc sam model predykcyjny jest właściwe bez sensu. Dla bezrobocia (które jest okresowe) przygotowałem swego czasu przewidywania w podobny sposób i sprawdzają się na razie świetnie.

Ciekawe byłoby zestawienie poparcia dla partii z czynnikami opisującymi:

  • gospodarstwa domowe
  • całą gospodarkę poprzez wskaźniki makro
  • popularność konkretnych mediów (czy PiSowi rośnie, bo ludzie więcej oglądają TVP i wierzą w to co tam mówią, czy wręcz przeciwnie?)
  • konkretne wydarzenia (przysłowiowy urlop na Maderze – dziwi mnie, że to miało aż tak duży wpływ… a może nie miało i to tylko zbieg okoliczności?)
  • szum generowany w internecie (polecam tutaj świetny serwis Polityka w sieci)
  • jakieś ogólne miary nastrojów społecznych

Wszystko to i tak o kant stołu potłuc, bo wystarczy jakieś niespodziewane wydarzenie (np. jakaś afera) i obraz na scenie polityczniej może się zmienić. W każdym razie zgromadzenie wszystkich powyższych danych w jednym miejscu byłoby ciekawe.

  • Czy takie dane istnieją? Oczywiście.
  • Czy ktoś robi takie analizy? Sądzę (jestem prawie pewien), że tak. Za grube pieniądze.
  • Czy ktoś z nich korzysta? Myślę (już z mniejszą pewnością), że tak. A przynajmniej powinien.
  • Kto? Powinny partie polityczne.

Tak się to robi w USA (wiem, bo oglądałem kilka filmów, chociażby “House of Cards” :) i pewnie wszystkich innych rozwiniętych państwach.

2 komentarze do “Sondaże przedwyborcze”

  1. Nie ma co gdybać w prognozach na podstawie trendów – to wszystko zależy od kolejnych ruchów rządzących i opozycji. Sensowną jest próba wyciągnięcia wniosków z trendów.
    Ryszard zaorał swoją Nowoczesną wylotem „na Maderę”(podobno wcale nie był na Maderę). Wybierając Misiłę na konkurenta do przewodzenia partii wbił kolejny gwóźdź do jej trumny. Jedynym ratunkiem dla tego ugrupowania byłaby pani Lubnauer. Pomysły i ambicje Rysia sugerują że na wspólną listę „zjednoczonej opozycji” raczej nie ma szans.
    PSL i SLD raczej będą dalej balansować na progu, choć 500+ może być piórkiem które zadecyduje o tym po której stronie progu się znajdą w wyborach.
    Opozycja przegrywa sprawę reformy sądów i mocno traci na komisjach AmberGold i ds reprywatyzacji w Warszawie.
    Zupełnie w sondażach nie widać wpływu 500+, bo wątpliwe jest że po roku dopiero Polacy przekonali się że to był dobry pomysł.
    Po ostatniej debacie i głosowaniu w PE nie wróżę wzrostów opozycji w najbliższym czasie. PiS może przegrać tylko:
    1) sam ze sobą – np. ryzykując ze zmianą premiera
    lub
    2) z gospodarką – kryzys może przyjść w każdej chwili i opozycji bardzo zależy żeby przyszedł – choćby w wyniku nałożenia sankcji UE lub utraty zaufania w stabilność sytuacji politycznej inwestorów.

  2. Pingback: Parsowanie XMLa w R | Łukasz Prokulski

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *