Wikipedia rechnet falsch – @ Wahlumfragen in Griechenland

Die eng­li­sche Wiki­pe­dia ent­hält eine im Prin­zip sehr nütz­li­che Über­sicht, über die poli­ti­sche Mei­nungs­um­fra­gen, die in Grie­chen­land durch­ge­führt wer­den:

https://​en​.wiki​pe​dia​.org/​w​i​k​i​/​G​r​e​e​k​_​l​e​g​i​s​l​a​t​i​v​e​_​e​l​e​c​t​i​o​n​,​_​S​e​p​t​e​m​b​e​r​_​2​0​1​5​#​O​p​i​n​i​o​n​_​polls (neben „Date“ auf „show“ kli­cken).

Aller­dings ent­hal­ten allein schon die Zei­len zwei bis vier – also zu den drei aktu­ells­ten Umfra­gen eine ganze Reihe von Feh­lern bzw. Unge­nau­ig­kei­ten:

  • In der ers­ten Zeile ist statt des Befra­gungs­zeit­raums das Ver­öf­fent­li­chungs­da­tum genannt.

Dem – rich­ti­gen! – Anspruch nach erfolgt die Dar­stel­lung in der Tabelle fol­gen­dem Prin­zip:

The lin­ked core data of this poll, shows the per­cen­tage of sup­port each party would gain among the sur­veyed sample of the elec­to­rate, wit­hout dis­re­gar­ding those who were unde­ci­ded or said they would abs­tain from voting (eit­her phy­si­cally or by voting blank). Howe­ver, in order to obtain results com­pa­ra­ble to other polls and the offi­cial elec­tion results, the result shown in this table has been adjus­ted based on the sim­ple rule of three, which mean the „group of unde­ci­ded and/​or abs­tai­ning voters“ have been assu­med ulti­mately to cast their votes (if any) accor­ding to the exact same dis­tri­bu­tion as the group of deci­ded voters (having cast a spe­ci­fic vote in the sur­vey). Or in other words, they are sim­ply dis­re­gar­ded under the assump­tion they will not cause any change to the alre­ady found dis­tri­bu­tion of votes. After this cal­cu­la­ted adjust­ment, the total of all noted vote sha­res in the table equals 100%, which is simi­lar to how the results of the offi­cial elec­tions are pre­sen­ted.

https://​en​.wiki​pe​dia​.org/​w​i​k​i​/​G​r​e​e​k​_​l​e​g​i​s​l​a​t​i​v​e​_​e​l​e​c​t​i​o​n​,​_​S​e​p​t​e​m​b​e​r​_​2​0​1​5​#​c​i​t​e​_​n​o​t​e​-​U​n​d​e​c​i​d​e​d​V​ote-6

Die meis­ten Umfra­gen wei­sen für die ein­zel­nen Par­teien ihren Anteil an der Gesamt­zahl der Befrag­ten (also ein­schließ­lich Leu­ten, die noch unent­schie­den sind, oder ange­ben, einen lee­ren oder ungül­ti­gen Stimm­zet­tel abzu­ge­ben) an. Um zu Pro­zent­sät­zen zu gelan­gen, die der amt­li­chen Dar­stel­lung von Wahl­er­geb­nis­sen ent­spre­chen (näm­lich Pro­zent­an­teile in Bezug auf die abge­ge­be­nen, gül­ti­gen Stim­men) müs­sen die Daten der Umfra­gen also umge­rech­net wer­den.

Diese Umrech­nung soll – man­gels Daten dar­über, wie sich die Unent­schlos­se­nen am Ende (wahr­schein­lich) tat­säch­lich ent­schei­den in der Tabelle gemäß ein­fa­chem mathe­ma­ti­schen Drei­satz erfol­gen – das heißt z.B.:

Das 10 %-Ergeb­nis einer Par­tei in einer Umfrage mit 20 % der Befrag­ten, die ange­ge­ben, unent­schlos­sen zu sein, ungül­tig zu wäh­len oder sich der Stimme zu ent­hal­ten, müßte also in fol­gen­der­weise umge­rech­net wer­den:

10 % x 100 : 80 = 12,5 %.

Das erfolgt aber in der Wikipedia-​​Tabelle nicht kor­rekt – u.a. weil nicht kor­rekt auf den Stimm­an­teil der „sons­ti­gen“ Par­teien geach­tet wird. Letz­te­res ist in der Tabelle in Bezug auf die in Zeile 2 und 4 dar­ge­stell­ten der Umfra­gen der Fall:

  • Zeile 2 (aktu­ellste Umfrage): Die Summe aller ein­schlä­gi­gen Werte in der Umfrage ist nur 98,5 %; sons­tige Par­teien wer­den nicht aus­drück­lich erwähnt. Also müß­ten für eine kor­rekte Berech­nung diese 1,5 % für sons­tige Par­teien zusätz­lich berück­sich­tigt wer­den. Dies pas­siert in der Wikipedia-​​Tabelle aber nicht, sodaß dort für alle aus­ge­wie­se­nen Par­teien zu hohe Pro­zent­sätze ange­ge­ben wer­den. (das war ein Feh­ler mei­ner­seits: siehe Kom­men­tar vom 04.09.2015; 15:39 h)
  • Auch dar­über hin­aus ent­hält diese Zeile einen wei­te­rer Feh­ler. Denn der Wert für SYRIZA ist um 0,9 Pro­zent­punkt zu hoch; der für ND aber nur um 0,5 Pro­zent­punkte. Bei zwei fast gleich star­ken Par­teien müßte sich der vor­ge­nannte Feh­ler ja aber fast gleich stark aus­wir­ken. Auch die Summe aller Werte in die­ser Zeile der Wikipedia-​​Tabelle beträgt 100,5 (statt 100) %. Beim Nach­rech­nen ergibt sich, daß der SYRIZA-​​Wert um ein hal­bes Pro­zent zusätz­lich über­höht ist. Da die Wiki­pe­dia – wie gesagt – die sons­ti­gen Par­teien igno­riert, rech­net sie den ND-​​Wert wie folgt um: 20 × 100 : 80,4 = 24,9 (was rich­tig gerech­net ist, aber einen fal­schen Wert ver­wen­det1). Der SYRIZA-​​Wert müßte ana­log wie folgt umge­rech­net wer­den: 21 × 100 : 80,4 = 26,1. In der Wikipedia-​​Tabelle steht aber 26,5…
  • Bei der in der vier­ten Zeile der Wikipedia-​​Tabelle dar­ge­stell­ten Umfrage besteht fol­gen­des Pro­blem: Die Umfrage weist weder die Sons­ti­gen, noch die Ent­hal­tun­gen, noch die ungül­ti­gen Stimme aus. Aus der Dif­fe­renz zwi­schen 100 % und der Summe der ange­ge­be­nen Werte (93,8 %) ergibt sich, daß die Summe von sons­ti­gen Par­teien, die Ent­hal­tun­gen und ungül­ti­gen Stimme 6,2 % betra­gen muß. Die Wiki­pe­dia unter­stellt in der Tabelle, diese gan­zen 6,2 % wür­den auf die „sons­ti­gen“ Par­teien ent­fal­len (rea­lis­tisch ist aber – ange­sichts des Ver­hält­nis­ses von Sons­ti­gen, Ent­hal­tun­gen und ungül­ti­gen Stim­men in den ande­ren Umfra­gen – ein Wert von 1 % oder etwas mehr [ich habe mei­ner­seits der Ein­fach­heit hal­ber mit 1 % gerech­net]). Außer­dem scheint die Wiki­pe­dia fol­gen­der­ma­ßen vor­ge­gan­gen zu sein. Da in der Umfrage der Anteil der Unent­schie­de­nen mit 12,8 % ange­ge­ben ist, rech­net sie anschei­nend: 100 – 12,8 = 87,2, und paßt dann die Werte für ein­zel­nen Par­teien fol­gen­der­ma­ßen an, z.B SYRIZA 25 % x 100 : 87,2 = 28,7 % und für die „Sons­ti­gen“ 6,2 % x 100 : 87,2 = 7,1 %. – Das ist aber voll­stän­dig falsch, daß es die­je­ni­gen, die in der Umfrage ange­ben haben, nicht zu wäh­len (Ent­hal­tung) oder ungül­tig zu stim­men nicht beach­tet wer­den. Rich­tige wäre statt des­sen fol­gende Rech­nung: SYRIZA 25 % x 100 : ca. 82 (oder mei­net­we­gen auch 83 – an die­ser Stelle hilft nur schät­zen wei­ter) = 30,5 % (oder – mit 83 gerech­net –: 30,1) %. In ent­spre­chen­der Weise müß­ten in die­ser Zeile der Tabelle auch fast alle ande­ren Werte noch oben kor­ri­giert wer­den. Der Wert für die Sons­ti­gen muß aber fol­gen­der­ma­ßen nach unten kor­ri­giert wer­den 1 (oder mei­net­we­gen: 2) % x 100 : 82 (oder 83) = 1,2 (oder: 2,4) %.
  • Auch die dritte Zeile der Tabelle ent­hält klei­nere Rechen-​​ oder Tipp­feh­ler (siehe unten­ste­hende Tabelle).

Ange­merkt sei noch:

1. Die wei­te­ren Zei­len in der Tabelle habe ich noch nicht über­prüft.

2. Ich stehe ja auf ANT­AR­SYA und inso­fern würde mir der hohe Wert für die „Sons­tige“ (unter die ANT­AR­SYA dort fällt) in Zeile 4 der Wikipedia-​​Tabelle sehr gefal­len; nur ist er schlicht und ergrei­fend nicht kor­rekt.

Da Ver­trauen bekannt­lich gut, Kon­trolle aber noch bes­ser ist stelle ich hier auch meine Tabellenkalkulations-​​Datei zur Ver­fü­gung:

http://​Theo​rie​als​Pra​xis​.blog​sport​.de/​i​m​a​g​e​s​/​U​m​f​r​a​g​e​n​_​A​n​f​a​n​g​_​S​e​p​t​_​2​0​1​5​.​o​d​s​.​t​ar.gz

http://​Theo​rie​als​Pra​xis​.blog​sport​.de/​i​m​a​g​e​s​/​U​m​f​r​a​g​e​n​_​A​n​f​a​n​g​_​S​e​p​t​_​2​0​1​5.pdf

  1. Ein­schließ­lich der „sons­ti­gen“ Par­teien müßte der Wert 81,9 (statt 80,4) ver­wen­det wer­den. [zurück]
Share and Enjoy:
  • Facebook
  • Twitter
  • studiVZ meinVZ schülerVZ
  • del.icio.us
  • email
  • Digg
  • Google Bookmarks
  • LinkedIn
  • MisterWong
  • MisterWong.DE
  • PDF
  • Tumblr
  • Wikio
Wikio

1 Antwort auf „Wikipedia rechnet falsch – @ Wahlumfragen in Griechenland“


  1. 1 TaP 04. September 2015 um 15:39 Uhr

    Wow, Kritik wird beachtet:

    ++ Die alte Zeile 3 wurde korrigiert.

    ++ Die alte Zeile 4 (jetzt 5) wurde auch korrigiert, allerdings auf der Grundlage einer Schätzung (4,2 % Sonstiges; 2 % Enthaltungen und Ungültige), die mir immer noch nicht realistisch erscheint.

    ++ Und bei Zeile 2 hatte ich mich selbst vertan: Ich hatte ganz am Ende der Graphik die 14,3 % und die 12,8 % vertauscht. --- Merkwürdig ist aber trotzdem, daß es in dieser Umfrage keine Sonstigen gibt… – das ist dann zumindest ein Faktor, der zu den relativ hohen Werten von G. Morgenröte, KKE und LAE beiträgt.

    ++ Und eine weitere Umfrage ist auch noch hinzugekommen (neue Zeile 4; gestern veröffentlicht).

Antwort hinterlassen

XHTML: Du kannst diese Tags benutzen: <a href=""> <abbr title=""> <acronym title=""> <b> <blockquote> <code> <em> <i> <strike> <strong>


zwei × drei =