Statistik ist ein komplexes Thema, aber es muss nicht unbedingt kompliziert erklärt werden. Jürgen Faik bringt Ihnen in diesem Buch die Statistik so verständlich wie möglich näher. Er führt Sie erst in die statistischen Grundlagen ein und widmet sich dann der deskriptiven Statistik. Hier lernen Sie, was zu Häufigkeitsverteilungen, Verhältnis- und Indexzahlen und Zeitreihenanalysen wichtig zu wissen ist. Im nächsten Teil wird die induktive Statistik besprochen. Der Autor beginnt mit den Grundlagen der Wahrscheinlichkeitsrechnung und fährt mit Zufallsvariablen, diskreten und stetigen Verteilungen, Schätz- und Testtheorie fort. Eine knappe Einführung in die Ökonometrie schließt das Buch ab. Zahlreiche Übungsaufgaben mit Lösungen helfen Ihnen, Ihr Wissen zu testen und zu festigen.
Einleitung 15
Teil I: Statistische Grundlagen 17
1 Wirtschafts- und sozialstatistische Ausgangsbasis 17
1.1 Begriff von Statistik 17
1.1.1 Historie der Statistik 17
1.1.2 Bedeutung von Wirtschafts- und Sozialstatistik 18
1.1.3 Arten von Wirtschafts- und Sozialstatistik 18
1.1.3.1 Deskriptive Statistik 18
1.1.3.2 Induktive Statistik 19
1.1.3.3 Ökonometrie 19
1.1.4 Statistische Einheiten 19
1.1.4.1 Bestands- und Bewegungsmassen 20
1.1.4.2 Merkmale und Merkmalsausprägungen 20
1.1.5 Vorgehen statistischer Untersuchungen 21
1.2 Wirtschafts- und sozialstatistische Anwendungsgebiete 21
1.2.1 Bevölkerung 21
1.2.2 Arbeitsmarkt 22
1.2.3 Wohlfahrtsmessung 23
1.2.4 Preise 23
1.2.5 Umwelt 24
1.2.6 Volkswirtschaftliche Gesamtrechnungen 24
1.3 Träger von Wirtschafts- und Sozialstatistik 24
1.3.1 Amtliche versus nichtamtliche inländische Statistik 24
1.3.2 Internationale Organisationen 25
2 Datenerhebung 27
2.1 Form der Datenerhebung 27
2.1.1 Vollerhebung versus Stichprobe 27
2.1.2 Querschnitt versus Längsschnitt beziehungsweise Panel 28
2.1.3 Amtliche, prozess- und wissenschaftsproduzierte Daten 29
2.1.4 Primär- und Sekundärdaten 29
2.2 Eigenschaften der erhobenen Daten 30
2.2.1 Datenarten 30
2.2.2 Skalenniveau der Daten 30
2.2.2.1 Nominalskala 31
2.2.2.2 Ordinalskala 31
2.2.2.3 Intervall- und Kardinalskala 32
2.2.3 Definitions- und Wertebereich von Daten 32
2.2.3.1 Diskrete Daten 33
2.2.3.2 Stetige Daten 33
2.2.4 Zusammenfassung der Datenarten 33
2.2.5 Normierung von Daten 34
2.2.5.1 Saisonbereinigung 34
2.2.5.2 Datenimplementierung 34
3 Datenauswertung 37
3.1 Form der Datenauswertung 37
3.1.1 Grafiken 37
3.1.2 Univariate Kennziffern 38
3.1.3 Zusammenhangsanalyse 38
3.1.4 Statistikprogramme 39
3.2 Probleme der Datenauswertung 39
3.2.1 Adäquationsproblem 39
3.2.2 Fallstricke (I): Fehlinterpretationen 39
3.2.2.1 Verletzung der Adäquationsregel 40
3.2.2.2 Fehlende Differenziertheit der Analyse 40
3.2.2.3 Problematische Kausalitäten 40
3.2.2.4 Nichtrepräsentativität der Daten 41
3.2.2.5 Nichtberücksichtigte Daten und Messfehler 41
3.2.2.6 Strukturbrüche 42
3.2.3 Fallstricke (II): Manipulationen 42
3.2.3.1 Grafische Manipulationen 42
3.2.3.2 Prozentwertmanipulationen 46
Teil II: Deskriptive Statistik 47
4 Darstellungsformen eindimensionaler Häufigkeitsverteilungen 47
4.1 Eine beispielhafte Datenmatrix 47
4.2 Tabellarische Ordnung 49
4.2.1 Urliste 50
4.2.2 Häufigkeitstabelle 50
4.3 Grafische Darstellung 56
4.3.1 Kreisdiagramm 56
4.3.2 Balkendiagramm 58
4.3.3 Histogramm 63
4.3.4 Polygonzug 64
4.3.5 Summenpolygon 65
6 Inhalt
5 Lageparameter 69
5.1 Modus 69
5.2 Median 70
5.3 Arithmetischer Mittelwert 73
5.3.1 Nulleigenschaft 75
5.3.2 Minimumeigenschaft 76
5.3.3 Aggregationseigenschaft 76
5.3.4 Lineartransformationseigenschaft 77
5.4 Geometrischer Mittelwert 79
5.5 Harmonischer Mittelwert 80
5.6 Mittelwertbeziehungen 82
6 Streuungsparameter 85
6.1 Streuungsbegriff 85
6.2 Spannweite 86
6.2.1 Absolute Spannweite 88
6.2.2 Relative Spannweite 89
6.3 Quantilsmaße 90
6.3.1 Quartile 90
6.3.2 Quartilsabstand 93
6.3.3 Quartilsrelation 93
6.4 Mittlere absolute Abweichung 95
6.4.1 Einfache mittlere absolute Abweichung 95
6.4.2 Standardisierte mittlere absolute Abweichung 96
6.5 Varianz und Standardabweichung 96
6.5.1 Definition 96
6.5.2 Eigenschaften 98
6.5.2.1 Verschiebungssatz 98
6.5.2.2 Aggregationseigenschaft 100
6.5.2.3 Lineartransformation 101
6.5.3 Variationskoeffizient 102
6.6 Weiterführendes: Schiefe, Wölbung und Standardisierung 103
6.6.1 Schiefe 103
6.6.2 Wölbung 104
6.6.3 Z-Transformation 105
7 Konzentration 109
7.1 Absolute Konzentration 109
7.1.1 Konzentrationskurve 109
7.1.2 Indizes der absoluten Konzentrationsmessung 111
7.1.2.1 Rosenbluth-Index 111
7.1.2.2 Herfindahl-Index 113
Inhalt 7
7.2 Relative Konzentration 115
7.2.1 Lorenzkurve 115
7.2.2 Ausgewählte Indizes der relativen Konzentrationsmessung 118
7.2.2.1 Gini-Koeffizient 118
7.2.2.2 Theil'sches Entropiemaß 123
7.2.2.3 Atkinson-Maß 125
8 Korrelation 129
8.1 Mehrdimensionale Häufigkeitsverteilungen 129
8.1.1 Kreuztabelle 129
8.1.1.1 Aufbau einer Kreuztabelle 130
8.1.1.2 Beispielhafte Betrachtungen zur bedingten und zur Randverteilung 133
8.1.2 Statistische (Un-)Abhängigkeit 134
8.1.3 Zur Korrelationsanalyse 136
8.1.3.1 Nonsenskorrelation 136
8.1.3.2 Skalierungsniveau 136
8.2 Kontingenzkoeffizienten 137
8.2.1 Prozentsatzdifferenz 138
8.2.2 Chi-Quadrat-Kontingenzkoeffizient 139
8.2.2.1 Grundkonzeption des Chi-Quadrat-Kontingenzkoeffizienten 139
8.2.2.2 Spezialfall Vierfeldertabelle 140
8.2.2.3 Variationen des Chi-Quadrat-Kontingenzkoeffizienten 141
8.3 Rangkorrelationskoeffizienten 142
8.3.1 Spearman'scher Rangkorrelationskoeffizient 143
8.3.2 Kendalls Tau-Koeffizient und ähnliche Maße 146
8.4 Bravais/Pearson-Korrelationskoeffizient 150
8.4.1 Begriff der Kovarianz 151
8.4.2 Ausformungen linearer Korrelation 153
8.4.3 Das Problem der verdeckten Korrelation 156
9 Regression 161
9.1 Vorbemerkung 161
9.2 Lineare Regression 162
9.2.1 Kleinst-Quadrate-Methode 163
9.2.2 Bestimmtheitsmaß 169
9.3 Quasilineare Regression 171
9.3.1 Einfache Variablentransformation 171
9.3.2 Quadratische Funktionen 172
9.3.2.1 Normalgleichungen 172
9.3.2.2 Beispiel 173
9.3.2.3 Verallgemeinerung 175
8 Inhalt
9.3.3 Potenzfunktionen 176
9.3.4 Exponentialfunktionen 178
9.3.5 Logistische Funktionen 180
10 Maßzahlen 187
10.1 Verhältniszahlen 187
10.1.1 Gliederungszahlen 188
10.1.2 Beziehungszahlen 188
10.1.3 Messziffern 189
10.1.4 Umbasierung und Verkettung 193
10.1.4.1 Umbasierung 193
10.1.4.2 Verkettung 194
10.2 Indexzahlen 196
10.2.1 Preisindizes 196
10.2.1.1 Laspeyres-Preisindex 197
10.2.1.2 Paasche-Preisindex 199
10.2.1.3 Fisher-Preisindex 202
10.2.1.4 Kettenpreisindex 202
10.2.2 Mengenindizes 203
10.2.2.1 Laspeyres-Mengenindex 204
10.2.2.2 Paasche-Mengenindex 205
10.2.2.3 Fisher-Mengenindex 206
10.2.3 Umsatzindex 207
11 Zeitreihenanalyse 211
11.1 Zeitreihencharakteristika 211
11.1.1 Zeitreihenkomponenten 211
11.1.1.1 Glatte Komponente 211
11.1.1.2 Saisonkomponente 212
11.1.2 Art der Komponentenverknüpfung 212
11.1.2.1 Additive Verknüpfung 212
11.1.2.2 Multiplikative Verknüpfung 213
11.2 Trendermittlung 214
11.2.1 Kleinst-Quadrate-Methode 214
11.2.2 Gleitende Durchschnitte 215
11.3 Saisoneinflüsse 220
11.3.1 Phasendurchschnittsverfahren mit konstanter Saisonfigur 220
11.3.2 Phasendurchschnittsverfahren mit variabler Saisonfigur 224
11.3.3 Weitere (komplexere) Verfahren der Saisonbereinigung 227
11.3.3.1 Berliner Verfahren 227
11.3.3.2 Census-Verfahren 227
11.3.4 Dummyschätzungen 230
Inhalt 9
Teil III: Induktive Statistik 235
12 Grundlagen der Wahrscheinlichkeitsrechnung 235
12.1 Zufallsexperiment 235
12.1.1 Der Ereignisbegriff 236
12.1.2 Ereignisbeziehungen 236
12.1.2.1 Vereinigungsmenge 237
12.1.2.2 Schnittmenge 237
12.1.2.3 Differenz 238
12.1.2.4 Disjunkte Ereignisse 238
12.1.2.5 Komplementärereignisse 239
12.2 Wahrscheinlichkeitsbegriffe 240
12.2.1 Klassischer Wahrscheinlichkeitsbegriff nach Laplace 240
12.2.2 Statistischer Wahrscheinlichkeitsbegriff nach von Mises 242
12.2.3 Subjektiver Wahrscheinlichkeitsbegriff nach Savage 242
12.2.4 Axiomatischer Wahrscheinlichkeitsbegriff nach Kolmogoroff 242
12.3 Rechenregeln für Wahrscheinlichkeiten 243
12.3.1 Additionssatz 243
12.3.2 Multiplikationssatz 244
12.3.3 Satz von der totalen Wahrscheinlichkeit 245
12.3.4 Satz von Bayes 247
13 Zufallsvariablen 251
13.1 Darstellung 251
13.1.1 Ereignisraum und Definitionsbereich 251
13.1.2 Realisationen 252
13.1.3 Allgemeine Funktionen 252
13.1.3.1 Allgemeine Wahrscheinlichkeitsfunktion 252
13.1.3.2 Allgemeine Dichtefunktion 254
13.1.3.3 Allgemeine Verteilungsfunktion 255
13.2 Kennzahlen 257
13.2.1 Erwartungswert 257
13.2.1.1 Diskrete Zufallsvariable 257
13.2.1.2 Stetige Zufallsvariable 258
13.2.1.3 Erwartungswertregeln 258
13.2.2 Varianz 259
13.2.2.1 Diskrete Zufallsvariable 259
13.2.2.2 Stetige Zufallsvariable 259
13.2.2.3 Varianzregeln 260
13.2.3 Transformationen 260
13.3 Stochastische Prozesse 261
13.3.1 Begriff 261
10 Inhalt
13.3.2 Markoff-Ketten 261
13.3.2.1 Allgemeine Darstellung von Markoff-Ketten erster Ordnung 262
13.3.2.2 Konvergenz beziehungsweise Divergenz von Markoff-Ketten 263
14 Ausgewählte Verteilungen 267
14.1 Diskrete Verteilungen 267
14.1.1 Diskrete Gleichverteilung 267
14.1.1.1 Allgemeine Formulierung 267
14.1.1.2 Sonderfall 268
14.1.2 Binomialverteilung 270
14.1.2.1 Konzeption des Urnenmodells mit Zurücklegen 271
14.1.2.2 Symmetrieeigenschaften der Binomialverteilung 272
14.1.2.3 Erweiterung zur Multinomialverteilung 274
14.1.3 Hypergeometrische Verteilung 275
14.1.3.1 Konzeption des Urnenmodells ohne Zurücklegen 275
14.1.3.2 Erweiterung zur allgemeinen hypergeometrischen Verteilung 277
14.1.4 Poissonverteilung 278
14.1.5 Geometrische Verteilung 279
14.2 Stetige Verteilungen 281
14.2.1 Stetige Gleichverteilung 281
14.2.2 Exponentialverteilung 283
14.2.3 Normalverteilung 284
14.2.3.1 Konzeption der Normalverteilung 284
14.2.3.2 Zentraler Grenzwertsatz 285
14.2.3.3 Lognormalverteilung 286
14.2.4 Standardnormalverteilung 286
14.2.5 Testverteilungen 288
14.2.5.1 Chi-Quadrat-Verteilung 288
14.2.5.2 t-Verteilung 289
14.2.5.3 F-Verteilung 290
15 Schätztheorie 293
15.1 Punktschätzung 293
15.1.1 Begriff der Schätzfunktion 293
15.1.2 Eigenschaften von Schätzfunktionen 294
15.1.2.1 (Asymptotische) Erwartungstreue 294
15.1.2.2 Konsistenz 295
15.1.2.3 Effizienz 295
15.1.3 Schätzmethoden 295
15.1.3.1 Momentenmethode 296
Inhalt 11
15.1.3.2 Maximum-Likelihood-Methode 296
15.2 Intervallschätzung 297
15.2.1 Allgemeines 297
15.2.2 Mittelwert-Konfidenzintervalle 297
15.2.2.1 Bekannte Varianz 298
15.2.2.2 Unbekannte Varianz 300
15.2.2.3 Keine Normalverteilung 301
15.2.3 Varianz-Konfidenzintervalle 301
15.2.4 Anteilswert-Konfidenzintervalle 302
16 Testtheorie 305
16.1 Aufbau eines statistischen Tests 305
16.1.1 Hypothesenbildung 305
16.1.1.1 Zweiseitiger Test 306
16.1.1.2 Einseitiger Test 307
16.1.2 Fehlermöglichkeiten 308
16.1.3 Schema für einen statistischen Test 309
16.2 Parametertests 309
16.2.1 Mittelwerttests 310
16.2.1.1 Bekannte Varianz 310
16.2.1.2 Unbekannte Varianz 310
16.2.2 Varianztests 311
16.2.3 Anteilswerttests 312
16.3 Verteilungstests 313
16.3.1 Chi-Quadrat-Verteilungstest 313
16.3.2 Kolmogoroff/Smirnoff-Verteilungstest 320
17 Grundlagen der Ökonometrie 327
17.1 Modellarten 327
17.1.1 Arten von Variablen 327
17.1.2 Gleichungsarten 328
17.1.3 Eingleichungsmodelle 329
17.1.4 Mehrgleichungsmodelle 329
17.1.4.1 Unabhängige Mehrgleichungsmodelle 329
17.1.4.2 Rekursive Mehrgleichungsmodelle 329
17.1.4.3 Interdependente Mehrgleichungsmodelle 329
17.2 Das klassische Regressionsmodell 330
17.2.1 Das Basismodell 330
17.2.1.1 Annahmen zum Störterm 330
17.2.1.2 Schätzung mittels Kleinst-Quadrate-Methode 331
17.2.1.3 Signifikanz der Regressionsparameter 331
17.2.2 Das multiple Bestimmtheitsmaß 333
17.2.2.1 Das korrigierte Bestimmtheitsmaß 333
12 Inhalt
17.2.2.2 Multikollinearität 334
17.2.3 Ein Beispiel für die Schätzung von Mehrgleichungsmodellen: der SURE-Ansatz 335
Zitierte Literatur 337
Lösungen 339
Glossar 377
Symbolverzeichnis 381
Formelsammlung 387
Anhang: Ausgewählte Verteilungen 403
Index 407