|
Vorwort |
5 |
|
|
Danksagung |
6 |
|
|
Inhaltsverzeichnis |
7 |
|
|
Autoren |
12 |
|
|
Notation |
14 |
|
|
Teil IEinführung, Konzept und Grundlagen |
15 |
|
|
Kapitel 1Einführung |
16 |
|
|
1.1 Motivation |
16 |
|
|
1.2 Daten und Studientypen |
17 |
|
|
1.3 Modelle und ihre Beurteilung |
19 |
|
|
1.4 Inhalt |
20 |
|
|
Literaturverzeichnis |
21 |
|
|
Kapitel 2 CRISP-DM - Ein Konzept für die journalistischeDatenanalyse? |
22 |
|
|
2.1 Motivation und Methodik |
22 |
|
|
2.2 Begriffsbildung |
23 |
|
|
2.2.1 Datenjournalismus |
23 |
|
|
2.2.2 Data Mining und KDD |
24 |
|
|
2.2.3 Qualität im Datenjournalismus |
25 |
|
|
2.3 Beschreibung der Arbeitsabläufe |
26 |
|
|
2.3.1 Data-Mining-Prozess CRISP-DM |
26 |
|
|
2.3.2 Typische datenjournalistische Arbeitsschritte |
29 |
|
|
2.4 Wie ähnlich sind datenjournalistischer Arbeitsprozess undCRISP-DM? |
31 |
|
|
2.4.1 Interviews als Informationsgrundlage |
32 |
|
|
2.4.2 Die Ergebnisse |
33 |
|
|
2.5 Kann CRISP-DM eine sinnvolle Leitlinie für denDatenjournalismus sein? |
37 |
|
|
2.6 Zusammenfassung und Fazit |
39 |
|
|
2.7 Diskussion |
40 |
|
|
Literaturverzeichnis |
40 |
|
|
Kapitel 3 Data Literacy |
42 |
|
|
3.1 Einleitung |
42 |
|
|
3.2 Was ist Data Literacy? |
44 |
|
|
3.3 Wertschöpfung aus Daten |
46 |
|
|
3.4 Daten und Unsicherheit |
47 |
|
|
3.5 Operationalisierung: das DaCoNet-Konzept |
51 |
|
|
3.6 Fazit: Data Literacy ist ein Prozess! |
52 |
|
|
3.7 Diskussion |
53 |
|
|
Literaturverzeichnis |
53 |
|
|
Kapitel 4Datengrafiken zwischen Nutzwert und Design |
56 |
|
|
4.1 Wozu wir Grafiken benötigen |
56 |
|
|
4.2 Grafiken nutzerzentriert denken und entwickeln |
57 |
|
|
4.3 Inhaltliche Qualität |
59 |
|
|
4.4 Hochwertige Gestaltung |
63 |
|
|
4.5 Angemessener Kontext |
65 |
|
|
4.6 Diskussion |
67 |
|
|
Literaturverzeichnis |
67 |
|
|
Kapitel 5 Algorithmen im Fokus |
69 |
|
|
5.1 Einführung |
69 |
|
|
5.2 Recherchen zu Algorithmen |
70 |
|
|
5.3 Wie Algorithmen arbeiten und dazulernen |
71 |
|
|
5.4 Die zentralen Fragen an Algorithmen |
72 |
|
|
5.5 Diskussion |
75 |
|
|
Literaturverzeichnis |
76 |
|
|
Teil IIFallstudien |
78 |
|
|
Kapitel 6(Bedingte) Verteilung und statistische Tests |
79 |
|
|
6.1 Fallstudie 1: Altersstruktur von Parlamenten |
79 |
|
|
6.2 Re-Analyse |
80 |
|
|
6.3 Zusammenfassung |
88 |
|
|
6.4 Diskussion |
89 |
|
|
Literaturverzeichnis |
89 |
|
|
Kapitel 7Zusammenhangsanalyse: Klassifikation |
90 |
|
|
7.1 Fallstudie 2: Abschneiden der AfD bei der Bundestagswahl2017 |
90 |
|
|
7.2 Re-Analyse |
91 |
|
|
7.3 Zusammenfassung |
99 |
|
|
7.4 Diskussion |
100 |
|
|
Literaturverzeichnis |
100 |
|
|
Kapitel 8Zusammenhangsanalyse: Regression |
101 |
|
|
8.1 Fallstudie 3: Wählerstruktur bei der Bundestagswahl 2017 |
101 |
|
|
8.2 Die Analyse von Zeit Online |
102 |
|
|
8.3 Re-Analyse |
108 |
|
|
8.4 Vergleich und Diskussion |
113 |
|
|
8.5 Zusammenfassung |
114 |
|
|
8.6 Diskussion |
114 |
|
|
Kapitel 9 Zeitreihenanalyse: Modellentwicklung über die Zeit |
116 |
|
|
9.1 Fallstudie 4: Corona (COVID-19) Pandemie |
116 |
|
|
9.2 Generelles Vorgehen |
117 |
|
|
9.3 Gesamtanzahl Infizierter: Obergrenze und Stagnation |
121 |
|
|
9.4 Anzahl Neuinfizierte |
127 |
|
|
9.5 Reproduktionszahl |
133 |
|
|
9.6 Zusammenfassung und Schlussfolgerung |
138 |
|
|
9.7 Nachher weiß man immer alles besser? |
139 |
|
|
9.8 Kommentar von Marie-Louise Timcke:Das Corona-Datenchaos: „Netflix & Bug fixing“ |
140 |
|
|
Literaturverzeichnis |
143 |
|
|
Kapitel 10Gruppenbildung: Clusteranalyse |
144 |
|
|
10.1 Fallstudie 5: Buchbestsellerlisten |
144 |
|
|
10.2 Generelles Vorgehen |
145 |
|
|
10.3 Analyse von Hardcover Belletristik |
148 |
|
|
10.3.1 Längste und beste Karrieren |
148 |
|
|
10.3.2 Glättung |
149 |
|
|
10.3.3 Clusterbildung |
150 |
|
|
10.3.4 Interpretation der Cluster |
150 |
|
|
10.3.5 Einordnung von Buchtiteln in Cluster |
154 |
|
|
10.4 Analyse von Hardcover Sachbuch |
156 |
|
|
10.4.1 Längste und beste Karrieren |
156 |
|
|
10.4.2 Glättung |
157 |
|
|
10.4.3 Clusterbildung |
158 |
|
|
10.4.4 Interpretation der Cluster |
158 |
|
|
10.4.5 Einordnung von Buchtiteln in Cluster |
161 |
|
|
10.5 Vergleich von Belletristik und Sachbuch |
162 |
|
|
10.6 Diskussion |
164 |
|
|
Kapitel 11 Sequentielle Daten: Analyse vonRadverkehrsnetzen |
167 |
|
|
11.1 Fallstudie 6: Radwege in Berlin |
167 |
|
|
11.2 GPS-Koordinaten |
168 |
|
|
11.3 Nutzung des Radnetzes |
173 |
|
|
11.4 Identifikation der Lücken im Radnetz |
176 |
|
|
11.5 Zusammenfassung |
179 |
|
|
11.6 Kommentar von Hendrik Lehmann |
179 |
|
|
Literaturverzeichnis |
181 |
|
|
Kapitel 12Datenerhebung: Verwendung von Vorwissen |
182 |
|
|
12.1 Datenerhebung |
182 |
|
|
12.2 Verwendung von Vorwissen |
183 |
|
|
12.3 Fallstudie 7: Professorenumfrage |
184 |
|
|
12.4 Die E-Mail-Umfrage |
184 |
|
|
12.4.1 Gesamtarbeitszeit |
185 |
|
|
12.4.2 Summe von Teilarbeitszeiten |
185 |
|
|
12.4.3 Ausschluss-Kriterien |
187 |
|
|
12.5 Statistische Methoden |
189 |
|
|
12.5.1 Prognoseintervalle frequentistisch |
189 |
|
|
12.5.2 Relevantes Vorwissen |
190 |
|
|
12.5.3 A-priori Verteilungen |
192 |
|
|
12.5.4 A-posteriori Verteilungen |
193 |
|
|
12.5.5 Prognoseintervalle Bayesianisch |
193 |
|
|
12.5.6 Empirische Bayes-Methode am Beispiel |
194 |
|
|
12.6 Ergebnisse |
196 |
|
|
12.6.1 Gesamtschätzung der wöchentlichen Arbeitszeit |
196 |
|
|
12.6.2 Summierter wöchentlicher Zeitaufwand |
197 |
|
|
12.7 Weitere Ergebnisse |
199 |
|
|
12.8 Zusammenfassung |
199 |
|
|
12.9 Kommentar von Holger Wormer |
200 |
|
|
Literaturverzeichnis |
201 |
|
|
Kapitel 13Geplante Studien |
202 |
|
|
13.1 Motivation und Zielsetzung |
202 |
|
|
13.2 Geplante Studien in der Wirtschaftsjournalistik:Wirkungunterschiedlicher Medien |
202 |
|
|
13.3 Statistische Versuchsplanung |
204 |
|
|
13.4 Fallstudie 8: Art der Präsentation |
207 |
|
|
13.5 Diskussion |
211 |
|
|
Literaturverzeichnis |
212 |
|
|
Teil IIIQualitätsstandards |
213 |
|
|
Kapitel 14Datenethik im Journalismus |
214 |
|
|
14.1 Berührungspunkte von Datenethik, Datenwissenschaftenund Journalismus |
214 |
|
|
14.2 Die Sonderrolle von Zahlen und Fakten |
216 |
|
|
14.3 Für datenbezogenen Journalismus relevante Ziffern desPressekodex |
217 |
|
|
14.4 Fazit |
225 |
|
|
14.4 Fazit |
225 |
|
|
14.5 Diskussion |
225 |
|
|
Literaturverzeichnis |
226 |
|
|
Kapitel 15Qualitätsstandards: Checklisten als Hilfsmittel |
228 |
|
|
15.1 Einleitung: Studien und Experten - eine Wissenschaft fürsich? |
228 |
|
|
15.2 Nicht nur für Investigativjournalisten: Arbeitstechnikender strukturierten journalistischen Recherche |
229 |
|
|
15.3 Experten-Checkliste: Wenn man Daten nicht bewertenkann, dann wenigstens den Datenproduzenten |
231 |
|
|
15.4 Studien-Checkliste: Daten und Publikationen nachformalen Kriterien prüfen |
235 |
|
|
15.5 Fazit: Was Journalisten und was Datenjournalisten vonDaten, Studien undWissenschaft mindestens wissen sollten |
240 |
|
|
15.6 Diskussion |
241 |
|
|
Literaturverzeichnis |
243 |
|
|
Anhang ADaten und R-Programme |
245 |
|
|
A.6 Kapitel 6: Fallstudie 1: Altersstruktur von Parlamenten |
246 |
|
|
A.6.1 Daten |
246 |
|
|
A.6.2 R-Programm |
248 |
|
|
A.7 Kapitel 7: Fallstudie 2: Abschneiden der AfD bei derBundestagswahl 2017 |
254 |
|
|
A.7.1 Daten |
254 |
|
|
A.7.2 R-Programm |
259 |
|
|
A.8 Kapitel 8: Fallstudie 3: Wählerstruktur bei derBundestagswahl 2017 |
261 |
|
|
A.8.1 Daten |
261 |
|
|
A.8.2 R-Programm |
262 |
|
|
A.9 Kapitel 9: Fallstudie 4: Corona (COVID-19) Pandemie |
263 |
|
|
A.9.1 Daten |
263 |
|
|
A.9.2 R-Programm |
264 |
|
|
A.10 Kapitel 10: Fallstudie 5: Buchbestsellerlisten |
270 |
|
|
A.10.1 Daten |
270 |
|
|
A.10.2 R-Programm |
288 |
|
|
A.11 Kapitel 11: Fallstudie 6: Radwege in Berlin |
293 |
|
|
A.11.1 Daten |
293 |
|
|
A.11.2 R-Programm |
310 |
|
|
A.12 Kapitel 12: Fallstudie 7: Professorenumfrage |
319 |
|
|
A.12.1 Daten |
319 |
|
|
A.12.2 R-Programm |
321 |
|
|
Sachverzeichnis |
327 |
|