eTMV

Was ist eTMV?

Im Sinne des Blended-Reading-Ansatzes (Lemke/Stulpe 2015) ist Text Mining ein modularer Prozess. Dieser setzt sich aus verschiedenen computergestützten Analyseverfahren und von der Forscherin / dem Forscher zu leistenden Interpretationen von Einzeltexten zusammen. Blended Reading nimmt – was die computergestützten Verfahren anbelangt – eine analytisch-prozedurale Gewichtung vor, die von einfachen, strukturierenden, hin zu komplexeren, inhaltlich tragfähigen Verfahren reicht.

Die ePol Text Mining Verfahren (eTMV) stellen in kurzen, in sich abgeschlossenen Einheiten die verschiedenen Analyseverfahren des Leipzig Corpus Miners (LCM) vor (Wiedemann/Niekler 2014). Zur Illustration der Verfahren verwenden alle fünf Module dieser Serie Beispiele aus dem Kontext des Diskurses um die Nutzung der Atomenergie in Deutschland. Ziel der eTMV ist es, für interessierte SozialwissenschaftlerInnen eine best practise der Verwendungsmöglichkeiten und -grenzen von Text Mining anhand des LCM zu veranschaulichen – auch wenn bislang keine Vorerfahrungen mit Text Mining bestehen. Die einzelnen Module sind zu finden unter:

Frequenzanalyse und Diktionäransatz
Kookurrenzanalyse
Topic Modelle
Annotation und Klassifikation
Sentimentanalyse

Der Datenbestand des ePol-Projekts besteht aus 3.495.822 deutschsprachigen Zeitungsartikeln, die sich wie folgt zusammensetzen: Frankfurter Allgemeine Zeitung (Stichprobe, 1959–2011, 200.389 Artikel), Süddeutsche Zeitung (6027 Ausgaben, 1992–2011, 1.505.714 Artikel), die tageszeitung (7821 Ausgaben, 1986–2012, 1.391.981 Artikel) und Die Zeit (3841 Ausgaben, 1946–2012, 397.729 Artikel). Für die Funktionalität aller Analysen einschlägig ist Wiedemann, Gregor / Niekler, Andreas (2014): Analyse qualitativer Daten mit dem Leipzig Corpus Miner, Hamburg / Leipzig (=Schriftenreihe des Verbundprojekts Postdemokratie und Neoliberalismus Discussion Paper 5).

Hinterlasse eine Antwort

Pflichtfelder sind mit * markiert.


Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>