Frequenzanalyse und Diktionäransatz

Download Paper-Vollversion

Im Sinne des Blended-­Reading-­Ansatzes ist Text Mining ein modularer Prozess. Dieser setzt sich aus verschiedenen computergestützten Analyseverfahren und von der Forscherin / dem Forscher zu leistenden Interpretationen von Einzeltexten zusammen. Blended Reading nimmt – was die computergestützten Verfahren anbelangt – eine analytisch-prozedurale Gewichtung vor, die von einfachen, strukturierenden, hin zu komplexeren, inhaltlich tragfähigen Verfahren reicht. Frequenzanalyse und der auf ihr aufbauende Diktionäransatz sind basale Operationen des Text Mining, die am Anfang der Auswertung einer unstrukturierten Textdatenmenge stehen. Indem sie Wortverwendungen in ihrer Häufigkeit abhängig vom Zeitverlauf abbilden, dienen sie dazu, große Textdatenmengen entlang der binären Logik „Wort vorhanden / Wort nicht vorhanden“ zu strukturieren. Somit beinhaltet die Frequenzanalyse zwei strukturierende, im Wesentlichen deskriptive Leistungen:

  1. Sie ermöglicht auf zwei unterschiedliche Arten (Verlaufskurve und Heatmap) die Visualisierung des Auftretens eines Wortes im Zeitverlauf und kann – tagesgenau – anzeigen, wann ein Wort oder eine Mehrworteinheit im Korpus vorkommt.
  2. Damit sind erste Rückschlüsse auf die Verwendung eines Wortes oder einer Mehrworteinheit in der politischen Öffentlichkeit möglich: Treten in einem Zeitabschnitt Häufungen auf, so könnte der fragliche Begriff zum entsprechenden Zeitpunkt entweder besonders relevant oder auch besonders umstritten gewesen sein. Im zeitlichen Längsschnitt lassen sich Konjunkturen einer Debatte identifizieren. Es ergeben sich Einstiegspunkte für das Close Reading, die erst durch Text Mining Verfahren sichtbar werden.

Beide Analyseleistungen zusammen erleichtern die (zeitliche) Datenstrukturierung und ermöglichen weitere Analyseschritte.

eTMM_1_Cover

Ein Doppelklick auf das Cover öffnet das Paper als pdf auf einer separaten Seite.

Hinterlasse eine Antwort

Pflichtfelder sind mit * markiert.


Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>