Im Sinne des Blended-Reading-Ansatzes ist Text Mining ein modularer Prozess. Dieser setzt sich aus verschiedenen computergestützten Analyseverfahren und von der Forscherin / dem Forscher zu leistenden Interpretationen von Einzeltexten zusammen. Blended Reading nimmt – was die computergestützten Verfahren anbelangt – eine analytisch-prozedurale Gewichtung vor, die von einfachen, strukturierenden, hin zu komplexeren, inhaltlich tragfähigen Verfahren reicht. Frequenzanalyse und der auf ihr aufbauende Diktionäransatz sind basale Operationen des Text Mining, die am Anfang der Auswertung einer unstrukturierten Textdatenmenge stehen. Indem sie Wortverwendungen in ihrer Häufigkeit abhängig vom Zeitverlauf abbilden, dienen sie dazu, große Textdatenmengen entlang der binären Logik „Wort vorhanden / Wort nicht vorhanden“ zu strukturieren. Somit beinhaltet die Frequenzanalyse zwei strukturierende, im Wesentlichen deskriptive Leistungen:
- Sie ermöglicht auf zwei unterschiedliche Arten (Verlaufskurve und Heatmap) die Visualisierung des Auftretens eines Wortes im Zeitverlauf und kann – tagesgenau – anzeigen, wann ein Wort oder eine Mehrworteinheit im Korpus vorkommt.
- Damit sind erste Rückschlüsse auf die Verwendung eines Wortes oder einer Mehrworteinheit in der politischen Öffentlichkeit möglich: Treten in einem Zeitabschnitt Häufungen auf, so könnte der fragliche Begriff zum entsprechenden Zeitpunkt entweder besonders relevant oder auch besonders umstritten gewesen sein. Im zeitlichen Längsschnitt lassen sich Konjunkturen einer Debatte identifizieren. Es ergeben sich Einstiegspunkte für das Close Reading, die erst durch Text Mining Verfahren sichtbar werden.
Beide Analyseleistungen zusammen erleichtern die (zeitliche) Datenstrukturierung und ermöglichen weitere Analyseschritte.