Neue Rubrik “eTMV”

Illustration und Erläuterung unserer Text Mining Verfahren. ePol-Homepage erweitert (Teil 3).

eTMM_1_CoverIm Sinne des Blended-Reading-Ansatzes (Lemke/Stulpe 2015) ist Text Mining ein modularer Prozess. Dieser setzt sich aus verschiedenen computergestützten Analyseverfahren und von der Forscherin / dem Forscher zu leistenden Interpretationen von Einzeltexten zusammen. Blended Reading nimmt – was die computergestützten Verfahren anbelangt – eine analytisch-prozedurale Gewichtung vor, die von einfachen, strukturierenden, hin zu komplexeren, inhaltlich tragfähigen Verfahren reicht.

Die ePol Text Mining Verfahren (eTMV) stellen in kurzen, in sich abgeschlossenen Einheiten die verschiedenen Analyseverfahren des Leipzig Corpus Miners (LCM) vor (Wiedemann/Niekler 2014). Zur Illustration der Verfahren verwenden alle fünf Module dieser Serie Beispiele aus dem Kontext des Diskurses um die Nutzung der Atomenergie in Deutschland. Ziel der eTMV ist es, für interessierte SozialwissenschaftlerInnen eine best practise der Verwendungsmöglichkeiten und -grenzen von Text Mining anhand des LCM zu veranschaulichen – auch wenn bislang keine Vorerfahrungen mit Text Mining bestehen.

Erschienen ist das Paper zu “Frequenzanalyse und Diktionäransatz” (1/5), das Paper zu “Kookkurrenzanalyse” (2/5) kommt am 19.10.2014. Die drei weiteren Papiere zu “Topic Modellen” (3/5), “Annotation und Klassifikation” (4/5) und zu “Sentimentanalyse” erscheinen in den kommenden Wochen.

Neue Rubrik “Paper & Co”

ePol-Homepage erweitert (Teil 2).

Auf der Homepage von ePol findet sich eine neue Rubrik: Unter der Überschrift “Paper & Co” informieren wir künftig fortlaufend über den Output und die Ergebnisse unseres Projekts. Neben Informationen zu Vorträgen, Präsentationen und Presseinhalten gibt es eine chronologisch sortierte Liste von Papern, Artikeln oder Buchpublikationen, die aus dem Projektkontext hervorgegangen sind. Wo möglich, haben wir Links zu digital verfügbaren Inhalten hinterlegt. Damit wird der Weg vom Suchen zum Finden so kurz wie nur irgendwie möglich.

Analyse qualitativer Daten mit dem Leipzig Corpus Miner (LCM)

Discussion Paper Nr. 5 jetzt online.

Der Text mit dem Titel “Analyse qualitativer Daten mit dem Leipzig Corpus Miner” ist ab sofort unter dem Menüpunkt Discussion Paper zum Download verfügbar. Gregor Wiedemann und Andreas Niekler beschreiben darin die Grundlagen und verschiedenen Funktionalität des Leipzig Corpus Miners (LCM). Der LCM ist eine Webanwendung, die verschiedene Text Mining Verfahren für die Analyse großer Mengen qualitativer Daten bündelt. Durch eine einfach zu bedienende Benutzeroberfläche ermöglicht der LCM Volltextzugriff auf 3,5 Millionen Zeitungstexte, die nach Suchbegriffen und Metadaten zu Subkollektionen gefiltert werden können. Auf dem Gesamtdatenbestand sowie auf den Subkollektionen können verschiedene computergestützte Auswertungsverfahren angewendet und zu Analyseworkflows kombiniert werden. Damit ermöglicht der LCM die empirische Analyse sozialwissenschaftlicher Fragestellungen auf Basis großer Dokumentkollektionen, wobei qualitative und quantitative Analyseschritte miteinander verschränkt werden können.