Discussion Paper 4

Methoden und Gütekriterien. Computergestützte Diskurs- und Inhaltsanalysen zwischen Sozialwissenschaft und Automatischer Sprachverarbeitung

Sebastian Dumm & Andreas Niekler

Zusammenfassung

Die sozialwissenschaftlichen Methoden der Diskurs- und Inhaltsanalyse sind in ihrer Verarbeitungskapazität von großen Textmengen beschränkt. Mit den Verfahren der Automatischen Sprachverarbeitung können aber auch große Textmengen zur Beantwortung sozialwissenschaftlicher Fragestellungen eingesetzt werden. Das vorliegende Paper geht erstens der Frage nach, wie die Methoden der Sozialwissenschaft mit den Verfahren der Automatischen Sprachverarbeitung kombiniert werden können, und zweitens, wie bei einer solchen Kombination eine adäquate Qualitätssicherung mit Gütekriterien vorgenommen werden kann. Zur Beantwortung werden die Grundlagen der qualitativen und quantitativen Methoden der Diskurs- und Inhaltsanalyse und des Text Mining sowie deren Gütekriterien vorgestellt. Am Forschungsdesign des Projekts ePol wird beispielhaft eine Kombination der angesprochenen Methoden und Verfahren demonstriert und deren Qualitätssicherung dargestellt. Abschließend wird ein dreischrittiges Vorgehen zur Identifikation eines Forschungsdesigns in der computergestützten qualitativen und quantitativen Inhaltsanalyse vorgeschlagen.

Abstract

Methods of discourse and content analysis in Social Sciences are limited in their processing capacity regarding the amounts of text. The usage of computational methods like Natural Language Processing and Machine Learning allow for examination of Social Science questions with large digital document collections. Following this premise this paper discusses two questions. How should a researcher combine methods of Computer Science and Social Science? How to ensure appropriate quality criteria for quality management of the research process. To answer these questions the paper describes the foundations of qualitative and quantitative methods for discourse and content analysis. Furthermore, it discusses relevant methods of Natural Language Processing, Text Mining and Machine Learning. Quality criteria for each method are discussed and a methodology for an integrated research design is proposed. An example application, the ePol project, is shown with respect to quality assurance in computational qualitative and quantitative content analysis. Finally, a three step approach is proposed to develop computational qualitative and quantitative content analysis research designs.

Download hier/here.

1 Kommentar » Schreibe einen Kommentar

  1. Pingback: From keyword searching to concept mining – Pim Huijnen's blog

Hinterlasse eine Antwort

Pflichtfelder sind mit * markiert.


Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>