Discussion Paper 3

Argumentmarker. Definition, Generierung und Anwendung im Rahmen eines semi-automatischen Dokument-Retrieval-Verfahrens

Sebastian Dumm & Matthias Lemke

Zusammenfassung

Für den Einstieg in eine computergestützte Suche nach Argumenten in großen Textdatenmengen sind sogenannte harte Markerwörter erforderlich, die zwei Bedingungen erfüllen müssen: Mit Blick auf die computergestützte Suche muss sichergestellt sein, dass das Vorhandensein eindeutig vordefinierter Ein- oder Mehrworteinheiten automatisch durchführbar ist. In linguistischer Hinsicht müssen die Markerwörter einen Argumentationszusammenhang anzeigen, der einen Bezug zwischen Grund und Folge herstellt. Die Anwendung der Liste harter Markerwörter auf eine nach inhaltlichen Gesichtspunkten zusammengestellte Dokumentenkollektion ermöglicht ein Scoring dieser Dokumente. Damit werden diejenigen Texte, die aufgrund einer hohen Frequenz harter Markerwörter eine hohe Wahrscheinlichkeit für inhaltlich einschlägige Argumentationszusammenhänge erwarten lassen, primär für ein Close Reading vorgeschlagen. Der im Zuge des Close Readings durchzuführende Annotationsprozess ermöglicht dann die Identifikation weicher Markerwörter. Das sind in der Regel Mehrworteinheiten, deren Vorhandensein das Latentwerden von Argumentation und somit die Hegemonie eines bestimmten Deutungsrahmens auf sprachlicher Ebene anzeigt.

Abstract

A computerized search for arguments in large amounts of text data requires hard marker words, which must meet two conditions: With regard to the computer-assisted search, it must be ensured that the presence of clearly pre-defined single- or multi-word-units can be carried out automatically. In linguistic terms, the marker words must display an argumentation that establishes a relationship between cause and effect. The application of the list of hard marker words on a document collection – put together according to a specific content – allows a scoring of these documents. Those texts that, due to a high frequency of hard marker words, promise a high probability of content-relevant argumentation can then be primarily considered for a close reading. The annotation process to be carried out in the course of close reading then allows the identification of soft marker words. These are usually multi-word-units whose presence indicates the increasing latency of argumentation, that is the hegemony of a particular frame of reference on a linguistic level.

Download hier/here

Hinterlasse eine Antwort

Pflichtfelder sind mit * markiert.


Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>