Dieses Forum verwendet Cookies
Dieses Forum verwendet Cookies um deine Login-Daten zu speichern (sofern du registriert bist) bzw. deinen letzten Aufenthaltsort (wenn nicht registriert und eingeloggt). Cookies sind kleine Textdateien, die auf deinem Rechner gespeichert werden. Die von diesem Forum gespeicherten Cookies werden ausschließlich für Zwecke dieses Forums verwendet und nicht von Dritten ausgelesen. Sie stellen kein Sicherheitsrisiko für deinen Rechner dar. Cookies werden in diesem Forum auch verwendet, um die Anzeige bereits gelesener und noch ungelesener themen zu unterscheiden. Bitte bestätige, ob du Cookies zulassen willst oder nicht.

Ungeachtet deiner Entscheidung wird ein anonymer Cookie gespeichert, um zu vermeiden, dass du bei jedem Besuch erneut entscheiden musst. Du kannst deine Entscheidung jederzeit ändern.

Metahilfe: Was wir hier (nicht) tun - Informationen zum Thema Fragen und Hilfen im Forum.

Du kennst dich aus? — Prima. Unser Fragenbeantwortungs-Team freut sich immer über engagierte Verstärkung!



[CoLi]: Computerlinguistik, ling. Datenverarbeitung, KI  » nicht erledigtSignifikanztests in der Korpuslinguistik
18.02.2016, 23:27:28,
Beitrag #1
Signifikanztests in der Korpuslinguistik
Liebe Linguisten-Community,

wie ist die Verwendung von Signifikanztests bei Korpusanalysen einzuschätzen? Sollte man diese Tests verwenden oder lieber darauf verzichten?
Ein einfaches Beispiel: Angenommen ich untersuche den Sprachgebrauch von Männern und Frauen, habe hierzu zwei unterschiedlich lange Teilkopora und finde dann das Wort lovely in einem Korpus 150 Mal und im anderen nur 50 Mal. Nun kann ich zunächst mal relative Frequenzen vergleichen. Aber sollte man darüber hinaus statistische Assoziationsmaße wie Chi-Square oder log-lokelihood-ratio verwenden, um zu prüfen ob das Ergebnis statistisch signifikant ist?
Ich habe in mehreren Korpusstudien die Anwendung solcher Tests gelesen, kenne aber auch Stellungnahmen dagegen (zum Beispiel sind die auftretenden Wörter nicht normalverteilt).

Vielen Dank für euere Antworten und eventuell für Anregungen zu alternativen VerfahrenLächel

ZitierenReturn to top
19.02.2016, 13:53:35,
Beitrag #2
RE: Signifikanztests in der Korpuslinguistik
(18.02.2016, 23:27:28)Coseriana schrieb: Liebe Linguisten-Community,

wie ist die Verwendung von Signifikanztests bei Korpusanalysen einzuschätzen? Sollte man diese Tests verwenden oder lieber darauf verzichten?
Ein einfaches Beispiel: Angenommen ich untersuche den Sprachgebrauch von Männern und Frauen, habe hierzu zwei unterschiedlich lange Teilkopora und finde dann das Wort lovely in einem Korpus 150 Mal und im anderen nur 50 Mal. Nun kann ich zunächst mal relative Frequenzen vergleichen. Aber sollte man darüber hinaus statistische Assoziationsmaße wie Chi-Square oder log-lokelihood-ratio verwenden, um zu prüfen ob das Ergebnis statistisch signifikant ist?
Ich habe in mehreren Korpusstudien die Anwendung solcher Tests gelesen, kenne aber auch Stellungnahmen dagegen (zum Beispiel sind die auftretenden Wörter nicht normalverteilt).

Vielen Dank für euere Antworten und eventuell für Anregungen zu alternativen VerfahrenLächel

Ob und welchen Signifikanztest Du verwendest, hängt davon ab, welche Hypothese Du untersuchen möchtest. Der Chi Quadrat Test kann ja wie im Beispiel dazu genutzt werden, um zu überprüfen, ob in einer Stichprobe ein Wort häufiger vorkommt als in einer anderen. Die LLR kann ja dazu verwendet werden, um zu überprüfen, ob zwei Wörter häufiger zusammen vorkommen, als es bei Normalverteilung der Fall wäre. Gerade bei solch komplexen Entscheidungen wird man mit relativen Frequenzen nicht sonderlich weit kommen. Zu den Voaraussetzungen der genannten Tests gehört ja ein bestimmter Stichprobenumfang: soweit ich mich erinnere, sind es für den Chi Quadrat Test fünfzig Einheiten und für die LLR fünf. Ab dieser Schwelle sind diese Tests gegenüber Nicht-Normalverteilung relativ robust, d.h. hat einen zu vernachlässigenden Einfluss.
Das wusstest Du wahrscheinlich bereits, aber ab hier kann man sich vielleicht besser daraüber unterhalten, wo das eigentliche Problem liegt.


Hier könnte PeterSilie's Signatur stehen...
ZitierenReturn to top


Möglicherweise verwandte Themen...
ThemaVerfasserAntwortenAnsichtenLetzter Beitrag
  Einführungslektüre Korpuslinguistik Molosso_08 2 2.031 25.09.2016, 14:59:51
Letzter Beitrag: Molosso_08
  Umfangreiche Themen in der Korpuslinguistik? FlorianAir 3 3.378 14.01.2015, 02:33:48
Letzter Beitrag: FlorianAir

Gehe zu:

This forum uses Lukasz Tkacz PHP Developer addons.
Forum use Krzysztof "Supryk" Supryczynski addons.