Diese Website verwendet Cookies
Dieses Forum verwendet Cookies um deine Login-Daten zu speichern (sofern du registriert bist) bzw. deinen letzten Aufenthaltsort (wenn nicht registriert und eingeloggt). Cookies sind kleine Textdateien, die auf deinem Rechner gespeichert werden. Die von diesem Forum gespeicherten Cookies werden ausschließlich für Zwecke dieses Forums verwendet und nicht von Dritten ausgelesen. Sie stellen kein Sicherheitsrisiko für deinen Rechner dar. Cookies werden in diesem Forum auch verwendet, um die Anzeige bereits gelesener und noch ungelesener Themen zu unterscheiden.
Siehe auch unsere Datenschutzerklärung. Bitte bestätige, ob du Cookies zulassen willst oder nicht.

Ungeachtet deiner Entscheidung wird ein anonymer Cookie gespeichert, um zu vermeiden, dass du bei jedem Besuch erneut entscheiden musst. Du kannst deine Entscheidung jederzeit ändern.

Tröten statt tweeten: Kommt auf unsere Mastodon-Instanz linguisten.info.




Erledigt: 25.09.2024, 05:54:26 Phonologische Schreibweise auf Betonungen untersuchen
#1
Erledigt: 25.09.2024, 05:54:26
 
Hallo



Ich habe eine Wortliste mit Einträgen in diesem Format:



...

Gelderwerbs#Geld·er·werbs#ˈɡɛltʔɛɐ̯ˌvɛʁps

Geldes#Gel·des#ˈɡɛldəs

Geldfälscher#Geld·fäl·scher#ˈɡɛltˌfɛlʃɐ

...ˈ



Jede Zeile enthält also ein Wort, die Silbentrennung und die phonologische(?) Schreibweise.



Ich möchte nun die Liste auf das Vorkommen von Anapästen untersuchen, also dreisilbigen Wörtern, deren erste beiden Silben unbetont und die letzte betont ist.



Hat hier jemand eine Idee, wie man das formalisieren könnte? Ich müsste nur die Logik wissen, aber mir fällt da nichts ein ausser dass man die phonologische Schreibweise selbt in Silben zergliedern könnte, aber ich weiss nicht, ob und wie das geht. Ich mache das nur aus Spass ohne entsprechenden Bildungshintergrund.



Eine Liste mit Daktylen habe ich bereits erstellt, weil da ist die Logik einfach (Die phonologische Schreibweise muss einfach mit einem "Betonungszeichen" (Apostroph) beginnen und danach kein weiteres enthalten und das Wort muss dreisilbig sein.)



Jamben und Trochäen sind ebenfalls einfach umzuzusetzen, nur am Anapäst scheitere ich, weil mir nicht einfällt wie man ihn von dreisilbigen Wörtern abgrenzen kann, deren erste Silbe nicht betont ist, aber deren zweite (statt wie gesucht die dritte).



Vielleicht hat ja jemand eine Idee.
Zitieren Zum Seitenanfang
#2
 
Schau mal, ob dir die Ausführungen hier weiterhelfen:
https://grammis.ids-mannheim.de/systemat...matik/2344
https://grammis.ids-mannheim.de/systemat...matik/2346
https://grammis.ids-mannheim.de/systemat...matik/2347
https://grammis.ids-mannheim.de/systemat...matik/2348
https://grammis.ids-mannheim.de/systemat...matik/2349

Die Kernaussage ist denke ich (mitlesende Germanist:innen mögen mich korrigieren): Mit 100%iger Genauigkeit lässt sich die Wortbetonung generell nicht bestimmen und es gibt mehrdeutige Fälle wie "umfahren", aber es lassen sich Heuristiken finden. Als Linguist:innen würden man hier normalerweise mit Dingen wie dem Silbengewicht, Moren, Skelettpositionen, Onset-Maximixierung usw. arbeiten und/oder sich der Optimalitätstheorie bedienen. Aber vielleicht findest du für dich auf Basis der verlinkten Ausführungen Ansatzpunkte, die in der Praxis für dein Korpus gut funktionieren.
Zitieren Zum Seitenanfang
#3
 
Danke, die Links und deine Antwort bestätigen meine Vermutung, dass das nicht ohne solide Kenntnisse der deutschen Sprache geht, insofern hat mir das sehr geholfen, weil dann lese ich mir die Links zur Allgemeinbildung durch und weniger im Hinblick auf mein Vorhaben. Es scheint unmöglich zu sein.

Die Wortbetonung hat ja, soweit mich mein Sprachgefühl da nicht täuscht, nicht nur einen Spielraum, sondern sie ist im gesprochenen Wort auch feiner aufgefächert es die starren Hebungen und Senkungen (in der Analyse von Lyrik) suggerieren. Mir fehlt insofern auch etwas das Verständnis der Relevanz solcher Metrik, kommt es doch eigentlich auf das Gesprochene an. Aber doch wollte ich mal schauen, wie viele Anapäste es im Wörterbuch hat.

Muss das Ganze nochmals durchdenken, vielleicht geht ja irgendwie doch etwas. Jedenfalls danke für die Antwort!
Zitieren Zum Seitenanfang
#4
 
In einem guten Aussprachewörterbuch ist in der Lautschrift auch die Betonung (Haupt- und Nebenbetonung) angegeben. Die kann man dann vermutlich schon auszählen.
Zitieren Zum Seitenanfang
#5
 
(19.09.2023, 09:30:57)janwo schrieb: In einem guten Aussprachewörterbuch ist in der Lautschrift auch die Betonung (Haupt- und Nebenbetonung) angegeben. Die kann man dann vermutlich schon auszählen.

Ich habe mein Wörterbuch anhand der Einträge bei Wiktionary erstellt, dort ist auch immer die Aussprache angegeben. Es hat 800'000 Einträge. Wahrscheinlich hat das mehr Fehler als etwas etwa aus dem Duden-Verlag, aber das Kernproblem ist ja, dass ich nicht weiss, wie ich das Wörterbuch auf Anapäste untersuchen kann, weil sich das m. E. nicht so einfach formalisieren lässt wie die Suche nach Jambus, Trochäus und Daktylus. Oder vielleicht eben doch und ich sehe es nur gerade nicht, wie simpel das ist.
Zitieren Zum Seitenanfang
#6
 
Ich befürchte, ich kann zur Lösung des eigentlichen Problems nichts beitragen, aber ich würde nochmal eine Rückfrage der Klarheit halber einwerfen:

In deinem Korpus sind die Betonungen markiert, oder? Es geht dir also nicht darum, bei einem Wort ohne markierte Betonungen herauszufinden, wie es betont wird, sondern es geht um die rein informatische Fragestellung, wie man dem Computer sagt "Erkenne Wörter der Form X.X.'X " (wobei X für eine beliebige Silbe steht).

Ich glaube nämlich, da ist ein Missverständnis entstanden: Wenn man die Lautschrift aus Wiktionary ins Forum kopiert, wie du es vermutlich getan hast, landet das Betonungszeichen auf (Hauptakzent) bzw. unter (Nebenakzent) dem folgenden Buchstaben und ist dadurch in deinen Beispielen teils unkenntlich geworden.

Also ˈɡɛltʔɛɐ̯ˌvɛʁps = 'gɛltʔɛɐ̯ˌ,vɛʁps mit Haut- und Nebenakzent markiert.

Zitieren Zum Seitenanfang
#7
 
(19.09.2023, 13:15:19)Jon.Schnee schrieb: Ich befürchte, ich kann zur Lösung des eigentlichen Problems nichts beitragen, aber ich würde nochmal eine Rückfrage der Klarheit halber einwerfen:

In deinem Korpus sind die Betonungen markiert, oder? Es geht dir also nicht darum, bei einem Wort ohne markierte Betonungen herauszufinden, wie es betont wird, sondern es geht um die rein informatische Fragestellung, wie man dem Computer sagt "Erkenne Wörter der Form X.X.'X " (wobei X für eine beliebige Silbe steht).

Ich glaube nämlich, da ist ein Missverständnis entstanden: Wenn man die Lautschrift aus Wiktionary ins Forum kopiert, wie du es vermutlich getan hast, landet das Betonungszeichen auf (Hauptakzent) bzw. unter (Nebenakzent) dem folgenden Buchstaben und ist dadurch in deinen Beispielen teils unkenntlich geworden.

Also ˈɡɛltʔɛɐ̯ˌvɛʁps = 'gɛltʔɛɐ̯ˌ,vɛʁps mit Haut- und Nebenakzent markiert.

Hallo,

ja, genau so ist es. Ich habe eine Liste der Wiktionary-Einträge, wo die phonologische Schreibweise inkl. Haupt- und Nebenbetonungen bereits enthalten ist. Und diese Schreibweise möchte ich nun auf Anapäste untersuchen, also unbetont, unbetont, Hauptbetonung und suche dazu nach Möglichkeit eine simple Logik, die ich bisher übersehen habe. Oder aber ich muss es genauer formulieren, wonach das Programm suchen muss und bräuchte dazu Regeln der Sprache bzw. der phonologischen Schreibweise. Letzteres halte ich für schwer umsetzbar, aber ich habe immer noch die Hoffnung, dass ich einfach etwas simples nicht sehe und man die Anapäste ganz einfach auslesen kann.

Stimmt, mir ist diese Umformatierung nach dem Kopieren auch aufgefallen, aber ich habe sie ignoriert. In meiner Liste haben Haupt- und Nebenbetonung ein eigenes Zeichen (ein Apostroph und ein Komma (bzw. sowas ähnliches)) und stehen jeweils vor dem Zeichen, welches betont werden soll. Sie sind also ganz leicht auslesbar. Die Daktylen habe ich etwa gefunden, indem ich dem Programm gesagt habe, es solle schauen, ob das erste Zeichen eine Hauptbetonung ist und ob danach kein weiteres Betonungszeichen mehr folgt. Falls ja, ist es ein Daktylus. (Wobei ich gerade nicht weiss, was es mit den Nebenbetonungen auf sich hat, also ob diese in diesem binären System von Hebung und Senkung auch eine Hebung darstellen.)
Zitieren Zum Seitenanfang
#8
 
Du suchst also nach Wörtern mit mindestens 3 Silben, das sollte in Wiktionary eigentlich eine eigene Kategorie sein.
Wenn nicht, kann man auch eigentlich nach den Sprechsilben suchen. Das müsste (wenn denn) als Punkte zwischen den Silben notiert sein. Dann kann man nach so einem String suchen xx.xx.'xx
Zitieren Zum Seitenanfang
#9
 
Die anderen haben ja schon erklärt, wie man vorgehen müsste. Wenn es auch ein anderes Korpus als deine bisherige Liste sein darf, schlage ich Celex vor, welches bereits entsprechende Annotationen enthält, die man direkt abfragen kann: http://celex.mpi.nl/

Hier mal ein paar Treffer (für "StrsPat" == 001 und SylCnt == 3):
Code:
Word\StrsPat\SylCnt
addiziert\001\3
adoptierst\001\3
akklamierst\001\3
akquiriert\001\3
aligniert\001\3
amnestiert\001\3
avanciert\001\3
benedeist\001\3
decodiert\001\3
defilierst\001\3
1
Zitieren Zum Seitenanfang
#10
 
Ok danke euch, werde mir die Vorschläge anschauen.
Zitieren Zum Seitenanfang


Social bookmarks & quicklinks
Permalink: https://linguisten.de/t5645

Möglicherweise verwandte Themen...
Thema Verfasser Antworten Ansichten Letzter Beitrag
  ich suche spannende Themen, soziolinguistische, mediendidaktisch in Bezug auf Ling. lysann. 1 868 29.11.2023, 08:35:53
Letzter Beitrag: janwo
  [Bib] Fachsprache untersuchen; Wie? lenalenalena 1 1.907 26.11.2019, 13:32:21
Letzter Beitrag: Willi Wamser
  Herkunftsbezeichnung auf -er Asfaloth 4 4.790 05.08.2017, 09:44:34
Letzter Beitrag: Hans Landberner


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste