@inproceedings{broll-schneider-2023-empirische,
title = {Empirische Verortung konzeptioneller N{\"a}he/M{\"u}ndlichkeit inner- und au{\ss}erhalb schriftsprachlicher Korpora},
author = "Broll, Sarah and
Schneider, Roman",
editor = "Schneider, Roman and
Gertrud, Faa{\ss}",
booktitle = "Journal for Language Technology and Computational Linguistics, Vol. 36 No. 1",
month = may,
year = "2023",
address = "unknown",
publisher = "German Society for Computational Lingustics and Language Technology",
url = "https://preview.aclanthology.org/jlcl-multiple-ingestion/2023.jlcl-1.7/",
doi = "10.21248/jlcl.36.2023.240",
pages = "113--150",
abstract = {Linguistische Studien arbeiten h{\"a}ufig mit einer Differenzierung zwischen gesprochener und geschriebener Sprache bzw. zwischen Kommunikation der N{\"a}he und Distanz. Die Annahme eines Kontinuums zwischen diesen Polen bietet sich f{\"u}r eine Verortung unterschiedlichster {\"A}u{\ss}erungsformen an, inklusive unkonventioneller Textsorten wie etwa Popsongs. Wir konzipieren, implementieren und evaluieren ein automatisiertes Verfahren, das mithilfe unkorrelierter Entscheidungsb{\"a}ume entsprechende Vorhersagen auf Textebene durchf{\"u}hrt. F{\"u}r die Identifizierung der Pole definieren wir einen Merkmalskatalog aus Sprachph{\"a}nomenen, die als Markierer f{\"u}r N{\"a}he/M{\"u}ndlichkeit bzw. Distanz/Schriftlichkeit diskutiert werden, und wenden diesen auf prototypische N{\"a}he-/M{\"u}ndlichkeitstexte sowie prototypische Distanz-/Schrifttexte an. Basierend auf der sehr guten Klassifikationsg{\"u}te verorten wir anschlie{\ss}end eine Reihe weiterer Textsorten mithilfe der trainierten Klassifikatoren. Dabei erscheinen Popsongs als {\quotedblbase}mittige Textsorte{\textquotedblleft}, die linguistisch motivierte Merkmale unterschiedlicher Kontinuumsstufen vereint. Weiterhin weisen wir nach, dass unsere Modelle m{\"u}ndlich kommunizierte, aber vorab oder nachtr{\"a}glich verschriftlichte {\"A}u{\ss}erungen wie Reden oder Interviews vollkommen anders verorten als prototypische Gespr{\"a}chsdaten und decken Klassifikationsunterschiede f{\"u}r Social-Media-Varianten auf. Ziel ist dabei nicht eine systematisch-verbindliche Einordung im Kontinuum, sondern eine empirische Ann{\"a}herung an die Frage, welche maschinell vergleichsweise einfach bestimmbaren Merkmale ({\quotedblbase}shallow features{\textquotedblleft}) nachweisbar Einfluss auf die Verortung haben.}
}
Markdown (Informal)
[Empirische Verortung konzeptioneller Nähe/Mündlichkeit inner- und außerhalb schriftsprachlicher Korpora](https://preview.aclanthology.org/jlcl-multiple-ingestion/2023.jlcl-1.7/) (Broll & Schneider, JLCL 2023)
ACL