Bereits während des zweiten Weltkriegs, begann die U.S. Air Force die Sprachverständlichkeit zu untersuchen und zu messen. Im Mittelpunkt stand das Ziel, dass Piloten trotz Motorenlärm und Kehlkopfmikrophonen, einander in allen Situationen bestmöglich verstehen konnten.

In den vergangenen 20 Jahren, haben Wissenschaftler Computerinterfaces zur Spracherkennung entwickelt, mit dem Ziel, die Tastatur zu ersetzten. Neueste Resultate dieser Entwicklung finden sich in Produkten wie Siri, Alexa, Google Assistant, Cortana, ChatGPT usw.

Durch neueste Erkenntnisse ist bekannt, dass hohe Signalqualität und gleichmässige Schallverteilung nur ein Teil davon sind, was ein Beschallungssystem zur guten Sprachverständlichkeit leisten muss. Forschung der Multisensorischen Wahrnehmung deckten eine sehr komplexe Beziehung zwischen dem was wir sehen und dem was wir hören auf, welche Mass und Geschwindigkeit der Sprachverständlichkeit steuern.

Die Sinneswahrnehmung von Musik oder Sprache ist unterschiedlich. Musik wird am besten wahrgenommen, wenn man von ihr umhüllt und eingebettet wird. Klangqualität in Kombination mit einer angemessenen Nachhallzeit sind Hauptfaktoren zum guten Erlebnis. Die genauen Einzelpositionen der Instrumente sind von untergeordneter Bedeutung.

Eine Sprachdarbietung wir dagegen am besten wahrgenommen, wenn rasch eine eindeutige und stabile Position des Sprechers ausgemacht werden kann, die sich klar von der Umgebung abhebt. Unter diesen Umständen ist das Gehirn Sprache sofort verstehen und ist nicht damit beschäftigt, mehrdeutige Reize (Sinneseindrücke) zu differenzieren (Geringere Höranstrengung, besseres Verständnis usw.). Direkte Kommunikation auf kurze Distanz von Angesicht zu Angesicht, ist der ultimative Massstab. Wenn diese Übertragungsqualität erreicht wird, so wird Sprache mit angemessener Sprachverständlichkeit zum Zuhörer übertragen.

Eine gute Sprachverständlichkeit ist in vielen Bereichen von grosser Wichtigkeit. Bereits im Kindergarten ist gute Sprachverständlichkeit wichtig, um die Sprachkompetenz der Kinder zu entwickeln und zu fördern. Noch anspruchsvoller wird es bei fremdsprachigen Kindern. Dieses Beispiel zeigt, dass Sprachverständlichkeit nicht nur bei elektronisch verstärktem Schall, sondern auch im Raum, von Angesicht zu Angesicht oder auf Distanz von grosser Wichtigkeit ist. Dabei bliebt das Kommunikationsmodell unabhängig vom Übertrags Kanal oder sogar miteinander verketteten Kommunikationskanälen immer gleich.

Quantifizierung der Sprachverständlichkeit

Bis vor einigen Jahren, wurde die Sprachverständlichkeit von Testpersonen mittels Listen ein- und mehrsilbiger Wörter gemessen. Die Wörter wurden im zu Prüfenden Raum vorgelesen und von Zuhörenden aufgeschrieben. Die Problematik ist offensichtlich, denn je nach Sprechqualifikation, wurde besser oder schlechter artikuliert. Wurden die Texte über Lautsprecher abgespielt, kamen Verfälschungen durch die Wiedergabe im Raum hinzu. Mit der Zeit wurden verschiedene Verfahren entwickelt, damit die Sprachverständlichkeit mit schalltechnischen Messungen quantifiziert werden kann. Die zwei heute meist verwendeten Verfahren sind der STI, der Speech Transmission Index, zusätzliche mit dem vereinfachten Verfahren RASTI dem Rapid Speech Transmission Index, sowie das früher entwickelte Verfahren ALcons%, was für Articulation Loss in Prozent steht.

Die Verfahren  sind sehr unterschiedlich und lassen sich lediglich mit einer Näherungsformel vergleichen. Der Hauptunterschied besteht darin, dass es sich beim STIPA um ein logarithmisches und bei ALcons% um ein lineares Verfahren handelt. Oft geschehen dadurch Irrtümer und Missverständnisse, so wie beispielsweise beim Schalldruck, der in Dezibel, einem logarithmischen Mass, gemessen wird.

Ein STI von 0.7 bedeutet im Vergleich zum ALcon% nie eine Sprachverständlichkeit von 70%!

Der empfolene Minimalwert von 0.5 beim STI entspricht beim ALcons& einem linearen Verlust von 12%!

Unabhängig von Nutzung und Zweck, die Sprachverständlichkeit hängt von der akustischen Qualität eines Raums ab. Mit dem passenden Massnahmenmix nebst anderen Faktoren, stellt der Akustiker  die akustische Qualität bedarfsgerecht ein.

Unabhängig davon, ob die Sprachverständlichkeit mit sprechenden Personen oder schalltechnisch gemessen wird. gibt es weitere Faktoren zu berücksichtigen:

Entscheidend ist der Unterschied zwischen Mensch und Messtechnik. Der Mensch hört zweiohrig, wodurch zwei unterschiedliche Hörereignisse entstehen. Im Wahrnehmungsprozess werden die Zeit-, Pegel und Spektralunterschiede zu einem Ereignis, der auditiven Wahrnehmung  zusammengesetzt. Schalltechnisch mit jedoch nur einem Messmikrophon gemessen. Will heissen, die psychische Leistung des zweiohrigen Hörens und die individuelle, hörphysiologische Verfassung, werden nicht berücksichtigt.

Der Unterschied lässt sich einfach mit dem sogenannten Cocktail-Party-Effekt beschreiben. Es ist die Fähigkeit, ein akustisches Ereignis, ein einzelnes Hörobjekt, korrekt in seinem Kontext, der Hörumwelt, wahrzunehmen. Es ist die Fähigkeit eine Schallquelle eine Schallquelle aus dem aus dem Gesamtschall herauszufiltern. Durch Subtraktion der störenden Umgebung, kann  der Direktschall gehört werden.   Um fähig zu sein, den Einfluss der Umgebung vom Gesamthörereignis abzuziehen muss man umgekehrt lernen die Umgebung zu fühlen. Nur so ist man fähig die Raumantwort wahrzunehmen und sie zu Subtrahieren. Dies geschieht dadurch, dass selbst ein Geräusch erzeugt wird.

  • Wenn man zuhört, subtrahiert man die Umgebung. Das nennt sich „passives Hören“
  • Wenn man selbst Schall erzeugt, dann fühlt man die Umgebung. Das nennt sich „aktives Hören“

Seit einiger Zeit wird ein zweikanaliges Messverfahren entwickelt, das der menschlichen Hörwahrnehmung näher kommen soll, damit die Lücke zwischen Wahnehmung und technischer Akustik idealerweise eliminiert wird.