Information oder Lärm? – eine selbstverständliche bzw. nicht selbstverständliche Unterscheidung

Geschriebenes

Musik, Sprache und Geräusche sind im Grunde genommen bloss Moleküle, die sich in der Luft hin- und herbewegen. Die Schwingungen erzeugen Druckwellen, die von unserem Gehör aufgenommen und interpretiert werden.

Wie ein Kieselstein, den man ins Wasser wirft, verursacht jeder Klang Wellen, die sich in konzentrischen Kreisen in alle Richtungen ausbreiten. Die Wellen bewegen sich durch den Raum und klatschen gegen unser Ohr. Wir hören also nicht den Stein selbst, sondern nur die Materie, die durch den Stein in Bewegung gesetzt worden ist.

Freilich sind es nicht nur Kieselsteine, die Wellen verursachen. Wenn ein Schiff vorbeifährt oder ein Kind im Wasser plantscht, werden ebenfalls Wellen erzeugt, die gleichermassen in unsere Hörmuschel schwappen. Weil wir allerdings nur die Wellen und nicht die Ursache selbst wahrnehmen können, ist es gar nicht so einfach zu unterscheiden, ob nun ein Kiesel, ein Schiff oder ein Kind dieses Geräusch erzeugt hatte, das wir eben wahrgenommen haben.

Unser Gehirn hat gelernt, Geräusche zu unterschieden, indem es in jedem Klang ein bestimmtes Muster erkennt und die individuelle Stärke und Frequenz der Wellen mit ihrem Erzeuger assoziiert. Während ein Schiff einige wenige, grosse und gleichförmige Wellen verursacht, löst ein plantschendes Kind mehrere kleinere und unregelmässigere Wellen aus.

Es geht aber noch einen Schritt weiter. Wenn wir uns in einer lauten Bar auf die Stimme eines Freundes konzentrieren oder am Bahnhof die Lautsprecherdurchsage inmitten des Bremslärms eines Interregios wahrnehmen, zeigt sich: Wir können nicht nur einzelne Klänge interpretieren, sondern gleichzeitige Geräusche differenzieren, einzelne Quellen priorisieren und andere ausblenden.

Anders als auf einer spiegelglatten Wasseroberfläche lassen sich in einer lauten Umgebung wie in einer Bar oder an einem Bahnhof die Geräusche nicht isoliert wahrnehmen. Verschiedene Wellenmuster aus unterschiedlichen Richtungen fliessen ineinander, vermischen und beeinflussen sich und bewegen sich als grobe Strömung mit rauer Oberfläche in unsere Hörmuschel.

Sprachassistenten und -programme sind mittlerweile in der Lage, akkurat die physikalischen Geräuschwellen aufzuzeichnen und zu übersetzen. Ihre hohe Fehlerquote kommt aber davon, dass sie in einer Bar Mühe haben, die Worte des Gegenübers vom Streitgespräch des Tisches nebenan zu unterscheiden oder die Klangwellen der Lautsprecherdurchsage aus dem Bremslärm herauszufiltern.

Die Schwierigkeit, vor der die Ingenieure stehen, ist also nicht mehr die Aufzeichnung von Klängen – da haben Mikrofone die Leistungsfähigkeit des menschlichen Hörorgans schon weit übertroffen. Die Problemstellung liegt darin, Geräuschquellen voneinander zu unterscheiden. Das Hindernis liegt in der Trennung von Hintergrund und Fokus, von Wesentlichem und Nebensächlichen, von Information und Lärm.

Nur dummerweise wissen wir nicht genau, wie diese Unterscheidung tatsächlich funktioniert. Wir machen dies automatisch.


Titelbild: Illustration aus “Lectures on Ventilation” von Lewis W. Leeds, 1869. (Quelle)
Animationen: Courtesy of Dr. Dan Russell, Grad. Prog. Acoustics, Penn State. (Quelle – CC BY-NC-ND 4.0)