Anmerkungen zur Restauration historischer Tonaufnahmen (W. Näser 8/2k1)

Anmerkungen zur Restauration historischer Tonaufnahmen

von Wolfgang NÄSER, Marburg

Historische Aufnahmen von Sprache und Musik sind umso reizvoller und herausfordernder, je älter sie sind. Die Beschäftigung mit ihnen ist nicht, wie es auf den ersten Blick scheinen könnte, eine Spielerei, sondern wissenschaftliches und künstlerisches Desiderat. Im Gegensatz zu Textdrucken und Malerei sind Foto, Film und Ton relativ junge Medien, die es dann zu retten gilt, wenn sie besonders wichtige Ereignisse, Trends, Persönlichkeiten darstellen und repräsentieren. Das ist so in der Kunst, aber auch und gerade in der Wissenschaft - zumal wenn es um Mundarten geht, von denen jedes Zeugnis der phonetischen Realisierung um so wertvoller ist, je früher es entstand: wir denken hier auch und gerade an solche Mundarten, die aufgrund historisch-politischer Ereignisse für immer erstorben sind. Alte Tonaufnahmen sind auch dazu angetan, möglicherweise falsche Vorstellungen zu Aussprache und Intonation zu korrigieren, sofern dies auf der Basis bescheiden(st)er Tonqualität überhaupt möglich ist.

Somit wären wir bei unserem Schwerpunkt, der historischen Mundart-Tonaufnahme. Es gibt sie seit etwa 100 Jahren, genau genommen seit 1899, als das Wiener Phonogramm-Archiv seinen Dienst aufnahm. Kaiser Franz Josefs berühmte Aufnahme vom 2. August 1903 in Bad Ischl gehört, wie ich zu beweisen versuchte, zu den ältesten noch verwertbaren Tondokumenten. Ferdinand WREDEs Aussagen zu Sprache und Nationalität (1926) gehören ebenso in unsere Schatztruhe wie ein großer Teil des - leider politisch belasteten - Lautdenkmals reichsdeutscher Mundarten (1936/37), mit dem in unserer Reihe zum ersten Male eine schon als modern bezeichenbare Tontechnik in Erscheinung tritt. In qualitativer Hinsicht gehören zu unserer Gruppe auch viele Aufnahmen, die in den 50er und 60er Jahren unter besonders schlechten Bedingungen entstanden oder von denen wir nur sehr schlechte Kopien besitzen, die jedoch von hohem Wert sind für Forschung und Lehre.

Dieser Wert kommt dann zum Tragen, wenn die alten bzw. unzureichend gepflegten Tondokumente so aufbereitet werden, daß ihr Anhören nicht nur informativ, sondern auch rezeptionsästhetisch optimal ist. Das Prinzip des prodesse et delectare (nützen und erfreuen) gilt auch und gerade hier; technisch umgesetzt, bedeutet dies

minimalen Störpegel (Rauschen, Knistern, Schaben, Kratzen)
angenehmes, ausgewogenes Klangbild (z.B. nicht zu viele Bässe)
optimale Verständlichkeit (der informationsrelevanten Laute und Lautkombinationen)
zügigen Sprachfluß (nur kurze interverbale Pausen)

Die Erreichbarkeit dieser Ziele hängt ab vom tatsächlichen oder objektiven Informationsgehalt der Aufnahme. Dieser ist umgekehrt proportional zum Störpegel; d.h.: alles, was darunter liegt, ist physikalisch und informationstechnisch verloren. Ich kann nur das auswerten, was vorhanden ist, und muß jederzeit damit rechnen, daß, wie wir noch sehen werden, der Vorteil einer korrigierenden Maßnahme mit einem davor nicht vorhandenen Nachteil einhergeht.

Je älter die Aufnahme ist, desto mehr brauche ich an Erfahrung, Aufwand und Mühe. Ab und zu jedoch stößt man bei "alten" Einspielungen auf eine frappant gute Qualität, so beim "Lautdenkmal" z.B. im Falle von Berlin, Danzig, Elbing, Ebsdorf b. Marburg oder Tilsit - alles Aufnahmen von 1937, jedoch schon an die spätere UKW-Qualität erinnernd. Abgesehen von solchen unerwarteten Glücksfällen bedeutet es immer eine Menge anstrengender, zeitraubender Arbeit, eine Reihe von Samples wie die meiner Themenseite zum Lautdenkmal zu erstellen. Jene Aufnahmen ebenso wie die bereits erwähnten (Wrede u.a.) fungieren als Beispiele für Ergebnisse und Hinweise aus meiner bisherigen Praxis. Ich denke dabei nicht an erste Gehversuche ab 1959, sondern an die PC-orientierte Zeit ab etwa 1995, als ich begann, auf einem 486SX66 mit einer bescheidenen Festplatte von nur 170 MB und dem Programm Sound Forge 2.0 die ersten Tondateien zu editieren, und dabei erstaunt feststellte, wie einfach es doch im Grunde war bzw. ist, selbst einzelne bedeutungsrelevante Laute wie das [v] in /Schweißen/ aus dem Sprachkontinuum zu entfernen bzw. in einen Wortkörper einzufügen, wie ich es 5 Jahre später ganz vereinzelt auch in einer Opern-Edition unternahm, um undeutliche oder beim Singen unterdrückte Laute zu ihrem Recht kommen zu lassen.

Der Sound-Editor ist sozusagen ein akustischer Setz-Kasten für alle Arten kreativer Tongestaltung. Wie beim Textgestalten bedeutet Editieren auch hier Löschen, Verschieben, alle Arten von Verändern: ich unterscheide hierbei

textuelle (informationelle) Manipulationen
(a) klangverbessernde bzw. (b) räumlich verändernde Maßnahmen

Obzwar ausnahmslos die dokumentarische Integrität bzw. wissenschaftliche Authentizität verletzend, sind Textmanipulationen dann nötig, wenn z.B. hochpolitische Aussagen zu tilgen sind, um ein Tondokument wie die Berliner Aufnahme des "Lautdenkmals" als dialektrepräsentatives Sample auch der Nachwelt fruchtbar zu machen. Da ist von einem "Sturmlokal" die Rede, von Horst Wessel usw.. Ich muß die inkriminierbaren bzw. peinlichen Passagen so tilgen, daß der Sprachfluß nicht beeinträchtigt wird; das Resultat kann sich hören lassen, allerdings nur im sprachwissenschaftichen Rahmen, hat es doch seine historisch-politische Echtheit und damit den Charakter eines Zeitzeugnisses mindestens zum Teil verloren.

Der Bearbeiter bzw. Verwalter historischer Tonaufnahmen steht somit immer vor der Alternative,

unter dem Postulat historischer Authentizität auf Kosten der Rezeptionsästhetik die originale Klangqualität ausnahmslos zu belassen (dokumentarisches Verwalten) oder
durch akustische und editorische Eingriffe in das Tondokument dessen Intention und Aussage zu verstärken und das Hörerlebnis im ästhetischen Sinne zu optimieren (künstlerisches Nachschöpfen)

Nicht zuletzt aus didaktischen Gründen habe ich mich bei allen hier angeführten Hörproben für den zweiten Weg entschieden.

Klangverbessernde Maßnahmen bilden den handwerklich-editorischen Alltag des Tonaufnahme-Restaurators. Sofern ausnahmslos nach [2a] vorgegangen wird, bleibt die informationelle und damit historische Gültigkeit erhalten; ein wenig angekratzt werden würde sie, käme ich etwa auf die Idee, eine der Lautdenkmals-Aussagen z.B. durch Verhallung in ein anderes, verfremdendes Klangfeld zu versetzen, z.B. ein klerikales Environment, wie es durch einen Klangfeldprozessor (Hardware) oder vom Sound-Editor spielend leicht erzeugt werden kann. Hitler oder Goebbels würden dann z.B. in einer Kirche oder einem Kloster sprechen statt in einer Open-Air-Arena, das gäbe Anlaß für jede Menge Spekulationen. Gerade weil heute derartige Manipulationen möglich sind (und dazu die textuellen!), besteht zunehmend Zweifel an der Echtheit bestimmter "historisch-dokumentarischer" Tonaufnahmen; verändert sich hier das Hintergrundgeräusch innerhalb des Redeflusses abrupt, so dürfte kein Zweifel daran bestehen, daß unzulässig "geschnitten" wurde.

Alle Arten der Klangmanipulation erfordern Zusatz-Module in Gestalt von Programm-Bibliotheken bzw. Plug-ins; Editoren wie das hervorragende Cool Edit 1.2a haben einen reichhaltigen "Werkzeug-Satz" an Bord, bieten aber die Möglichkeit, beliebig viele externe Module als Direct-X oder VST anzubinden, so z.B. Kompressoren, Limiter, parametrische Equalizer u.a. Fasziniert von der Vielfalt des Angebots und der Möglichkeiten, spielt der Anfänger zunächst mit allerhand z.T. funktionsgleichen Plug-Ins herum, bis sich herauskristallisiert, welche Programmteile bzw. Module am besten arbeiten und zu unserem Kern-Equipment gehören. Man kann davon ausgehen, daß z.B. Cool Edit Pro 1.2a bereits alle wesentlichen Werkzeuge enthält; vom Funktionsumfang her bedeutet das den Gegenwert einer alle Raffinessen bietenden Studio-Hardware im Werte von 100.000 DM oder mehr, noch vor 20 Jahren alleiniges Mittel des kreativen Masterings. Der komplexe Sound-Editor bedeutet nicht nur unvorstellbare Platzersparnis, sondern auch eine Kostenreduktion um 80 % oder mehr. Betrachten wir den Hardware-Aufwand von der Aufnahme über das Mastering bis zur Produktion, so vereint heute sogar schon ein Notebook wie das Gericom Overdose S 14.1" TFT für rund 4.200 DM alle prozeduralen Funktionsbausteine in sich, vorausgesetzt, die steuernde Software (Sound-Editor, Brennprogramm) ist an Bord.

Zur Praxis

I. Was z.B. das Statement Kaiser Franz Josefs I. von 1903 angeht, meinen bisher schwierigsten Fall, so dürfte aus dem zugehörigen Text hervorgehen, welche Schwierigkeiten ich Ende 1999 in mehreren Schritten bis Anfang 2000 damit hatte, aus meiner Cassettenkopie so viel an Information herauszuholen, bis ich, in Ermangelung des bereits erstellten Textes transkriptorisch "nachschöpfend", das meiste verstehen und niederschreiben konnte.

Ich habe das Ganze noch einmal durchgeführt, nach anderthalb Jahren zusätzlicher Erfahrung, und dann einige der Schritte vorgenommen, die meinen Lautdenkmals-Samples zu mehr Durchhörbarkeit und Klarheit verholfen haben. Ergebnis sind Neubearbeitungen vom 15.9. und 1.12.2001: in ersterer gelangt nicht nur als Direct-X-Plugin SONIC FOUNDRYs Noise Reduction 2.0a (versuchsweise u.a. 2x hintereinander) zum Einsatz, sondern auch der in Cool Edit Pro 1.2a enthaltene Hard Limiter; in der neuesten verwendete ich alternativ das neue WAVES(tm)-Plugin X-Noise, das in diesem Falle nicht besser abschneidet und des Kaisers Stimme seltsam nebelhaft abbildet.

Eine weitere Neubearbeitung vom 17.2.2002 bemühte Dart Pro 32, WAVES(tm)-X-Noise, SONIC FOUNDRYs Noise Reduction und wiederum den Hard Limiter (-2 / +4 dB). Zwar wurde hierbei ein SNR bis etwa 48 dB (!) erreicht, doch klingt (wie auch bei ausschließlich Cool-Edit-internen Verfahren festgestellt) die Stimme nach extremer Rauschunterdrückung seltsam vernebelt, distanziert und verhallt, so daß sich bei kritisch-distanziertem Vergleichshören letzlich die "alte" 3.Version von Anfang 2000 trotz ihrer Zischel-Störungen als die natürlichste, direkteste, "zupackendste" erweist. Fazit aus allem: irgendwann ist nichts mehr zu gewinnen, ohne andere Parameter (unverzichtbare Klangmerkmale) zu gefährden.

Erwogen hatte ich auch schon eine etwas absonderlich und keck anmutende Methode, unserem Franz Josef I. zu unerwartetem akustischem Glanz zu verhelfen, und das ginge so: /f/, /s/, /sch/, /t/ und ggf. andere formantkritische Laute werden in allen möglichen Umgebungen aus einer anderen, von Alter und Timbre her möglichst ähnlichen neuzeitlichen Stimme isoliert und dienen als dateienmäßige Bausteine, als Fundus, um an passender Stelle in den Sprachfluß eingefügt zu werden. Der jeweilige Obertongehalt der Fremdbausteine ist so weit zu reduzieren, daß der Verfremdungseffekt minimiert wird. Das Einkopieren von Korrektur- oder Substitutionslauten ließe sich dadurch vereinfachen, daß beim Editieren jeweils eine bestimmte, programmiertechnisch zugeordnete Taste gedrückt wird (z.B. s für /s/, S für /sch/ usw.), der PC würde somit teilweise zur akustischen Schreibmaschine.

II. Nun zur bereits erwähnten Wrede-Rede, einem Beispiel für die bis ins letzte Detail verfeinerte mechanische (=Phonographen-)Aufnahme. Hier ist folgendes festzustellen:

die in den PC einkopierte Originalkopie (Minidisk) ist zwar stark verknistert, klingt jedoch kernig und zupackend; die Modulations-Hüllkurve weist aus, daß auch alle Grundtöne unreduziert zur Verfügung stehen, das bedeutet volle Sonorität.
um das starke Knistern zu reduzieren, kann ich alternativ oder in Kombination
(a) Clicks und Pops ggf. in mehreren Durchgängen herausfiltern,
(b) anhand eines automatisch ermittelten Noise Floors ein definiertes De-Hissing vornehmen und /oder
(c) die Click-Oberwellen durch ein steilflankiges Filter (Butterworth oder Chebychev Typ 1) abschneiden
oder
(d) das Sample mit möglichst hohem Kompressionsgrad (bis 70 oder 100) zu *.mp3 oder *.ra konvertieren, das hat die Wirkung eines entsprechenden Filters, und / oder zusätzlich
(e) in manuellem Editing mit Zeitachsen-Zooming einzelne Clicks, Pops und sonstige Störungen entfernen.
Filtermaßnahmen nach [2b] und [2c] verflachen den Stimmklang, lassen Wrede möglicherweise wie durch einen Schalltrichter sprechen, während die stark datenreduzierende Konversion zu *.ra einen relativ dumpfen Mittelwellen-Klang erzeugt. Ähnlich arbeitet (im Audition mode) der hochgelobte Declicker von Steinberg. Klar, daß bei starker Höhenreduktion und daher Beschneidung des Obertonspektrums die überwiegend hochfrequenten Clicks von selbst verschwinden.
Letztlich muß ich entscheiden zwischen zwei grundsätzlichen rezeptionsästhetischen Konzepten:
(a) weitgehender objektive akustischer Echtheit (angenommener natürlicher Stimmklang vor Aufnahme) oder
(b) einer ins Kreativ-Künstlerische gehenden Bearbeitung als Abbild einer in bestimmten Situationen (Schalltrichter nach Aufnahme) angenommenen 'virtuellen' Realität.

Ich habe mich mit der zweiten Bearbeitung vom 11.8.2001 für [4b] entschieden; ausschlaggebend war die in dieser "Grammophon-Fassung" herrschende Ruhe in den Sprechpausen. Die schlank mensurierte Stimme bekommt zudem etwas Feierliches, an eine Vorlesung Erinnerndes, das die Wichtigkeit des Gesagten unterstreicht.

Bei der dritten Bearbeitung vom 14./15.9.2001 bin ich folgendermaßen vorgegangen:

Einladen der Original-Bandkopie (DAT) in Cool Edit Pro 1.2a: SNR = 20 dB
Dreimal Tschebycheff-Bandpaß (18. Ordnung) 150...3500 Hz, SNR = 27 dB
Declicking "Constant Hiss & Crackle": ca. 177.000 Clicks fixed, 0 rejected, SNR = 29 dB
Sonic Foundry Noise Reduction mit ca. 85 % NR und ca. 8 dB High Shell Gain 3,1 kHz, wenig Wirkung
Normalizing 95 %
Dreimal Declicking nach Option 2 "Lots of Hiss & Crackle": 1240 /1176 /1285 Clicks fixed
Sonic Foundry NR mit Maximaleinstellung NR und ca. 8 dB High Shell Gain 3,1 kHz; SNR = 36 dB
Manuelles Tilgen einiger Pausen-Clicks / -Pops
Normalizing 93 %
Abspeichern als *.wav
Mit Real Enc. 3.1 Encoding mit 8,5 kbps
-------- Nachbearbeitung 1 (15.9.2k1) ---------
Re-Konversion von *.ra zu *.wav
Sonorisierung: 2 x Parametr. Equalizer, 216 Hz + 8dB zur Verstärkung der 1. Grundton-Harmonischen
Normalizing 95 %
Anheben einiger relevanter Passagen im letzten Drittel der Aufnahme; SNR jetzt ca. 33 dB
Abspeichern als *.wav
Real Enc. 3.1, 8,5 kbps
--------- Nachbearbeitung 2 (18.9.2k1) -------
aus (13) erhaltene *.wav behandelt mit dem virtuellen Röhren-Kompressor (und Limiter) T-Rack S 2.0
Real Enc. 3.1, 8,5 kbps
--------- Nachbearbeitung 3 (24.9.2k1) --------
Einlesen der in (18) erhaltenen Version
manuelles Löschen einiger Störimpulse und Absenken interverbaler Pegel
manuelles Kürzen der interverbalen Pausen zur Verbesserung des Redeflusses
Real Enc. 3.1, 8,5 kbps

Auf Dynamik-Kompression wurde zunächst verzichtet, weil sonst die nicht entfernbaren, weil die Nutzmodulation durchsetzenden Klicken, Rauschen und Rumpeln mit angehoben worden wären. Die (im Gegensatz zur zweiten) mit nur 8,5 kbps encodierte Fassung klingt dennoch durchsichtig und bietet damit ein Maximum an Lesbarkeit bzw. Information.

Die am 15.9. nachträglich vorgenommene Sonorisierung gibt der Stimme etwas Warmes, Zupackendes und reduziert etwas die Merkmale der typischen "Grammophon"-Aufnahme; allerdings wird durch eine solche Maßnahme immer das Hintergrund-Rumpeln mit angehoben. Um diesen Effekt zu begrenzen, muß zuvor die eigentliche Stimmgrundfrequenz durch einen geeigneten Bandpaß weggefiltert werden.

Die am 18.9.2k1 mit T-Rack S 2.0 in virtuellem Röhrenverstärker-Klang erstellte Datei klingt noch zupackender, sonorer als ihre Vorläuferin. Durch die Dynamik-Kompression wird das Grund-Geräusch (Schleifen und Rumpeln) lauter, stört jedoch nicht den wirklichkeitsnäheren Gesamteindruck.

Die am 24.9.2k1 vorgenommenen Manipulationen sind ästhetischer Natur; das Kürzen interverbaler Pausen dient der Verbesserung des Sprachflusses und damit der rhetorischen Wirkung, verletzt allerdings das Prinzip der Authentizität. Trotz aller Bearbeitungsschritte verbleiben einige Rumpelstörungen innerhalb der Nutzmodulation, überlagern also bestimmte Laute oder Lautkombinationen, die bei einer Tilgung mitentfernt würden.

III. Mit dem "Lautdenkmal" betreten wir, wie schon angedeutet, die Ära der elektrischen Tonaufnahme; als Schallwandler fungieren sehr gute Kohlequerstrom-, Bändchen- oder gar Kondensatormikrofone, letztere erreichen schon in den dreißiger Jahren quasi UKW-taugliche Frequenzgänge. Das der Schneidkennlinie entsprechend "entzerrte" Audiosignal gelangt über einen klirrarmen Gegentakt-Leistungsverstärker auf den als Schneidstichel wirkenden Saphir oder Diamanten, der die Auslenkungen der Modulation in eine Wachsmatrize oder Schallfolie ritzt; die professionelle Technik erzielt Frequenzgänge, mit denen alle Sprach-Formanten zu ihrem Recht kommen. Mit elektrodynamischen Leicht-Tonabnehmern lassen sich solche hochwertigen Aufnahmen schon kurz vor dem 2. Weltkrieg adäquat abtasten; Fritz KÜHNE berichtet, man habe bereits mit Mehrweg-Studiolautsprechern experimentiert und eine HiFi-taugliche Übertragungsstrecke aufgebaut. In diese Zeit fallen auch die ersten Versuche kopfbezogener Stereophonie, und im Jahre 1943 machte die damalige Reichsrundfunkgesellschaft auf einem AEG-Magnetophon mit neuentwickeltem Zweispur-Kopf die ersten Stereo-Tonbandaufnahmen der Geschichte.

Das sechs Jahre zuvor realisierte Lautdenkmal bedeutet einen Meilenstein auf diesem steilen Erfolgsweg. Eingesetzt wurde ein spezieller Aufnahmewagen der Firma Telefunkenplatte G.m.b.H., Abt. Spezialaufnahmen, Hallesches Ufer 30, Berlin SW 11. Es wurden Wachsmatrizen geschnitten; Zahl und Adressaten der Pressungen sind mir nicht bekannt.

Sehr gute Ergebnisse erreichten damals auch schon die sog. "Einkoffer-Aufnahme-/Wiedergabeeinrichtungen" wie die von Franz v. Trümbach ("Tonograph"), Siemens und Telefunken (s. Abb.) hergestellten; hierzu u.a.: SCHWANDT, Erich: Schallplatten-Bastelbuch. Selbstaufnahme- und Wiedergabe-Praktikum. Leipzig o.J. [1938 ?]; KÜHNE, Fritz: Neuzeitliche Schallfolienaufnahme. 2. Aufl. München 1952 (Radio-Praktiker-Bücherei Heft 7). Die von SCHWANDT (S. 21) guten Schallplatten attestierten Frequenzgänge bis 8 oder gar 10 kHz erreichen viele der "Lautdenkmal"-Aufnahmen; andere, so die entsetzlich gestörte*) und auch vom Inhalt her fragwürdige Nr. 36 (Unterrodach /Kronach, Oberfranken), verfehlen die gute Qualität, die in der zweiten Hälfte immer ohrenfälliger wird.

Die Heterogenität des Lautdenkmals kann teilweise auch daher rühren, daß, auch als Folge des verlorenen Krieges, die Originale wohl nicht immer sorgfältig gelagert und behandelt wurden (es ist überhaupt ein Wunder, daß sie die Kriegs- und Nachkriegswirren einigermaßen überstanden). Die von der Fa. Teldec (=Telefunken-Decca) GmbH vorgenommene Herstellung von Bandkopien erfolgte anscheinend nicht nach allen Regeln der Kunst, so hätte man beispielsweise viele elektrostatische und andere Störungen durch eine Vorbehandlung und von statischer Ableitung begleitete Naßabtastung (s. Kasten unten) ganz oder teilweise vermeiden können. Mindest 35 Jahre lang hätte man Zeit gehabt, eine neue (und in einigem bessere) Archiv-Einspielung zu besorgen, doch nichts geschah; andererseits stehen erst seit wenigen Jahren im Zuge des sich rasant entwickelnden Harddisk-Recordings und der damit entstandenen Sound(editor)-Software Werkzeuge bereit, mit denen sich auch in unserem Zusammenhang wesentliche Verbesserungen erzielen lassen.
--------
*) Die Aufnahme ist durch zahlreiche Kratzer und Verschmutzungen verdorben (mutwillige Zerstörung wegen des Inhalts?); um wenigstens einige Wörter hörbar zu machen (s. obigen Link), habe ich folgende Bearbeitungsschritte unternommen: Norm.95%; 5 x Declicking Opt.2 (1600 /2541 /2924 /2301 /1500 fixed); BP 180...5500 Hz; 1 x Decl. Opt. 1 (2200 fixed); Norm.95%; 1x Decl. Opt.2 (450 fixed); manuelles Tilgen von Störimpulsen; 2 x Decl. Opt.2 (260 /250 fixed); Norm.95%; 2 x BP 160...5000 Hz; SF NR; Norm.95%; Blue Compr.; Norm.95%; vergleichsweises Encoding mit 6,5 /8,5 /12 / 16 kbps.

Zu einigen besonders interessanten Tonproben finden Sie hier einige zusätzliche Erläuterungen (Abkürzungen: BP = [steilflankiges] Bandpaßfilter 18. Ordnung zum Kappen unterer und oberer Spektralanteile; Decl = Declicking zur Ausfilterung elektrisch oder mechanisch bedingter Nadelimpulse; manEd = manuelles Editing mit Pausenverkürzung und Störimpuls-Löschung); Norm. = Normalizing; NR = Noise Reduction, Verbesserung des Störabstandes; SF NR = Sonic Foundry Noise Reduction 2.0

Die hier aufgezeigten Möglichkeiten katenativer Filterung ergaben sich im Laufe meiner Arbeit an zum Teil äußerst schwierigem Tonmaterial und repräsentieren verschiedene Wege mit nicht immer identischem Resultat. Welches Vorgehen als "Königsweg" gelten kann, wird sich erst nach vielen weiteren Versuchen ergeben; zudem erfordern bestimmte kritische Samples immer wieder neue, bislang nicht realisierte Verfahren.

str Anselfingen / Konstanz (155 / w'19,4):
Erstellt Juni 2001; Decl, NR, BP; ruhige, getragene Atmosphäre; durch DynCP wird das Hintergrund-Glockengeläut geringfügig verstärkt, auch der beim Überspielen auf CD infolge fehlerhafter Tonkopfabschirmung auftretende leichte Grund-Brumm. Encoding zunächst mit 16 kbps.
2. Bearb. 13.9.2k1; Behandlung mit SF Noise Reduction 2.0a (s.u.) und breitbandigere Encodierung mit 32 kbps;
3. Bearb. 24.9.2k1: zusätzl. Normalizing 95%, 2 x BP 120...6000 Hz, Norm. 95%, Enc. 32 kbps: sehr starke Brillanzanhebung zur Verdeutlichung dialektspezifischer Lautungen (vor allem Sibilanten und Affrikaten); alternativ zeigte sich der 16-kbps-Modus als ausreichend
4. Bearb. 30.11.2k1: zusätzl. Norm. 95%, Waves X-Noise (mittig), dadurch etwas Brillanzverlust, deshalb wieder Enc. 32 kbps.
str Berstadt /Büdingen (Hessen, 117 / Q' 20,3)
3. Bearb. 15.1.2k2: Norm. 90%; 3 x BP 170...6000 Hz; 3x Decl. Opt.2; Del. Silence >200 ms (27/11"); Harmonic Exciter; Hard Limiter +15/-2 dB; X-Noise 24/25; Hard Limiter [2] +3/-2 dB; BP [2] 170...5500 Hz; Norm. 92%; Enc. 16 kbps
str Boldixum /Föhr (186 / P 18,5), stark verknistert, erhebl. Pegeldifferenz zwischen beiden Sprechern
Bearb. 27.12.2k1: Norm. 95%, BP 160...6000 Hz; Norm. 95%; 5x Decl. Opt.2; Del. Silence >200 ms(1); Norm. 95%; SF NR; Del. Silence >200 ms(2); 3x Decl. Opt.2; PB 160...6000 Hz(2); Del. Silence >200 ms(3); Blue Compr.; 3x Decl. Opt.2, Encoding > RA 16 kbps
2. Bearb. 28.12.2k1, speziell zur Hervorhebung der für den sonst schwer verständl. Dialekt charakteristischen Laute: Harmonic Exciter (Arboretum) ; 3 x Decl. Opt.2; 2x Decl. Opt.1 (!), Del. Silence > 200ms; Hard Limiter +13 dB/Peak -2 dB; 2x BP 170...5500 Hz + Norm. 94%; Sonic Foundry NR; Norm. 94%; Enc. 16 kbps
str Dießen am Ammersee (Bayern, 142 / v' 33,2):
1. Bearb. Februar 2000, zunächst volle Länge. Durch schmalbandige Encodierung (*.ra, 8 kBps!) sehr ruhig + ausgeglichen, doch wenig Höhen.
2. Bearb. August 2001; verkürzt auf ca. 1 Min., manEd; Höhen mit Harmonic Exciter angehoben (erfordert neue Encodierung mit 12 kBps), zusätzlich DynCP und Normalizing auf fast 100%, hierdurch etwas rauhe *.ra
3. Bearb. 11.9.2001 mit Sonic Foundry NR
str Ebsdorf / Marburg a.d. Lahn (116 / N' 19,10)
2. Bearb. 16.1.2k2: 3x BP 170...6000 Hz; 3x Decl. Opt.2; Del. Silence; Izotope Ozone Harmonic Exciter; X-Noise 15 /22; Hard Limiter +16 /-1.5 dB; Enc. 32 kbs; kräftiger und ausgewogener als die zwar "UKW-mäßigere", doch mit deutlicher Präsenzdelle generierte 1. Version
str unbekannter Ort (18 [1936], niederdeutsch)
2. Bearb. 14.10.2k1: Norm.97%; 5x Decl. Opt.2; BP 180...6000 Hz; Del. Silence (autom., 26 Sek.!); SF NR; Blue Comp.; Norm.97%; Enc. 16 kbps; klingt trotz 16 kbps durchsichtiger als die mit 32 kbps encodierte Version 1
3. Bearb. 31.12.2k1: zusätzl. Harmonic Exciter; Waves X-Noise(tm); Hard Limiter +15/-2 dB, 2x BP 170...5500 Hz (zwischendurch jeweils Normalizing 90%), Enc. 16 kbps: keine wesentliche Verbesserung gegenüber (2)
4. Bearb. (zum Vergleich mit 3, 31.12.2k1): 3x BP 170...5500 Hz; Norm. 95%; 3x Decl. Opt.2; Del. Silence > 200ms (45 Instances); Harmonic Exciter; Waves X-Noise; Hard Limiter +15/-2 dB; Notch DTMF 60+180 Hz /47 dB; Norm. 95%; 3 x Decl. Opt.2; Norm. 93%; Harm. Exciter 50%; Waves X-Noise; Norm. 90%; Enc. 16 kbps: keine wesentliche Verbesserung gegenüber (2)
5. Bearb. 31.12.2k1: Fassung (2) + Hard Limiter +15 /-2 dB; Harmonic Exciter; Normalizing 90%; BP 170...5500 Hz; Enc. 16 kbps
6. Bearb. 31.12.2k1: Fassung (2) + Norm. 90%; Harmonic Exciter; Norm. 90%; Waves X-Noise 43%; Hard Limiter +10 /-2 dB; Enc. 16 kbps; bisher durchsichtigste, "angenehmste" Version
str Fredeburg /Meschede (Westfalen, 173 / G' 16,9):
Erstellt Aug. 2001. manEd; *Decl, NR, BP, sehr starke DynCP (mit Pump-Effekt) und Encodierung mit 32 kbps; in der ersten Hälfte periodisch wiederkehrendes Kratzen innerhalb der Nutzmodulation ebenfalls hervorgehoben; Alternativen:
2.- 4. (vergleichende) Bearb. = Schmalband-Fassung: 13.9.2k1: manEd usw.; zusätzlich SF-NR 2.0a; Blue Compressor; Encoding mit 12 kbps unterdrückt einen Teil des in der ersten Hälfte störenden Kratzens;
5.- 7. (vgl.) Bearb. am 15.9.2k1: mehrfaches Declicking mit Option 1 "Constant Hiss & Crackle" (zus. ca. 500.000 Clicks fixed!), Hard Limiting und Mehrfach-Bandpaß (Encoding 32 kbps erforderlich) bringen keine Verbesserung.
8. Bearb. 11.+12.10.2k1: Norm.95%; Decl. Opt.2; Norm.95%; 15x Decl. Opt.2; BP 180...5500 Hz; Norm.95%; SF NR; Norm.95%; Del. Silence; Blue Compr.; Norm.95%; BP 180...5000 Hz; bis 0:42'7 5x Decl. Opt.1; [12.10.] Amplitude einiger Kratzstörungen und sonstige auffällige Maxima auf ca. 35-50% red.; Norm. 95%; Decl. Opt. 2; Enc. 16 kbps, als 3. Fassung publiziert. Das durch partielle Verunreinigung oder Beschädigung der Platte entstandene periodische Kratzen ließ sich auch durch diese Neubearbeitung nicht tilgen.
str Freudenstadt /Schwarzwald (163 / p' 17,3; red. bearb.)
2. Bearb. 15.1.2k2: Norm. 92%; 3 x BP 170...6000 Hz; 3x Decl. Opt.2; Del. Silence >200 ms (48 / 22,3"); Decl. Opt.2; Del. Silence (4 / 0,5"); Decl. Opt. 2; Del. Sil. (4 / 0,5"); manEd.; Decl. Opt. 2; Del. Sil. (2 / 0,4"); Hard Limiter +15 / -2 dB; BP 170...5500 Hz; Norm. 92%; X-Noise 24 / 25; SF Noise Red. 33.4 / 9.4/..3.3 / 4dB; Norm. 90%; Enc. 32 kbps; klingt etwas ausgewogener und weniger verzerrt als die eine Präsenzdelle aufweisende Version 1.
str Groß-Strengeln /Angerburg (Ostpreußen, 084 / V 98,10; red. bearb): durch viele Clicks und Crackles (auch innerhalb der Nutzmodulation) gestört; trotz dieses Umstands und der stark politischen Färbung wegen der dialektalen Relevanz in das Proben-Corpus integriert.
1. Bearb. 18.1.2k2: 3x BP 170...5500 Hz; 3x Decl. Opt.2; 2 x Decl. Opt.1; Del. Silence >180 ms (12 / 3,2"); Izotope Ozone MB Harmonic Exciter (Bd.2+3); X-Noise 12 /26; Decl. Opt.2; Del. Sil. (12 /3,6"); Hard Limiter +15 /-1 dB; Norm. 70%; BP 180...5000 Hz; Norm. 90%; Enc. 16 kbps
str Hamburg-Finkenwerder (011 / d 26,8):
Ältere Aufnahme (# 11). Probe erstellt Aug. 2001. manEd; *Decl, BP, DynCP, nochmals BP. Durch Dynamik-Kompression dialektrelevante Lautungen hervorgehoben. Stimmton schlank, Sprachgebung, Inhalt + Intonation gut didaktisierbar.
2. Bearb. 24.9.2k1: Normalizing 95%; 5 x Declicking Option 2; BP 120...6000 Hz; SF-NR 2.0a; Blue Compr.; Normal. 95%; manEd; BP 140...6000 Hz; Blue Compr.; Norm. 95 %; Enc. 16 kbps: Stimmton sonorer, Brillanz-Anhebung
3. Bearb. 11.1.2k2: länger (2'27"); Norm. 95%; 2x BP 170...5500 Hz; Decl. Opt.2; Del. Silence >170 ms (44 Instances = 20,17"); Decl. Opt.2; Del Silence w.o. (2 Inst.); Decl. Opt.2; Del. Sil. (5 Inst.): Decl. Opt.2; Del. Sil. (3 Inst.); Decl. Opt.2; Harmonic Exciter 82,5%; X-Noise Thresh. 12.1; Hard Limiter 10/-3 dB; Norm. 90%; X-Noise w.o. [2]; Enc. 16 kbps.
Erkenntnisse:
- Dialektrelevante schwachtonige Lautungen lassen sich durch das Hard Limiting besser hervorheben (und damit didaktisieren); hierdurch gewinnt die Lesbarkeit (Verständlichkeit)
- Nach jedem weiteren Declicking konnten neu gewonnene Leerstellen (Silence >170 ms) getilgt werden; insgesamt wird die Datei dadurch ca. 26 Sekunden kürzer und damit der Erzählfluß wesentlich verbessert.
str Holt, Gemeinde Straelen /Geldern (231 / C' 4,5; 14.1.2k2/wv)
Bearb. 14.1.2k2: Norm. 93%; 2x BP 170...5500 Hz; Decl. Opt.2; Norm. 90%; Harmonic Exciter; Hard Limiter +15/-1 dB; 3 x Decl. Opt.2; manuelles Tilgen v. Leerstellen (2'04" > 1'52"); Waves X-Noise 17.1 / 27; Enc. 16 kbps
str Jabel / Waren, Mecklenburg (105 / d 42,2)
2. Bearbeitung 17.10.2k1: zusätzlich SF NR; BP 170...5500 Hz; Blue Compr.; Norm.95%, Enc. 16 kbps, dennoch durchsichtiger als 1. Version mit 32 kbps.
str Kassel (281 / F' 23,10; red. bearb.)
3. Bearb. 14.1.2k2: Norm. 90%; 3 x BP 170...6000 Hz; Decl. Opt.2; Del. Silence >175 ms (34 / 13,41"); ** Hard Limiter +15 / -2dB; X-Noise 11 / 21; Encoding 16 kbps
4. Bearb. 14.1.2k2: von ** an Hard Limiter +15 /-3 dB; (alternativ) Sonic Foundry NR 75.5/13.7/...3.31/6; Hard Limiter [2] +3 /-2 dB; Enc. 16 kbps. Da - wegen Verzerrungsgefahr - der Harmonics Exciter hier nicht in Frage kam und sich ohne Höhenanhebung X-Noise ebensowenig empfahl, wurde statt dessen kombinatorisch Sonic Foundrys Noise Reduction verwendet und dabei der Bereich um 3,1 kHz um 6 dB angehoben. Hierdurch entstanden einige weit über 90% hinausgehende Amplitudenspitzen; mit nochmaligem Hard Limiting (+ 3dB) wurde das Signal durchgängig auf ca. 90% begrenzt sowie Lesbarkeit und Eindringlichkeit nochmals verbessert. Bei stark reduziertem Wiedergabe-Output bleibt die Verständlichkeit dennoch erhalten - im Gegensatz zu einem Sprachfluß mit "natürlicher" Amplitudenstatistik.
5. Bearb. 23.1.2k2 (Probe wegen ihres trockenen Humors nur leicht gekürzt)
Norm. 92%; 1 x Clickfix 2.04; 3x BP 170...6000 Hz; 3x Decl. Opt.2; Hyperprism Harmonic Exciter (odd + even); X-Noise; Del. Sil. >260ms (76 /34"); Izotope Ozone MB Harmonic Exciter; dB Mastering Limiter; Norm. 90%; man.Ed.; Enc. 16 kbps
str Kunzendorf b. Neurode / Glatz (Niederschlesien, 204 / O' 66,3):
sehr lautes Knistern, dumpfe Sprachmodulation; nach zunächst "konventionellem" Vorgehen
2. Bearb. 10.10.2k1: Norm. 95%; BP 160...6.000 Hz; Normal. 95%; 5x Decl. Opt.2; Del.Silence + manEd; 5 x Decl. Opt.2; SF NR; BlueComp; Norm. 95%; Encoding 16 kbps
3. Bearb. 17.1.2k2: 3x BP 170...5500 Hz; 4x Decl. Opt.2; Del. Sil. >180 ms (38 /20"); Izotope Ozon MB Harmonic Exciter; 3x Decl. Opt2; Arboretum Harmonic Exciter; SF Noise Red. 64.5 /15.7/...2.9/2 dB; Hard Limiter +15 /-1.5 dB; BP 170...4500 Hz; Hard Limiter [2] +4 /-1.5 dB; Enc. 16 kbps. Diese Bearb. stößt an die Grenzen des Machbaren. Die extreme Ketten-Filterung bringt zwar Verbesserungen, hebt die Nutzmodulation aus dem Störnebel heraus und verbessert die Lesbarkeit, doch hinterläßt Sonic Foundrys Noise Reduction (hier eindeutig Waves' X-Noise überlegen!) einen etwas "künstlichen" Klang; die dafür verantwortlichen Obertöne werden durch das relativ schmalbandige Encoding mit 16 kbps größtenteils weggefiltert, so daß das Real-Audio-Endprodukt wieder natürlicher klingt.
4. Bearb. 17.1.2k2: das weiterentwickelte Direct-X-Plugin Clickfix V. 2.06 arbeitet in nur einem Durchgang schneller und gründlicher als das in Cool Edit Pro 1.2a implementierte Declicking und ermöglicht zudem ein Vorhören in Echtzeit; hernach 1 x BP 170...4500 Hz, Del. Silence >180 ms (38 / 22"); Izotope Ozone MB HE; SF NR 43 / 11.7...3 / +3 dB; ** Hard Limiter +15 / -1.5 dB; Normal. 90%; aufgrund von Rauheiten bei 16 kbps mußte zu 32 kbps *.ra encodiert werden. Das Endprodukt klingt geschlossen und natürlicher als Version 3.
5. Bearb.: von ** an alternativ dB Audioware Mastering Limiter + Normal. 90%; klingt bei identischem Amplituden-Maximum lauter und kräftiger als Version 4.
str München (052 / t' 36,2; 3. Fassung 31.12.2k1): zusätzl. Hard Limiter +10 /-2 dB; Enc. 16 kbp
4. Bearb. 14.1.2k2: Norm. 90%; 2x BP 170...5500 Hz; Decl. Opt.2; Del. Silence (51 / 16,9"); Decl. Opt.2; Harmonic Exciter; Hard Limiter +15/-2 dB; 3x Decl. Opt.2; X-Crackle 82.1 / 56; X-Noise 28.8 / 46; 2 x Decl. Opt.2; Man.Ed. (redaktionell); Hard Limiter [2] +6 / -2 dB; X-Noise [2] 22/25; Enc. 16 kbps. Mittels dieser langen "Filterkette" konnten dialektrelevante Lautungen hervorgehoben werden.
str Ostrohe /Norderdithmarschen (185 / V 21,12)
sehr störendes Knistern, dumpfe Modulation; deshalb
2. Bearb. 11.10.2k1: Norm.95%; Decl. Opt.2; Norm.95%; 10x Decl. Opt.2; BP 180...5500 Hz; Norm.95%; SF NR; Norm.95%; Del. Silence; Blue Compr.; Norm.95%; Enc. 16 kbps
str Ramsloh (Saterland, 223 / i 13,3)
3. Bearb. 16.1.2k2: 3x. BP 170...6000 Hz; 3x Decl. Opt.2; Izotope Ozone Multiband Harmonic Exciter; X-Noise 24b / 25; Del. Silence >200 ms (14 / 8,2"), Del. Sil. > 180 ms (4 / 0,5"); Hard Limiter +20 / -1.5 dB; Enc. 16 kbps; bisher "schärfstes" Limiting, dadurch optimale Darstellung der schwachtonigen dialektrelevanten Lautung.
str Sankt Andreasberg im Oberharz (019 / A' 30,2)
Ältere Aufnahme, hohes Grundgeräusch, daher *Decl, NR, BP, DynCP mit Normalizing ca. 95 dB; manEd; Wert gelegt wurde weniger auf Ästhetik denn auf optimale Informationsvermittlung und Verdeutlichung dialekttypischer Lautmerkmale, die durch 16-kBit-Encoding zur Geltung kommen.
2. Bearb. Cuxhaven, 9.10.2k1: Norm. 95%, 5 x Declicking (Option 2), BP 160...6000 Hz ext./18. Ordnung; Delete Silence (manEd), SF NR; Blue Compr.; BP 170...6000 Hz w.o.; Norm. 95%; Encoding 32 kbps
3. Bearb. 30.11.2k1: Norm 95%, Waves X-Noise (Mittenpos.), Enc. 32 kbps
str Scheie b. Bückeburg /Schaumburg-Lippe (014 / t 21,5; 12.1.2k2/wv)
12./13.1.2002: Erste Bearbeitung dieses ziemlich beschädigten, aber historisch und erzähltechnisch interessanten Tondokuments. Nach Filterung (BP 18. Ordnung, 170...5500 Hz) und mehrmaligem Declicking (Option 2) mit Hyperprisms Harmonic Exciter die Brillanzen angehoben (Pre-Emphasis) + 1 x Decl. Opt. 2 (zur teilweisen Tilgung der mitverstärkten restlichen Nadelimpulse), damit nach anschließendem X-Noising (entspricht hier De-Emphasis) noch genügend "Substanz" im Hochtonbereich verfügbar ist. Via Hard Limiter die schwachen Anteile der Amplitudenstatistik um 10 dB angehoben und der Maximaloutput auf -0.5 dB begrenzt. ** Danach Normalizing 90% und 2 x BP 170...5500 Hz Sonic Foundry Noise Reduction (max., mit Anhebung 5 dB um 2900 Hz), 3 x Declicking Opt. 2, manuelles Tilgen aller Leerstellen (wegen der Crackles aufgrund von Schallplattenschäden nicht automatisch möglich) und Encoding mit 16 kbps.
2. Bearb. 13.1.2k2: von ** an manuelles Tilgen aller Leerstellen (ca. 30 Sekunden gewonnen!); multiples Declicking (Opt. 2); Normal. 93 %; *** Enc. 16 kbps. Im Vgl. zu Fassung 1 geringfügig weniger Höhen, etwas voller.
3. Bearb. 13.1.2k2: von *** an Hard Limiter +10/-1 dB; Waves X-Noise Thresh. 31.7 / Red. 18; Enc. 16 kbps; SNR und Lesbarkeit verbessert
str Waldbüttelbronn / Würzburg (125 / Y' 26,11; red. bearb.)
3. Bearb. 24.1.2k2: Norm. 90%; 5x Decl. Opt2; Ddel. Silence >220ms (25"); manEd; Izotope Ozone MB Harmonic Exciter; X-Noise 15 /35; DB Mastering Limiter; => *.wav; REnc. 3.1 => 16 kbps
str Warbeyen / Kleve (230 / z 4,1)
2. Bearb. 28.12.2k1: zusätzl. Hard Limiter +15/-2 dB, BP 180...6000 Hz, Norm. 87%; Enc. 32 kbps
str Wulfen / Recklinghausen (229 / A' 9,1):
Erstellt Aug. 2001; wie in [5] durch manEd viele Pausen verkürzt und Sprachfluß wesentlich verbessert; *Decl, BP, DynCP; 16-kBit-*.ra; ausgezeichnete Verständlichkeit auch nebentoniger dialektrelevanter Lautfolgen.
2. Bearb. 10.10.2k1: Vorgehen wie in [019], noch weiter verbesserte Tonqualität durch 32 kbps
str Zechendorf /Deutsch Krone, Grenzmark (Pommern, 072 / g 66,3)
3. Bearb. 16.1.2k2: 3x BP 170...6000 Hz; 3x Decl. Opt.2; Izotope Multibd. Harm. Exciter; X-Noise 15 /20; SF Noise Reduction -7.2 /-5.5/...2.9/10; Del. Silence >180 ms (10 /1.5"); Hard Limiter +16 /-1.5 dB; Enc. 16 kbps; Resultat wie in #223 (Ramsloh).

IV. Zusammenfassend läßt sich folgendes feststellen:

Ältere Aufnahmen sind nicht selten behaftet mit unangenehmen Störungen, die unter kritischer Abwägung physikalischer, kommunikativer und rezeptionsästhetischer Aspekte und im Hinblick auf die spätere wissenschaftliche (*.wav) und/oder didaktische (*.wav, *.mp3, *.wma, *.ra) Verwendung so zu mindern sind, daß hierdurch keine Artefakte (künstliche Zusätze) und sonstige Verfremdungen entstehen; an Störungen unterscheiden wir:
1.1. bei Schallplatten (um die es hier ausschließlich geht) / => Gegenmaßnahmen:

mehr oder weniger starkes Grund-Rauschen (Abnutzung, Nadelgeräusche) => Naßabtastung + Nadelfilter (Tiefpaß) bzw. De-Hissing
Knacken (radiale Sprünge bzw. mutwillige Einritzungen) => Naßabtastung + Declicking
Kratzen (longitudial und radial fortschreitend, meist aufgrund einer fleckförmigen Verunreinigung oder Beschädigung) => mechanische Reinigung und / oder Naßabtastung + De-Noising
Poltern / Rumpeln (durch abnutzungs- oder fabrikationsbedingte Rillenschäden oder horizontale Verwerfungen) => Rumpelfilter (Hochpaß)
Pops (Wind- und Artikulationsgeräusche bei der Aufnahme) => manuelle oder automatische Tilgung, sofern ohne Einbuße der Nutzmodulation und des Informationsgehaltes möglich

Knistern (durch elektrostatische Aufladung bei Wiedergabe) => Naßabtastung + Declicking und / oder De-Hissing

Anmerkungen:
(a) Auch wenn erklärtermaßen gute Bandkopien vorhanden sind, ist ein erneutes korrigierendes Abtasten der Original-Tonträger (Matrizen, Tonfolien, Platten) anzustreben, denn 1. könnten bei der Erst-Abtastung Unachtsamkeiten und/oder technische Fehler aufgetreten sein, 2. wurden seit etwa 1960 Gerät (Tonarme, Systeme, Antriebe, Verstärker) und Methoden (Naßabtastung, Ladungsabbau) entscheidend verbessert.
(b) Beim Abtasten ist zu achten auf:
1. optimale Schonung (=minimalen Verschleiß) des Tonträgers durch adäquate Auflagekraft
2. sichere Rillenführung des Abnehmersystems (kein Schlingern)
3. Minimierung tangentialer Abtastfehler
4. Ableitung elektrostatischer Ladung an Masse (mittels Zusatz-"Tonarm", der zugleich die Platte mit einer klaren (H2O dest.) oder Reinigungsflüssigkeit (wg. klebriger Rückstände nicht zu empfehlen!) benetzt.

1.2. Die mit der HF-Vormagnetisierung (1940) wesentlich verbesserten Tonbänder (heute: analoge Offenspulen- und Cassettenbänder) können gestört sein durch:

Grund-Rauschen (infolge lagerbedingter Magnetisierung oder mangelhaftem Aufnahme-Störabstand)
Brummen (Wechselstrom-Einstreuungen infolge mangelhafter Abschirmung oder Erdung)
Modulationsrauschen bzw. (der Modulationskurve überlagerte) Rauschfahnen
Knacken (elektrostatische Aufladungen / Schaltstörungen schon bei Aufnahme bzw. nur beim Abspielen oder infolge Schneidens mit aufmagnetisierter Schere)
Knistern (elektrostatische Aufladungen beim Abspielen)
Poltern / Rumpeln (durch elektrische bzw. mikrofontechnische Aufnahme-Fehler)
Pops (Wind- und Artikulationsgeräusche bei der Aufnahme)
Dropouts (kurzzeitige Aussetzer durch Beschichtungsfehler)
(meist periodische) Lautstärkeschwankungen (durch bandführungsbedingte Aufnahme- /Wiedergabefehler oder unbeabsichtigte Teil-Löschung in starkem Wechselfeld)
"Schwimmen" im Hochton-(=Brillanz-)Bereich (durch Azimuth-Fehler bei der Aufnahme oder Wiedergabe)

Die früher ausschließlich mechanisch und/oder mit bescheidenen elektrischen Filtern bewerkstelligte Schallplatten-Restauration erfährt heute durch computativ-digitale Verfahren ganz wesentliche Verbesserungen. Letztere sind unerläßlich, wenn wir die Originalplatten nicht (mehr) abtasten können und auf mehr oder weniger gute Tonband-Kopien angewiesen sind.
Unter den digitalen Hilfsmitteln spielt der Click/Pop/Crackle Eliminator eine informationstechnisch wie hörästhetisch entscheidende Rolle. Das Programm Cool Edit 1.2a, an dem wir uns orientieren, bewertet als mechanisch und elektrisch bedingte Stör-Phänomene neben den sog. Pops (s.o.)
1. Constant Hiss and Crackle (gleichmäßiges Rauschen und Krachen/Knattern),
2. Hiss + Lots of Clicks (Rauschen und oftmaliges Knacken/Knistern)
Anmerkungen:
1. Sie können das Declicking stark gestörter Aufnahmen vereinfachen und beschleunigen, indem Sie zuvor
  a) die hochfrequenten Impulsanteile ausfiltern (Bandpaß) und / oder
  b) im Zusammenhang mit einer Sprechpausen-Verkürzung möglichst viele Pausen-Clicks manuell tilgen.
2. Vor jeder Entstörung sind mit "Auto Find All Levels" die Bezugspegel des Samples zu ermmitteln.
3. Entstören wir nach [1], so werden schon in einem Durchgang praktisch alle als Clicks identifizierten steilflankigen Impulse getilgt (xxx fixed, 0 rejected), also auch solche innerhalb der Nutzmodulation, wodurch dort sehr kurze Dropouts entstehen, die das Signal holprig und zerrissen klingen lassen. In den allermeisten Fällen empfiehlt sich [2]; hier werden meist nur störende Pausen-Clicks getilgt (wir können das auch graphisch an der Veränderung des Modulationsverlaufs ablesen), andere zurückgewiesen (rejected) und daher belassen.
4. Wiederholen wir diese Prozedur (= multiples Declicking), so werden möglicherweise jeweils hunderte oder gar tausende weiterer (kleinerer) Clicks getilgt, was sich nur geringfügig auswirkt, doch zur weiteren Beruhigung des Signals beitragen kann. Die Bearbeitung des Kasseler Beispiels zeigte, daß etwas rauh modulierte Stimmen dabei "rissig" werden können. In solchen Fällen sollte nach nur einmaligem Declicking
  - SONIC FOUNDRYs "Noise Reduction 2" oder
  - WAVES (tm) X-Noise(s. auch unten)
  bemüht werden:
  ** Durch zu scharfe Präsenz- bzw. Brillanzanhebung werden mit SF NR in der Nutzmodulation liegende Clickstörungen zurückgeholt.
  ---
Allgemein ist ein ausgewogenes Klangbild anzustreben: das von Technikern wie dem früher sehr bekannten Ing. Fritz KÜHNE geforderte Idealprodukt 400.000 aus tiefster und höchster Frequenz (also 40...10.000 Hz, 80...5.000 Hz, 100...4.000 Hz) entspricht dem früher favorisierten "warmen" (Mittelwellen-)Klang. Wird dieses audiophile Ideal strikt beachtet, so entstehen in apparativ bzw. akustisch ungünstigen Fällen möglicherweise überproportional dumpfe bzw. baßlastige Aufnahmen mit folgenden Nachteilen:
- die Grund(ton)frequenzen beanspruchen den größten Teil innerhalb der Amplitudenstatistik und damit auch der nutzbaren Übertragungsenergie
- "bumsige" Signale neigen zur Übersteuerung
- Trittschall und andere tieffrequente Störungen (Möbelrücken, Türenschließen usw.) in unprofessionellen Aufnahmen behindern mehr als gewöhnlich die Sprachverständlichkeit.
Dumpf klingende Signale können mit einer Kombination verschiedener Methoden verbessert werden:
- steilflankiges Abschneiden im Grundtonbereich unter 150 / 180 Hz, ggf. als Bandpaß-Parameter. Generell darf eine Tiefenabschneidung nicht so weit gehen, daß das Signal spitz, körperlos und "künstlich" klingt.
- Frequenzkorrektur (=Anheben des formantkritischen Bereichs) mit einem Parametrischen Equalizer oder dem Noise-Reduction-Modul (NR 2.0a) von Sonic Foundry
- Dynamik-Kompression oder Hard Limiting, danach ggf. (nochmals) Bandpaß 180...5500 Hz.
Dadurch erhöhen sich Sprachverständlichkeit und Störabstand (signal-to-noise ratio), damit die wahrnehmbare Lautstärke der Sprachinformation. Durch zusätzliche Dynamik-Kompression oder ein verzerrungsarmes Hard Limiting ergibt sich ein seit langem in der drahtlosen Nachrichtenübermittlung (z.B. Überseerundfunk, Amateurfunk) bekannter Effekt: die Sprache wird schon bei geringer Leistung als lauter, eindringlicher empfunden als ein unkomprimiertes, "natürliches" Signal mit seinen in der Regel hohen Amplitudendifferenzen. Positiv betroffen sind hierbei vor allem druckschwache Laute wie /s/, /f/, /k/, /t/ oder /ch/, die in stark gestörten und/oder schmalbandigen Aussendungen oft kaum wahrzunehmen sind, andererseits die Hauptrolle spielen in puncto Sprachverständlichkeit und Dialektdistinktion. Ein gutes Beispiel für eine solche methodische Kombinatorik ist die (am 8.3.2003 erstellte) Lautdenkmal-Probe aus Worpswede, wo in zwei Durchgängen mit einem Bandpaßfilter 12. Ordnung jeweils bei 150 Hz abgeschnitten und das Signal per Hard Limiting und Dynamik-Kompression nivelliert wurde; zudem wurden überlange Pausen getilgt und trotz der Filterung und des mehrmaligen De-Clickings verbliebene Störgeräusche zweimal mit Waves^tm-X-Noise so weit reduziert, daß zuvor mit einem Harmonic Exciter angehobene Präsenz- und Brillanzanteile des Spektrums zugunsten der didaktischen Präsentierbarkeit erhalten blieben.
Wenn zu "scharf" eingestellt, erzeugen Software-Kompressoren (z.B. Blue Compr. von DigiLogue) eine Art Raumresonanz-Effekt, der besonders in längeren Hör-Dateien demotivierend wirkt. Wenn es nicht möglich ist, diesen Effekt rückgängig zu machen (und statt dessen den klangneutraleren Hard Limiter einzusetzen), ist der Resonanz-Anteil im Spektrum mittels Notch-Filter zu reduzieren.
Für breitbandige, aber beträchtlich gestörte (Knistern, Knacken, Schaben) Aufnahmen (wie Fredeburg /Meschede) empfehlen sich folgende (* ggf. mehrmalige) Maßnahmen:
1. * Bandpaß (Tschebyscheff, 18. Ordnung) ca. 170...6000
2. * Declicking (Option 2)
3. X-Noise und/oder SF Noise Reduction oder
4. De-Noising mit 40 dB (High Hiss Reduction) und hohem Präzisionsfaktor (20)
5. Dynamik-Kompression oder Hard Limiting (+10 / -2 dB); wenn optimal eingestellt, ist der HL ist klangneutraler und wirkungsvoller.
Weiteres dazu:
1. multiples Declicking (s.o.) und Höhenabschneidung erst ab ca. 7 kHz, wenn Bandbreitenerhalt gewünscht
2. Dynamik-Kompression mit digilogue BlueCompressor (max. Soft-Knee-Einstellung) oder Sonic Foundry Track Compressor nur dann, wenn hierbei kein verfremdender Raumresonanz-Effekt entsteht
3. Bursts: Das periodische Schaben bzw. Kratzen der Fredeburg-Aufnahme kennen wir von vielen anderen älteren Schallplatten; Ursachen sind partielle Verunreinigungen (Verklebungen, Schmutzflecken; chemisch entfernbar) oder Zerstörungen. Genau betrachtet, handelt es sich hier um eine stetig wiederkehrende definierte Folge ultra-kurzer Nadelimpulse, die zusammen einen Burst bilden; tritt dieser in Modulationspausen auf, ist er problemlos zu tilgen, nicht jedoch, wenn er der Nutzmodulation überlagert ist. Gelänge es, ein Filter zu konstruieren, das den Burst im Echtzeit-Durchgang oder einem anderen Bearbeitungsmodus (z.B. gegenphasig) auslöscht, so wäre das ein Durchbruch in der restaurativen Tonbearbeitung.
Alternativen zum Declicking :
1. ggf. mehrmaliger Bandpaß (s.o.)
2. Hiss / Noise Reduction auf der Basis eines automatisch ermittelten Noise Floors bzw. Noise Profiles. Eine NR mit 40 dB oder mehr filtert nicht nur die hochfrequenten Störimpulse weg; sie beschneidet auch den Nutzfrequenzgang sowohl im Grundton- wie vor allem im Brillanzbereich.
  b) extrem steilflankige Bandpaßfilterung (200...3500 Hz) und / oder
  c) *.ra-Encodierung mit nur 8 (oder gar 6) kBps.
Maßnahmen gegen Verzerrungen:
1. präventiv bei steilflankiger Bandpaßfilterung: "normalisieren" Sie vor einer solchen Maßnahme auf etwa 80 bis 85%
2. korrigierend: gehen Sie in den Modus Noise Reduction / Clip Restoration und wählen Sie "Lightly Clipped". Wird die betroffene Passage dabei zu stark abgesenkt, korrigieren Sie sie mit einem den Durchschnittsmaxima entsprechenden Normalizing.
Bandpaßfilterung, Dynamik-Kompression / Hard Limiting und Normalizing bis ca. 90 % erhöhen zusammen Lautstärke und damit Verständlichkeit nebentoniger Lautsequenzen, die (z.B. als Flexionsendungen) meist dialektale Merkmale enthalten.
Stark gestörte und schmalbandige Aufnahmen können informationell verbessert werden durch:
1. * Bandpaß 180...3000 Hz
2. * Declicking (Option 1)
3. X-Noise (maximal) und / oder Encoding mit 8,5 kbps
Senken Sie generell Zischlaute und Obstruenten nur so weit ab, daß Sprachverständlichkeit und Dialektdistinktion erhalten bleiben, auch wenn dies zu Lasten der Hör-Ästhetik geht.
Breitbandige, wenig gestörte Einspielungen erfordern nur geringfügige Filtermaßnahmen (BP 80...8.000 Hz, X-Noise) und können als 32-kBps-*.ra encodiert werden, sofern nicht angestrebt wird, wie im Falle von Danzig, Elbing und Jabel, nach zusätzlichem Declicking und (höhenanhebender) SF-Noise Reduction (nachbearbeitend) eine Basis für "pre-emphatische" 16-kbps-Encodierung zu schaffen.
Sichern Sie grundsätzlich alle Bearbeitungs-Zwischenschritte (*.mp3 / 64 kBps reicht aus). Protokollieren Sie die jeweiligen Maßnahmen und Einstellungen.

Links:

How to begin restoring old records (Allen Rény)
About sound restoration (Sound & Vision Engineering Department Technical University of Gdansk)
Audio preservation and restoration (Univ. Libraries, Univ. of Washington; Bibliographie)