Anmerkungen zur Restauration historischer Tonaufnahmen
von Wolfgang NÄSER, Marburg
Historische Aufnahmen von Sprache und Musik sind umso
reizvoller und herausfordernder, je älter sie sind. Die Beschäftigung
mit ihnen ist nicht, wie es auf den  ersten Blick scheinen könnte,
eine Spielerei, sondern wissenschaftliches und künstlerisches Desiderat.
Im Gegensatz zu Textdrucken und Malerei sind Foto, Film und Ton relativ junge
Medien, die es dann zu retten gilt, wenn sie besonders wichtige Ereignisse,
Trends, Persönlichkeiten darstellen und repräsentieren. Das ist
so in der Kunst, aber auch und gerade in der Wissenschaft - zumal wenn es
um Mundarten geht, von denen jedes Zeugnis der phonetischen Realisierung
um so wertvoller ist, je früher es entstand: wir denken hier auch und
gerade an solche Mundarten, die aufgrund historisch-politischer Ereignisse
für immer erstorben sind. Alte Tonaufnahmen sind auch dazu angetan,
möglicherweise falsche Vorstellungen zu Aussprache und Intonation zu
korrigieren, sofern dies auf der Basis bescheiden(st)er Tonqualität
überhaupt möglich ist.
Somit wären wir bei unserem Schwerpunkt, der historischen
Mundart-Tonaufnahme. Es gibt sie seit etwa 100 Jahren, genau genommen
seit 1899, als das Wiener
Phonogramm-Archiv
seinen Dienst aufnahm. Kaiser Franz Josefs berühmte Aufnahme vom 2.
August 1903 in Bad Ischl gehört, wie ich zu
beweisen versuchte, zu den
ältesten noch verwertbaren Tondokumenten. Ferdinand
WREDEs Aussagen zu Sprache
und Nationalität (1926) gehören ebenso in unsere Schatztruhe
wie ein großer Teil des - leider politisch belasteten -
Lautdenkmals reichsdeutscher Mundarten
(1936/37), mit dem in unserer Reihe zum ersten Male eine schon als modern
bezeichenbare Tontechnik in Erscheinung tritt. In qualitativer Hinsicht
gehören zu unserer Gruppe auch viele Aufnahmen, die in den 50er und
60er Jahren unter besonders schlechten Bedingungen entstanden oder von denen
wir nur sehr schlechte Kopien besitzen, die jedoch von hohem Wert sind für
Forschung und Lehre.
Dieser Wert kommt dann zum Tragen, wenn die alten bzw. unzureichend gepflegten
Tondokumente so aufbereitet werden, daß ihr Anhören nicht nur
informativ, sondern auch rezeptionsästhetisch optimal ist.
Das Prinzip des prodesse et delectare (nützen und erfreuen) gilt
auch und gerade hier; technisch umgesetzt, bedeutet dies
  - 
    minimalen Störpegel (Rauschen, Knistern, Schaben, Kratzen)
  
 - 
    angenehmes, ausgewogenes Klangbild (z.B. nicht zu viele Bässe)
  
 - 
    optimale Verständlichkeit (der informationsrelevanten Laute und
    Lautkombinationen)
  
 - 
    zügigen Sprachfluß (nur kurze interverbale Pausen)
 
Die Erreichbarkeit dieser Ziele hängt ab vom tatsächlichen oder
objektiven Informationsgehalt der Aufnahme. Dieser ist umgekehrt
proportional zum Störpegel; d.h.: alles, was darunter liegt, ist
physikalisch und informationstechnisch verloren. Ich kann nur das auswerten,
was vorhanden ist, und muß jederzeit damit rechnen, daß, wie
wir noch sehen werden, der Vorteil einer korrigierenden Maßnahme mit
einem davor nicht vorhandenen Nachteil einhergeht.
Je älter die Aufnahme ist, desto mehr brauche ich an Erfahrung, Aufwand
und Mühe. Ab und zu jedoch stößt man bei "alten" Einspielungen
auf eine frappant gute Qualität, so beim "Lautdenkmal" z.B. im Falle
von Berlin, Danzig,
Elbing, Ebsdorf b. Marburg
oder Tilsit - alles Aufnahmen von 1937, jedoch schon
an die spätere UKW-Qualität erinnernd. Abgesehen von solchen
unerwarteten Glücksfällen bedeutet es immer eine Menge anstrengender,
zeitraubender Arbeit, eine Reihe von Samples wie die meiner
Themenseite zum Lautdenkmal zu erstellen.
Jene Aufnahmen ebenso wie die bereits erwähnten (Wrede u.a.) fungieren
als Beispiele für Ergebnisse und Hinweise aus meiner bisherigen Praxis.
Ich denke dabei nicht an erste Gehversuche ab 1959, sondern an die PC-orientierte
Zeit ab etwa 1995, als ich begann, auf einem 486SX66 mit einer bescheidenen
Festplatte von nur 170 MB und dem Programm Sound Forge 2.0 die ersten
Tondateien zu editieren, und dabei erstaunt feststellte, wie einfach es doch
im Grunde war bzw. ist, selbst einzelne bedeutungsrelevante Laute wie das
[v] in /Schweißen/ aus dem Sprachkontinuum zu entfernen bzw. in einen
Wortkörper einzufügen, wie ich es 5 Jahre später ganz vereinzelt
auch in einer Opern-Edition unternahm,
um undeutliche oder beim Singen unterdrückte Laute zu ihrem Recht kommen
zu lassen.
Der Sound-Editor ist sozusagen ein akustischer Setz-Kasten für alle
Arten kreativer Tongestaltung. Wie beim Textgestalten bedeutet Editieren
auch hier Löschen, Verschieben, alle Arten von
Verändern: ich unterscheide hierbei
  - 
    textuelle (informationelle) Manipulationen
  
 - 
    (a) klangverbessernde bzw. (b) räumlich verändernde
    Maßnahmen
 
Obzwar ausnahmslos die dokumentarische Integrität bzw. wissenschaftliche
Authentizität verletzend, sind Textmanipulationen dann nötig, wenn
z.B. hochpolitische Aussagen zu tilgen sind, um ein Tondokument wie die Berliner
Aufnahme des "Lautdenkmals" als
dialektrepräsentatives Sample auch der Nachwelt fruchtbar zu machen.
Da ist von einem "Sturmlokal" die Rede, von Horst Wessel usw.. Ich muß
die inkriminierbaren bzw. peinlichen Passagen so tilgen, daß der
Sprachfluß nicht beeinträchtigt wird; das
Resultat kann sich hören lassen, allerdings
nur im sprachwissenschaftichen Rahmen, hat es doch seine
historisch-politische Echtheit und damit den Charakter eines Zeitzeugnisses
mindestens zum Teil verloren.
Der Bearbeiter bzw. Verwalter historischer Tonaufnahmen steht somit immer
vor der Alternative,
  - 
    unter dem Postulat historischer Authentizität auf Kosten der
    Rezeptionsästhetik die originale Klangqualität ausnahmslos zu belassen
    (dokumentarisches Verwalten) oder
  
 - 
    durch akustische und editorische Eingriffe in das Tondokument dessen Intention
    und Aussage zu verstärken und das Hörerlebnis im ästhetischen
    Sinne zu optimieren (künstlerisches Nachschöpfen)
 
Nicht zuletzt aus didaktischen Gründen habe ich mich bei allen
hier angeführten Hörproben für den zweiten Weg entschieden.
Klangverbessernde Maßnahmen bilden den handwerklich-editorischen
Alltag des Tonaufnahme-Restaurators. Sofern ausnahmslos nach [2a] vorgegangen
wird, bleibt die informationelle und damit historische Gültigkeit erhalten;
ein wenig angekratzt werden würde sie, käme ich etwa auf die Idee,
eine der Lautdenkmals-Aussagen z.B. durch Verhallung in ein anderes,
verfremdendes Klangfeld zu versetzen, z.B. ein klerikales Environment,
wie es durch einen Klangfeldprozessor (Hardware) oder vom Sound-Editor spielend
leicht erzeugt werden kann. Hitler oder Goebbels würden dann z.B. in
einer Kirche oder einem Kloster sprechen statt in einer Open-Air-Arena, das
gäbe Anlaß für jede Menge Spekulationen. Gerade weil heute
derartige Manipulationen möglich sind (und dazu die textuellen!), besteht
zunehmend Zweifel an der Echtheit bestimmter "historisch-dokumentarischer"
Tonaufnahmen; verändert sich hier das Hintergrundgeräusch innerhalb
des Redeflusses abrupt, so dürfte kein Zweifel daran bestehen, daß
unzulässig "geschnitten" wurde.
Alle Arten der Klangmanipulation erfordern Zusatz-Module in Gestalt von
Programm-Bibliotheken bzw. Plug-ins; Editoren wie das hervorragende
Cool Edit 1.2a haben einen reichhaltigen "Werkzeug-Satz" an Bord, bieten
aber die Möglichkeit, beliebig viele externe Module als Direct-X
oder VST anzubinden, so z.B. Kompressoren, Limiter,
parametrische Equalizer u.a. Fasziniert von der Vielfalt des Angebots
und der Möglichkeiten, spielt der Anfänger zunächst mit allerhand
z.T. funktionsgleichen Plug-Ins herum, bis sich herauskristallisiert, welche
Programmteile bzw. Module am besten arbeiten und zu unserem Kern-Equipment
gehören. Man kann davon ausgehen, daß z.B. Cool Edit Pro 1.2a
bereits alle wesentlichen Werkzeuge enthält; vom Funktionsumfang her
bedeutet das den Gegenwert einer alle Raffinessen bietenden Studio-Hardware
im Werte von 100.000 DM oder mehr, noch vor 20 Jahren alleiniges Mittel des
kreativen Masterings. Der komplexe Sound-Editor bedeutet nicht nur unvorstellbare
Platzersparnis, sondern auch eine Kostenreduktion um 80 % oder mehr. Betrachten
wir den Hardware-Aufwand von der Aufnahme über das Mastering bis zur
Produktion, so vereint heute sogar schon ein Notebook wie das Gericom
Overdose S 14.1" TFT für rund 4.200 DM alle prozeduralen
Funktionsbausteine in sich, vorausgesetzt, die steuernde Software (Sound-Editor,
Brennprogramm) ist an Bord.  
Zur Praxis
I.  Was z.B. das Statement Kaiser Franz Josefs I. von
1903 angeht, meinen bisher schwierigsten Fall, so dürfte aus dem
zugehörigen Text hervorgehen,
welche Schwierigkeiten ich Ende 1999 in mehreren Schritten bis Anfang
2000 damit hatte, aus meiner Cassettenkopie so viel an Information
herauszuholen, bis ich, in Ermangelung des bereits erstellten Textes
transkriptorisch "nachschöpfend", das meiste verstehen und niederschreiben
konnte.
Ich habe das Ganze noch einmal durchgeführt, nach anderthalb Jahren
zusätzlicher Erfahrung, und dann einige der Schritte vorgenommen, die
meinen Lautdenkmals-Samples zu mehr Durchhörbarkeit und Klarheit
verholfen haben. Ergebnis sind Neubearbeitungen vom
15.9. und
1.12.2001: in ersterer gelangt nicht nur
als Direct-X-Plugin SONIC FOUNDRYs Noise
Reduction 2.0a (versuchsweise u.a. 2x hintereinander) zum Einsatz, sondern
auch der in Cool Edit Pro 1.2a enthaltene Hard Limiter; in der neuesten
verwendete ich alternativ das neue WAVES(tm)-Plugin
X-Noise, das in diesem Falle nicht besser abschneidet und des Kaisers
Stimme seltsam nebelhaft abbildet.
Eine weitere Neubearbeitung vom 17.2.2002 bemühte Dart
Pro 32, WAVES(tm)-X-Noise, SONIC
FOUNDRYs Noise Reduction und wiederum den Hard
Limiter (-2 / +4 dB). Zwar wurde hierbei ein SNR bis etwa 48 dB (!) erreicht,
doch klingt (wie auch bei ausschließlich Cool-Edit-internen Verfahren
festgestellt) die Stimme nach extremer Rauschunterdrückung seltsam
vernebelt, distanziert und verhallt, so daß sich bei kritisch-distanziertem
Vergleichshören letzlich die "alte"
3.Version von Anfang
2000 trotz ihrer Zischel-Störungen als die natürlichste,
direkteste, "zupackendste" erweist. Fazit aus allem: irgendwann ist
nichts mehr zu gewinnen, ohne andere Parameter (unverzichtbare
Klangmerkmale) zu gefährden.
Erwogen hatte ich auch schon eine etwas absonderlich und keck anmutende Methode,
unserem Franz Josef I. zu unerwartetem akustischem Glanz zu verhelfen, und
das ginge so: /f/, /s/, /sch/, /t/ und ggf. andere formantkritische Laute
werden in allen möglichen Umgebungen aus einer anderen, von Alter und
Timbre her möglichst ähnlichen neuzeitlichen Stimme isoliert
und dienen als dateienmäßige Bausteine, als Fundus, um an passender
Stelle in den Sprachfluß eingefügt zu werden. Der jeweilige
Obertongehalt der Fremdbausteine ist so weit zu reduzieren, daß der
Verfremdungseffekt minimiert wird. Das Einkopieren von Korrektur- oder
Substitutionslauten ließe sich dadurch vereinfachen, daß beim
Editieren jeweils eine bestimmte, programmiertechnisch zugeordnete Taste
gedrückt wird (z.B. s für /s/, S für /sch/ usw.),
der PC würde somit teilweise zur akustischen Schreibmaschine.
II. Nun zur bereits erwähnten Wrede-Rede, einem Beispiel
für die bis ins letzte Detail verfeinerte mechanische
(=Phonographen-)Aufnahme. Hier ist folgendes festzustellen:
  - 
    die in den PC einkopierte Originalkopie (Minidisk) ist zwar stark verknistert,
    klingt jedoch kernig und zupackend; die Modulations-Hüllkurve weist
    aus, daß auch alle Grundtöne unreduziert zur Verfügung stehen,
    das bedeutet volle Sonorität.
  
 - 
    um das starke Knistern zu reduzieren, kann ich alternativ oder in
    Kombination
    (a) Clicks und Pops ggf. in mehreren Durchgängen herausfiltern,
    (b) anhand eines automatisch ermittelten Noise Floors ein definiertes
    De-Hissing vornehmen und /oder
    (c) die Click-Oberwellen durch ein steilflankiges Filter
    (Butterworth oder Chebychev  Typ 1) abschneiden
    oder 
    (d) das Sample mit möglichst hohem Kompressionsgrad (bis 70 oder 100)
    zu *.mp3 oder *.ra konvertieren, das hat die Wirkung eines
    entsprechenden Filters, und / oder zusätzlich
    (e) in manuellem Editing mit Zeitachsen-Zooming einzelne
    Clicks, Pops und sonstige Störungen entfernen.
   - 
    Filtermaßnahmen nach [2b] und [2c] verflachen den Stimmklang, lassen
    Wrede möglicherweise wie durch einen Schalltrichter sprechen, während
    die stark datenreduzierende Konversion zu *.ra einen relativ dumpfen
    Mittelwellen-Klang erzeugt. Ähnlich arbeitet (im Audition mode)
    der hochgelobte Declicker von Steinberg. Klar, daß bei
    starker Höhenreduktion und daher Beschneidung des
    Obertonspektrums die überwiegend hochfrequenten Clicks von selbst
    verschwinden.
  
 - 
    Letztlich muß ich entscheiden zwischen zwei grundsätzlichen
    rezeptionsästhetischen Konzepten: 
    (a) weitgehender objektive akustischer Echtheit (angenommener
    natürlicher Stimmklang vor Aufnahme) oder 
    (b) einer ins Kreativ-Künstlerische gehenden Bearbeitung als
    Abbild einer in bestimmten Situationen (Schalltrichter nach Aufnahme)
    angenommenen 'virtuellen' Realität.
 
Ich habe mich mit der zweiten Bearbeitung vom 11.8.2001 für
[4b] entschieden; ausschlaggebend war die in dieser
"Grammophon-Fassung" herrschende Ruhe in den
Sprechpausen. Die schlank mensurierte Stimme bekommt zudem etwas Feierliches,
an eine Vorlesung Erinnerndes, das die Wichtigkeit des Gesagten unterstreicht.
Bei der dritten Bearbeitung vom 14./15.9.2001 bin ich
folgendermaßen vorgegangen:
  - 
    Einladen der Original-Bandkopie (DAT) in Cool Edit Pro 1.2a: SNR = 20 dB
  
 - 
    Dreimal Tschebycheff-Bandpaß (18. Ordnung) 150...3500 Hz, SNR
    = 27 dB
  
 - 
    Declicking "Constant Hiss & Crackle": ca. 177.000 Clicks
    fixed, 0 rejected, SNR = 29 dB
  
 - 
    Sonic Foundry Noise Reduction mit ca. 85 % NR und ca. 8 dB High Shell
    Gain 3,1 kHz, wenig Wirkung
  
 - 
    Normalizing 95 %
  
 - 
    Dreimal Declicking nach Option 2 "Lots of Hiss & Crackle": 1240
    /1176 /1285 Clicks fixed
  
 - 
    Sonic Foundry NR mit Maximaleinstellung NR und ca. 8 dB High
    Shell Gain 3,1 kHz; SNR = 36 dB
  
 - 
    Manuelles Tilgen einiger Pausen-Clicks / -Pops
  
 - 
    Normalizing 93 %
  
 - 
    Abspeichern als *.wav
  
 - 
    Mit Real Enc. 3.1 Encoding mit 8,5 kbps
    -------- Nachbearbeitung 1 (15.9.2k1) ---------
   - 
    Re-Konversion von *.ra zu *.wav
  
 - 
    Sonorisierung: 2 x Parametr. Equalizer, 216 Hz + 8dB zur
    Verstärkung der 1. Grundton-Harmonischen
  
 - 
    Normalizing 95 %
  
 - 
    Anheben einiger relevanter Passagen im letzten Drittel der Aufnahme; SNR
    jetzt ca. 33 dB
  
 - 
    Abspeichern als *.wav
  
 - 
    Real Enc. 3.1, 8,5 kbps
    --------- Nachbearbeitung 2 (18.9.2k1) -------
   - 
    aus (13) erhaltene *.wav behandelt mit dem virtuellen
    Röhren-Kompressor (und Limiter) T-Rack S 2.0
  
 - 
    Real Enc. 3.1, 8,5 kbps
    --------- Nachbearbeitung 3 (24.9.2k1) --------
   - 
    Einlesen der in (18) erhaltenen Version
  
 - 
    manuelles Löschen einiger Störimpulse und Absenken interverbaler
    Pegel
  
 - 
    manuelles Kürzen der interverbalen Pausen zur Verbesserung des Redeflusses
  
 - 
    Real Enc. 3.1, 8,5 kbps
 
Auf Dynamik-Kompression wurde zunächst verzichtet, weil sonst
die nicht entfernbaren, weil die Nutzmodulation durchsetzenden
Klicken, Rauschen und Rumpeln mit angehoben worden
wären. Die (im Gegensatz zur zweiten) mit
nur 8,5 kbps encodierte Fassung klingt dennoch durchsichtig und bietet
damit ein Maximum an Lesbarkeit bzw. Information.
Die am 15.9. nachträglich vorgenommene Sonorisierung gibt der
Stimme etwas Warmes, Zupackendes und reduziert etwas die Merkmale der typischen
"Grammophon"-Aufnahme; allerdings wird durch eine solche Maßnahme immer
das Hintergrund-Rumpeln mit angehoben. Um diesen Effekt zu begrenzen,
muß zuvor die eigentliche Stimmgrundfrequenz durch einen geeigneten
Bandpaß weggefiltert werden.
Die am 18.9.2k1 mit T-Rack S 2.0 in virtuellem
Röhrenverstärker-Klang erstellte Datei klingt noch zupackender,
sonorer als ihre Vorläuferin. Durch die Dynamik-Kompression wird
das Grund-Geräusch (Schleifen und Rumpeln) lauter, stört jedoch
nicht den wirklichkeitsnäheren Gesamteindruck.
Die am 24.9.2k1 vorgenommenen Manipulationen sind ästhetischer
Natur; das Kürzen interverbaler Pausen dient der Verbesserung des
Sprachflusses und damit der rhetorischen Wirkung, verletzt allerdings das
Prinzip der Authentizität. Trotz aller Bearbeitungsschritte
verbleiben einige Rumpelstörungen innerhalb der Nutzmodulation,
überlagern also bestimmte Laute oder Lautkombinationen, die bei einer
Tilgung mitentfernt würden.
III. Mit dem "Lautdenkmal" betreten wir,
wie schon angedeutet, die Ära der elektrischen Tonaufnahme; als
Schallwandler fungieren sehr gute Kohlequerstrom-,
Bändchen- oder gar Kondensatormikrofone, letztere erreichen
schon in den dreißiger Jahren quasi UKW-taugliche Frequenzgänge.
Das der
Schneidkennlinie
entsprechend "entzerrte" Audiosignal gelangt über einen klirrarmen
Gegentakt-Leistungsverstärker auf den als Schneidstichel wirkenden Saphir
oder Diamanten, der die Auslenkungen der Modulation in eine Wachsmatrize
oder Schallfolie ritzt; die professionelle Technik erzielt
Frequenzgänge, mit denen alle Sprach-Formanten zu ihrem Recht kommen.
Mit elektrodynamischen Leicht-Tonabnehmern lassen sich solche hochwertigen
Aufnahmen schon kurz vor dem 2. Weltkrieg adäquat abtasten; Fritz
KÜHNE berichtet, man habe bereits mit
Mehrweg-Studiolautsprechern experimentiert und eine HiFi-taugliche
Übertragungsstrecke aufgebaut. In diese Zeit fallen auch die ersten
Versuche kopfbezogener Stereophonie, und im Jahre 1943 machte die
damalige Reichsrundfunkgesellschaft auf einem AEG-Magnetophon mit neuentwickeltem
Zweispur-Kopf die ersten Stereo-Tonbandaufnahmen der Geschichte.
Das sechs Jahre zuvor realisierte Lautdenkmal bedeutet einen Meilenstein
auf diesem steilen Erfolgsweg. Eingesetzt wurde ein spezieller Aufnahmewagen
der Firma Telefunkenplatte G.m.b.H., Abt. Spezialaufnahmen, Hallesches Ufer
30, Berlin  SW 11. Es wurden Wachsmatrizen geschnitten; Zahl und Adressaten
der Pressungen sind mir nicht bekannt.
Sehr gute Ergebnisse erreichten damals auch schon die sog.
"Einkoffer-Aufnahme-/Wiedergabeeinrichtungen" wie die von Franz v.
Trümbach ("Tonograph"), Siemens und Telefunken (s.
Abb.) hergestellten; hierzu u.a.: SCHWANDT, Erich:
Schallplatten-Bastelbuch. Selbstaufnahme- und Wiedergabe-Praktikum.
Leipzig o.J. [1938 ?]; KÜHNE, Fritz: Neuzeitliche
Schallfolienaufnahme. 2. Aufl. München 1952
(Radio-Praktiker-Bücherei Heft 7). Die von SCHWANDT (S.
21) guten Schallplatten attestierten Frequenzgänge bis 8 oder
gar 10 kHz erreichen viele der "Lautdenkmal"-Aufnahmen; andere, so die
entsetzlich gestörte*) und auch
vom Inhalt her fragwürdige
Nr. 36 (Unterrodach /Kronach, Oberfranken), verfehlen die gute
Qualität, die in der zweiten Hälfte immer ohrenfälliger wird.
Die Heterogenität des Lautdenkmals kann teilweise auch daher
rühren, daß, auch als Folge des verlorenen Krieges, die Originale
wohl nicht immer sorgfältig gelagert und behandelt wurden (es ist
überhaupt ein Wunder, daß sie die Kriegs- und Nachkriegswirren
einigermaßen überstanden). Die von der Fa. Teldec (=Telefunken-Decca)
GmbH vorgenommene Herstellung von Bandkopien erfolgte anscheinend nicht nach
allen Regeln der Kunst, so hätte man beispielsweise viele elektrostatische
und andere Störungen durch eine Vorbehandlung und von statischer
Ableitung begleitete Naßabtastung (s. Kasten unten)
ganz oder teilweise vermeiden können. Mindest 35 Jahre lang hätte
man Zeit gehabt, eine neue (und in einigem bessere) Archiv-Einspielung zu
besorgen, doch nichts geschah; andererseits stehen erst seit wenigen Jahren
im Zuge des sich rasant entwickelnden Harddisk-Recordings und der
damit entstandenen Sound(editor)-Software Werkzeuge bereit, mit denen
sich auch in unserem Zusammenhang wesentliche Verbesserungen erzielen
lassen.
--------
*) Die Aufnahme ist durch zahlreiche Kratzer und Verschmutzungen
verdorben (mutwillige Zerstörung wegen des Inhalts?); um wenigstens
einige Wörter hörbar zu machen (s. obigen Link), habe ich folgende
Bearbeitungsschritte unternommen: Norm.95%; 5 x Declicking Opt.2 (1600 /2541
/2924 /2301 /1500 fixed); BP 180...5500 Hz; 1 x Decl. Opt. 1 (2200 fixed);
Norm.95%; 1x Decl. Opt.2 (450 fixed); manuelles Tilgen von Störimpulsen;
2 x Decl. Opt.2 (260 /250 fixed); Norm.95%; 2 x BP 160...5000 Hz; SF NR;
Norm.95%; Blue Compr.; Norm.95%; vergleichsweises Encoding mit 6,5 /8,5 /12
/ 16 kbps.
Zu einigen besonders interessanten
Tonproben finden Sie hier einige
zusätzliche Erläuterungen
(Abkürzungen: BP = [steilflankiges] Bandpaßfilter 18.
Ordnung zum Kappen unterer und oberer Spektralanteile; Decl = Declicking
zur Ausfilterung elektrisch oder mechanisch bedingter Nadelimpulse;
manEd = manuelles Editing mit Pausenverkürzung
und Störimpuls-Löschung); Norm. = Normalizing;
NR = Noise Reduction, Verbesserung des Störabstandes; SF NR
= Sonic Foundry Noise Reduction 2.0
Die hier aufgezeigten Möglichkeiten katenativer Filterung ergaben
sich im Laufe meiner Arbeit an zum Teil äußerst schwierigem
Tonmaterial und repräsentieren verschiedene Wege mit nicht immer identischem
Resultat. Welches Vorgehen als "Königsweg" gelten kann, wird sich erst
nach vielen weiteren Versuchen ergeben; zudem erfordern bestimmte kritische
Samples immer wieder neue, bislang nicht realisierte Verfahren.
  - 
    str
    Anselfingen / Konstanz (155
    / w'19,4):
    Erstellt Juni 2001; Decl, NR, BP; ruhige, getragene Atmosphäre; durch
    DynCP wird das Hintergrund-Glockengeläut geringfügig verstärkt,
    auch der beim Überspielen auf CD infolge fehlerhafter Tonkopfabschirmung
    auftretende leichte Grund-Brumm. Encoding zunächst mit 16 kbps.
    2. Bearb. 13.9.2k1; Behandlung mit SF Noise Reduction 2.0a (s.u.)
    und breitbandigere Encodierung mit 32 kbps; 
    3. Bearb. 24.9.2k1: zusätzl. Normalizing 95%, 2 x BP 120...6000
    Hz, Norm. 95%, Enc. 32 kbps: sehr starke Brillanzanhebung zur
    Verdeutlichung dialektspezifischer Lautungen (vor allem Sibilanten
    und Affrikaten); alternativ zeigte sich der 16-kbps-Modus als
    ausreichend
    4. Bearb. 30.11.2k1: zusätzl. Norm. 95%, Waves X-Noise
    (mittig), dadurch etwas Brillanzverlust, deshalb  wieder Enc. 32
    kbps.
   - 
    str  Berstadt
    /Büdingen (Hessen, 117 / Q' 20,3)
    3. Bearb. 15.1.2k2: Norm. 90%; 3 x BP 170...6000 Hz; 3x Decl.
    Opt.2; Del. Silence >200 ms (27/11"); Harmonic Exciter; Hard
    Limiter +15/-2 dB; X-Noise 24/25; Hard Limiter [2]
    +3/-2 dB; BP [2] 170...5500 Hz; Norm. 92%; Enc. 16 kbps
   - 
    str
     Boldixum /Föhr (186 /
    P 18,5), stark verknistert, erhebl. Pegeldifferenz zwischen beiden
    Sprechern
    Bearb. 27.12.2k1: Norm. 95%, BP 160...6000 Hz; Norm. 95%; 5x Decl. Opt.2;
    Del. Silence >200 ms(1); Norm. 95%; SF NR; Del. Silence >200 ms(2);
    3x Decl. Opt.2; PB 160...6000 Hz(2); Del. Silence >200 ms(3); Blue Compr.;
    3x Decl. Opt.2, Encoding > RA 16 kbps
    2. Bearb. 28.12.2k1, speziell zur Hervorhebung der für
    den sonst schwer verständl. Dialekt charakteristischen Laute: Harmonic
    Exciter (Arboretum) ; 3 x Decl. Opt.2; 2x Decl. Opt.1 (!),
    Del. Silence > 200ms; Hard Limiter +13 dB/Peak -2 dB; 2x BP
    170...5500 Hz + Norm. 94%; Sonic Foundry NR; Norm. 94%; Enc. 16 kbps
   - 
    str  Dießen
     am Ammersee (Bayern, 142 / v' 33,2):
    1. Bearb. Februar 2000, zunächst volle Länge. Durch
    schmalbandige Encodierung (*.ra, 8 kBps!) sehr ruhig + ausgeglichen,
    doch wenig Höhen. 
    2. Bearb. August 2001; verkürzt auf ca. 1 Min., manEd;
    Höhen mit Harmonic Exciter angehoben (erfordert neue Encodierung
    mit 12 kBps), zusätzlich DynCP und Normalizing auf fast 100%,
    hierdurch etwas rauhe *.ra
    3. Bearb. 11.9.2001 mit Sonic Foundry NR
   - 
    str  Ebsdorf /
    Marburg a.d. Lahn (116 / N' 19,10)
    2. Bearb. 16.1.2k2: 3x BP 170...6000 Hz; 3x Decl. Opt.2; Del. Silence;
    Izotope Ozone Harmonic Exciter; X-Noise 15 /22; Hard Limiter
    +16 /-1.5 dB; Enc. 32 kbs; kräftiger und ausgewogener als
    die zwar "UKW-mäßigere", doch mit deutlicher Präsenzdelle
    generierte 1. Version
   - 
    str 
     unbekannter Ort (18 [1936],
    niederdeutsch)
    2. Bearb. 14.10.2k1: Norm.97%; 5x Decl. Opt.2; BP 180...6000
    Hz; Del. Silence (autom., 26 Sek.!); SF NR; Blue Comp.; Norm.97%; Enc. 16
    kbps; klingt trotz 16 kbps durchsichtiger als die mit 32 kbps encodierte
    Version 1
    3. Bearb. 31.12.2k1: zusätzl. Harmonic Exciter; Waves
    X-Noise(tm); Hard Limiter +15/-2 dB, 2x BP 170...5500 Hz
    (zwischendurch jeweils Normalizing 90%), Enc. 16 kbps: keine wesentliche
    Verbesserung gegenüber (2)
    4. Bearb. (zum Vergleich mit 3, 31.12.2k1): 3x BP 170...5500
    Hz; Norm. 95%; 3x Decl. Opt.2; Del. Silence > 200ms (45 Instances); Harmonic
    Exciter; Waves X-Noise; Hard Limiter +15/-2 dB; Notch DTMF 60+180 Hz /47
    dB; Norm. 95%; 3 x Decl. Opt.2; Norm. 93%; Harm. Exciter 50%; Waves X-Noise;
    Norm. 90%; Enc. 16 kbps: keine wesentliche Verbesserung gegenüber
    (2)
    5. Bearb. 31.12.2k1: Fassung (2) + Hard Limiter +15
    /-2 dB; Harmonic Exciter; Normalizing 90%; BP 170...5500 Hz; Enc.
    16 kbps
    6. Bearb. 31.12.2k1: Fassung (2) + Norm. 90%; Harmonic
    Exciter; Norm. 90%; Waves X-Noise 43%; Hard Limiter +10 /-2 dB;
    Enc. 16 kbps; bisher durchsichtigste, "angenehmste" Version
   - 
    str
     Fredeburg /Meschede (Westfalen, 173
    / G' 16,9):
    Erstellt Aug. 2001. manEd; *Decl, NR, BP, sehr starke DynCP (mit
    Pump-Effekt) und Encodierung mit 32 kbps; in der ersten
    Hälfte periodisch wiederkehrendes Kratzen innerhalb der
    Nutzmodulation ebenfalls hervorgehoben; Alternativen:
    2.- 4. (vergleichende) Bearb. = Schmalband-Fassung:
    13.9.2k1: manEd usw.; zusätzlich SF-NR 2.0a; Blue Compressor;
    Encoding mit 12 kbps unterdrückt einen Teil des in der ersten
    Hälfte störenden Kratzens; 
    5.- 7. (vgl.) Bearb. am 15.9.2k1: mehrfaches Declicking
    mit Option 1 "Constant Hiss & Crackle" (zus. ca. 500.000
    Clicks fixed!), Hard Limiting und Mehrfach-Bandpaß (Encoding
    32 kbps erforderlich) bringen keine Verbesserung.
    8. Bearb. 11.+12.10.2k1: Norm.95%; Decl. Opt.2; Norm.95%; 15x
    Decl. Opt.2; BP 180...5500 Hz; Norm.95%; SF NR; Norm.95%; Del. Silence;
    Blue Compr.; Norm.95%; BP 180...5000 Hz; bis 0:42'7 5x Decl.
    Opt.1; [12.10.] Amplitude einiger Kratzstörungen und sonstige
    auffällige Maxima auf ca. 35-50% red.; Norm. 95%; Decl. Opt. 2; Enc.
    16 kbps, als 3. Fassung publiziert. Das durch partielle Verunreinigung
    oder Beschädigung der Platte entstandene periodische Kratzen ließ
    sich auch durch diese Neubearbeitung nicht tilgen.
   - 
    str
     Freudenstadt /Schwarzwald (163 /
    p' 17,3; red. bearb.)
    2. Bearb. 15.1.2k2: Norm. 92%; 3 x BP 170...6000 Hz; 3x Decl.
    Opt.2; Del. Silence >200 ms (48 / 22,3"); Decl. Opt.2; Del. Silence (4
    / 0,5"); Decl. Opt. 2; Del. Sil. (4 / 0,5"); manEd.; Decl. Opt. 2; Del. Sil.
    (2 / 0,4"); Hard Limiter +15 / -2 dB; BP 170...5500 Hz; Norm. 92%;
    X-Noise 24 / 25; SF Noise Red. 33.4 / 9.4/..3.3 / 4dB;
    Norm. 90%; Enc. 32 kbps; klingt etwas ausgewogener und weniger verzerrt
    als die eine Präsenzdelle aufweisende Version 1.
   - 
    str
     Groß-Strengeln /Angerburg (Ostpreußen,
    084 / V 98,10; red. bearb): durch viele Clicks und
    Crackles (auch innerhalb der Nutzmodulation) gestört;
    trotz dieses Umstands und der stark politischen Färbung wegen der
    dialektalen Relevanz in das Proben-Corpus integriert.
    1. Bearb. 18.1.2k2: 3x BP 170...5500 Hz; 3x Decl. Opt.2; 2 x Decl.
    Opt.1; Del. Silence >180 ms (12 / 3,2"); Izotope Ozone MB Harmonic
    Exciter (Bd.2+3); X-Noise 12 /26; Decl. Opt.2; Del. Sil. (12 /3,6"); Hard
    Limiter +15 /-1 dB; Norm. 70%; BP 180...5000 Hz; Norm.
    90%; Enc. 16 kbps
   - 
    str
     Hamburg-Finkenwerder (011 / d 26,8):
    Ältere Aufnahme (# 11). Probe erstellt Aug. 2001. manEd; *Decl, BP,
    DynCP, nochmals BP. Durch Dynamik-Kompression dialektrelevante Lautungen
    hervorgehoben. Stimmton schlank, Sprachgebung, Inhalt + Intonation
    gut didaktisierbar.
    2. Bearb. 24.9.2k1: Normalizing 95%; 5 x Declicking Option
    2; BP 120...6000 Hz; SF-NR 2.0a; Blue Compr.; Normal. 95%; manEd; BP 140...6000
    Hz; Blue Compr.; Norm. 95 %; Enc. 16 kbps: Stimmton sonorer,
    Brillanz-Anhebung
    3. Bearb. 11.1.2k2: länger (2'27"); Norm. 95%; 2x BP
    170...5500 Hz; Decl. Opt.2; Del. Silence >170 ms (44 Instances = 20,17");
    Decl. Opt.2; Del Silence w.o. (2 Inst.); Decl. Opt.2; Del. Sil. (5 Inst.):
    Decl. Opt.2; Del. Sil. (3 Inst.); Decl. Opt.2; Harmonic Exciter 82,5%;
    X-Noise Thresh. 12.1; Hard Limiter 10/-3 dB; Norm. 90%; X-Noise w.o.
    [2]; Enc. 16 kbps. 
    Erkenntnisse:
    
      - 
	Dialektrelevante schwachtonige Lautungen lassen sich durch das Hard
	Limiting besser hervorheben (und damit didaktisieren); hierdurch gewinnt
	die Lesbarkeit (Verständlichkeit)
      
 - 
	Nach jedem weiteren Declicking konnten neu gewonnene Leerstellen (Silence
	>170 ms) getilgt werden; insgesamt wird die Datei dadurch ca. 26 Sekunden
	kürzer und damit der Erzählfluß wesentlich verbessert.
    
 
   - 
    str
     Holt, Gemeinde Straelen /Geldern
    (231 / C' 4,5; 14.1.2k2/wv)
    Bearb. 14.1.2k2: Norm. 93%; 2x BP 170...5500 Hz; Decl. Opt.2; Norm. 90%;
    Harmonic Exciter; Hard Limiter +15/-1 dB; 3 x Decl. Opt.2; manuelles
    Tilgen v. Leerstellen (2'04" > 1'52"); Waves X-Noise 17.1 / 27; Enc. 16
    kbps
   - 
    str  Jabel / Waren,
    Mecklenburg (105 / d 42,2)
    2. Bearbeitung 17.10.2k1: zusätzlich SF NR; BP 170...5500
    Hz; Blue Compr.; Norm.95%, Enc. 16 kbps, dennoch durchsichtiger als
    1. Version mit 32 kbps.
   - 
    str  Kassel
     (281 / F' 23,10; red. bearb.)
    3. Bearb. 14.1.2k2: Norm. 90%; 3 x BP 170...6000 Hz; Decl.
    Opt.2; Del. Silence >175 ms (34 / 13,41"); ** Hard Limiter +15
    / -2dB; X-Noise 11 / 21; Encoding 16 kbps
    4. Bearb. 14.1.2k2: von ** an Hard Limiter +15
    /-3 dB; (alternativ) Sonic Foundry NR 75.5/13.7/...3.31/6;
    Hard Limiter [2] +3 /-2 dB; Enc. 16 kbps. Da - wegen
    Verzerrungsgefahr - der Harmonics Exciter hier nicht in Frage kam
    und sich ohne Höhenanhebung X-Noise ebensowenig empfahl, wurde
    statt dessen kombinatorisch Sonic Foundrys Noise Reduction
    verwendet und dabei der Bereich um 3,1 kHz um 6 dB angehoben. Hierdurch
    entstanden einige weit über 90% hinausgehende Amplitudenspitzen; mit
    nochmaligem Hard Limiting (+ 3dB) wurde das Signal durchgängig
    auf ca. 90% begrenzt sowie Lesbarkeit und Eindringlichkeit
    nochmals verbessert. Bei stark reduziertem Wiedergabe-Output bleibt die
    Verständlichkeit dennoch erhalten - im Gegensatz zu einem Sprachfluß
    mit "natürlicher" Amplitudenstatistik.
    5. Bearb. 23.1.2k2 (Probe wegen ihres trockenen Humors nur
    leicht gekürzt)
    Norm. 92%; 1 x Clickfix 2.04; 3x BP 170...6000 Hz; 3x Decl. Opt.2;
    Hyperprism Harmonic Exciter (odd + even); X-Noise; Del. Sil.
    >260ms (76 /34"); Izotope Ozone MB Harmonic Exciter; dB Mastering
    Limiter; Norm. 90%; man.Ed.; Enc. 16 kbps
   - 
    str
     Kunzendorf b. Neurode / Glatz
    (Niederschlesien, 204 / O' 66,3): 
    sehr lautes Knistern, dumpfe Sprachmodulation; nach zunächst
    "konventionellem" Vorgehen
    2. Bearb. 10.10.2k1: Norm. 95%; BP 160...6.000 Hz; Normal. 95%; 5x
    Decl. Opt.2; Del.Silence + manEd; 5 x Decl. Opt.2; SF NR; BlueComp; Norm.
    95%; Encoding 16 kbps
    3. Bearb. 17.1.2k2: 3x BP 170...5500 Hz; 4x Decl. Opt.2; Del.
    Sil. >180 ms (38 /20"); Izotope Ozon MB Harmonic
    Exciter; 3x Decl. Opt2; Arboretum Harmonic Exciter;
    SF Noise Red. 64.5 /15.7/...2.9/2 dB; Hard Limiter +15
    /-1.5 dB; BP 170...4500 Hz; Hard Limiter [2] +4 /-1.5 dB; Enc. 16
    kbps. Diese Bearb. stößt an die Grenzen des Machbaren. Die extreme
    Ketten-Filterung bringt zwar Verbesserungen, hebt die Nutzmodulation aus
    dem Störnebel heraus und verbessert die Lesbarkeit, doch
    hinterläßt Sonic Foundrys Noise Reduction (hier
    eindeutig Waves' X-Noise überlegen!) einen etwas "künstlichen"
    Klang; die dafür verantwortlichen Obertöne werden durch das relativ
    schmalbandige Encoding mit 16 kbps größtenteils weggefiltert,
    so daß das Real-Audio-Endprodukt wieder natürlicher klingt.
    4. Bearb. 17.1.2k2: das weiterentwickelte Direct-X-Plugin Clickfix
    V. 2.06 arbeitet in nur einem Durchgang schneller und
    gründlicher als das in Cool Edit Pro 1.2a implementierte Declicking
    und ermöglicht zudem ein Vorhören in Echtzeit; hernach 1
    x BP 170...4500 Hz, Del. Silence >180 ms (38 / 22"); Izotope Ozone MB
    HE; SF NR 43 / 11.7...3 / +3 dB; ** Hard Limiter +15 / -1.5 dB; Normal. 90%;
    aufgrund von Rauheiten bei 16 kbps mußte zu 32 kbps *.ra
    encodiert werden. Das Endprodukt klingt geschlossen und natürlicher
    als Version 3.
    5. Bearb.: von ** an alternativ dB Audioware Mastering
    Limiter + Normal. 90%; klingt bei identischem Amplituden-Maximum lauter
    und kräftiger als Version 4.
   - 
    str
     München (052 / t' 36,2; 3. Fassung
    31.12.2k1): zusätzl. Hard Limiter +10 /-2 dB; Enc. 16 kbp
    4. Bearb. 14.1.2k2: Norm. 90%; 2x BP 170...5500 Hz; Decl. Opt.2;
    Del. Silence (51 / 16,9"); Decl. Opt.2; Harmonic Exciter; Hard
    Limiter +15/-2 dB; 3x Decl. Opt.2; X-Crackle 82.1 / 56;
    X-Noise 28.8 / 46; 2 x Decl. Opt.2; Man.Ed. (redaktionell); Hard
    Limiter [2] +6 / -2 dB;  X-Noise [2] 22/25; Enc. 16
    kbps. Mittels dieser langen "Filterkette" konnten dialektrelevante Lautungen
    hervorgehoben werden.
   - 
    str  Ostrohe
    /Norderdithmarschen (185 / V 21,12)
    sehr störendes Knistern, dumpfe Modulation; deshalb
    2. Bearb. 11.10.2k1: Norm.95%; Decl. Opt.2; Norm.95%;
    10x Decl. Opt.2; BP 180...5500 Hz; Norm.95%; SF NR;
    Norm.95%; Del. Silence; Blue Compr.; Norm.95%; Enc. 16 kbps
   - 
    str  Ramsloh
    (Saterland, 223 / i 13,3)
    3. Bearb. 16.1.2k2: 3x. BP 170...6000 Hz; 3x Decl. Opt.2; Izotope
    Ozone Multiband Harmonic Exciter; X-Noise 24b / 25;
    Del. Silence >200 ms (14 / 8,2"), Del. Sil. > 180 ms (4 / 0,5"); Hard
    Limiter +20 / -1.5 dB; Enc. 16 kbps; bisher "schärfstes"
    Limiting, dadurch optimale Darstellung der schwachtonigen dialektrelevanten
    Lautung.
   - 
    str  Sankt
    Andreasberg im Oberharz (019 / A' 30,2)
    Ältere Aufnahme, hohes Grundgeräusch, daher *Decl,
    NR, BP, DynCP mit Normalizing ca. 95 dB; manEd; Wert gelegt wurde
    weniger auf Ästhetik denn auf optimale Informationsvermittlung und
    Verdeutlichung dialekttypischer Lautmerkmale, die durch 16-kBit-Encoding
    zur Geltung kommen.
    2. Bearb. Cuxhaven, 9.10.2k1: Norm. 95%, 5 x Declicking (Option
    2), BP 160...6000 Hz ext./18. Ordnung; Delete Silence (manEd), SF NR; Blue
    Compr.; BP 170...6000 Hz w.o.; Norm. 95%; Encoding 32 kbps
    3. Bearb. 30.11.2k1: Norm 95%, Waves X-Noise (Mittenpos.),
    Enc. 32 kbps
   - 
    str  Scheie b.
    Bückeburg /Schaumburg-Lippe (014 / t 21,5;
    12.1.2k2/wv)
    12./13.1.2002: Erste Bearbeitung dieses ziemlich beschädigten, aber
    historisch und erzähltechnisch interessanten Tondokuments. Nach
    Filterung (BP 18. Ordnung, 170...5500 Hz) und mehrmaligem
    Declicking (Option 2) mit Hyperprisms Harmonic Exciter die
    Brillanzen angehoben (Pre-Emphasis) + 1 x Decl. Opt. 2 (zur
    teilweisen Tilgung der mitverstärkten restlichen Nadelimpulse), damit
    nach anschließendem X-Noising (entspricht hier
    De-Emphasis) noch genügend "Substanz" im Hochtonbereich
    verfügbar ist. Via Hard Limiter die schwachen Anteile der
    Amplitudenstatistik um 10 dB angehoben und der Maximaloutput auf -0.5 dB
    begrenzt. ** Danach Normalizing 90% und 2 x BP 170...5500 Hz Sonic
    Foundry Noise Reduction (max., mit Anhebung 5 dB um 2900 Hz), 3 x
    Declicking Opt. 2, manuelles Tilgen aller Leerstellen (wegen der
    Crackles aufgrund von Schallplattenschäden nicht automatisch
    möglich) und Encoding mit 16 kbps.
    2. Bearb. 13.1.2k2: von ** an manuelles Tilgen aller Leerstellen
    (ca. 30 Sekunden gewonnen!); multiples Declicking (Opt. 2); Normal.
    93 %; *** Enc. 16 kbps. Im Vgl. zu Fassung 1 geringfügig weniger
    Höhen, etwas voller.
    3. Bearb. 13.1.2k2: von *** an Hard Limiter +10/-1 dB;
    Waves X-Noise Thresh. 31.7 / Red. 18; Enc. 16 kbps; SNR und
    Lesbarkeit verbessert
   - 
    str
     Waldbüttelbronn / Würzburg
    (125 / Y' 26,11; red. bearb.)
    3. Bearb. 24.1.2k2: Norm. 90%; 5x Decl. Opt2; Ddel.
    Silence >220ms (25"); manEd; Izotope Ozone MB Harmonic Exciter;
    X-Noise 15 /35; DB Mastering Limiter; => *.wav; REnc. 3.1 =>
    16 kbps
   - 
    str  Warbeyen /
    Kleve (230 / z 4,1)
    2. Bearb. 28.12.2k1: zusätzl. Hard Limiter +15/-2
    dB, BP 180...6000 Hz, Norm. 87%; Enc. 32 kbps
   - 
    str  Wulfen
    / Recklinghausen (229 / A' 9,1):
    Erstellt Aug. 2001; wie in [5] durch
    manEd viele Pausen verkürzt und Sprachfluß wesentlich
    verbessert; *Decl, BP, DynCP; 16-kBit-*.ra; ausgezeichnete Verständlichkeit
    auch nebentoniger dialektrelevanter Lautfolgen.
    2. Bearb. 10.10.2k1: Vorgehen wie in [019], noch weiter verbesserte
    Tonqualität durch 32 kbps
   - 
    str  Zechendorf
    /Deutsch Krone, Grenzmark (Pommern, 072 / g 66,3)
    3. Bearb. 16.1.2k2: 3x BP 170...6000 Hz; 3x Decl. Opt.2; Izotope
    Multibd. Harm. Exciter; X-Noise 15 /20; SF Noise
    Reduction -7.2 /-5.5/...2.9/10; Del. Silence >180 ms (10 /1.5"); Hard
    Limiter +16 /-1.5 dB; Enc. 16 kbps; Resultat wie in #223 (Ramsloh).
 
IV. Zusammenfassend läßt sich folgendes feststellen:
  - 
    Ältere Aufnahmen sind nicht selten behaftet mit unangenehmen
    Störungen, die unter kritischer Abwägung physikalischer,
    kommunikativer und rezeptionsästhetischer Aspekte und
    im Hinblick auf die spätere wissenschaftliche (*.wav) und/oder
    didaktische (*.wav, *.mp3, *.wma, *.ra) Verwendung so zu mindern
    sind, daß hierdurch keine Artefakte (künstliche Zusätze)
    und sonstige Verfremdungen entstehen; an Störungen unterscheiden
    wir:
    1.1. bei Schallplatten (um die es hier ausschließlich
    geht) / => Gegenmaßnahmen:
    
      - 
	mehr oder weniger starkes Grund-Rauschen (Abnutzung, Nadelgeräusche)
	=> Naßabtastung + Nadelfilter
	(Tiefpaß) bzw. De-Hissing
      
 - 
	Knacken (radiale Sprünge bzw. mutwillige Einritzungen)
	=> Naßabtastung + Declicking
      
 - 
	Kratzen (longitudial und radial fortschreitend, meist aufgrund einer
	fleckförmigen Verunreinigung oder Beschädigung)
	=> mechanische Reinigung und / oder
	Naßabtastung + De-Noising
      
 - 
	Poltern / Rumpeln (durch abnutzungs- oder
	fabrikationsbedingte Rillenschäden oder horizontale
	Verwerfungen) => Rumpelfilter
	(Hochpaß)
      
 - 
	Pops
	(Wind- und Artikulationsgeräusche bei der Aufnahme)
	=> manuelle oder automatische Tilgung,
	sofern ohne Einbuße der Nutzmodulation und des Informationsgehaltes
	möglich
      
 - 
	Knistern (durch elektrostatische Aufladung bei Wiedergabe)
	=> Naßabtastung + Declicking
	und / oder De-Hissing
	
	  
	    Anmerkungen:  
	      (a) Auch wenn erklärtermaßen gute Bandkopien vorhanden
	      sind, ist ein erneutes korrigierendes Abtasten der
	      Original-Tonträger (Matrizen, Tonfolien, Platten) anzustreben, denn
	      1. könnten bei der Erst-Abtastung Unachtsamkeiten und/oder technische
	      Fehler aufgetreten sein, 2. wurden seit etwa 1960 Gerät (Tonarme, Systeme,
	      Antriebe, Verstärker) und Methoden (Naßabtastung, Ladungsabbau)
	      entscheidend verbessert. 
	      (b) Beim Abtasten ist zu achten auf: 
	      1. optimale Schonung (=minimalen Verschleiß) des Tonträgers durch
	      adäquate Auflagekraft 
	      2. sichere Rillenführung des Abnehmersystems (kein Schlingern) 
	      3. Minimierung tangentialer Abtastfehler 
	      4. Ableitung elektrostatischer Ladung an Masse (mittels Zusatz-"Tonarm",
	      der zugleich die Platte mit einer klaren
	      (H2O dest.) oder
	      Reinigungsflüssigkeit (wg. klebriger Rückstände nicht
	      zu empfehlen!) benetzt. | 
	  
	
     
    
    1.2.  Die mit der HF-Vormagnetisierung (1940)
    wesentlich verbesserten Tonbänder (heute: analoge
    Offenspulen- und Cassettenbänder) können gestört
    sein durch:
    
      - 
	Grund-Rauschen (infolge lagerbedingter Magnetisierung oder
	mangelhaftem Aufnahme-Störabstand)
      
 - 
	Brummen (Wechselstrom-Einstreuungen infolge mangelhafter Abschirmung
	oder Erdung)
      
 - 
	Modulationsrauschen bzw. (der Modulationskurve
	überlagerte) Rauschfahnen
      
 - 
	Knacken (elektrostatische Aufladungen /
	Schaltstörungen schon bei Aufnahme bzw. nur beim Abspielen oder
	infolge Schneidens mit aufmagnetisierter Schere)
      
 - 
	Knistern (elektrostatische Aufladungen beim Abspielen)
      
 - 
	Poltern / Rumpeln (durch elektrische bzw. mikrofontechnische
	Aufnahme-Fehler)
      
 - 
	Pops (Wind- und Artikulationsgeräusche bei der Aufnahme)
      
 - 
	Dropouts (kurzzeitige Aussetzer durch Beschichtungsfehler)
      
 - 
	(meist periodische) Lautstärkeschwankungen (durch
	bandführungsbedingte Aufnahme- /Wiedergabefehler oder unbeabsichtigte
	Teil-Löschung in starkem Wechselfeld)
      
 - 
	"Schwimmen" im Hochton-(=Brillanz-)Bereich (durch Azimuth-Fehler
	bei der Aufnahme oder Wiedergabe)
     
   - 
    Die früher ausschließlich mechanisch und/oder mit bescheidenen
    elektrischen Filtern bewerkstelligte Schallplatten-Restauration
    erfährt heute durch computativ-digitale Verfahren
    ganz wesentliche Verbesserungen. Letztere sind unerläßlich, wenn
    wir die Originalplatten nicht (mehr) abtasten können und auf mehr oder
    weniger gute Tonband-Kopien angewiesen sind. 
    Unter den digitalen Hilfsmitteln spielt der Click/Pop/Crackle
    Eliminator eine informationstechnisch wie hörästhetisch
    entscheidende Rolle. Das Programm Cool Edit 1.2a, an dem wir
    uns orientieren, bewertet als mechanisch und elektrisch bedingte
    Stör-Phänomene neben den sog. Pops (s.o.)
    
      - 
	Constant Hiss and Crackle (gleichmäßiges
	Rauschen und Krachen/Knattern),
      
 - 
	Hiss + Lots of Clicks (Rauschen und oftmaliges Knacken/Knistern)
    
 
    
    Anmerkungen:
    
      - 
	Sie können das Declicking stark gestörter Aufnahmen vereinfachen
	und beschleunigen, indem Sie zuvor 
	a) die hochfrequenten Impulsanteile ausfiltern (Bandpaß)
	und / oder
	b) im Zusammenhang mit einer Sprechpausen-Verkürzung möglichst
	viele Pausen-Clicks manuell tilgen.
       - 
	Vor jeder Entstörung sind mit "Auto Find All Levels" die Bezugspegel
	des Samples zu ermmitteln.
      
 - 
	Entstören wir nach [1], so werden schon in einem Durchgang praktisch
	alle als Clicks identifizierten steilflankigen Impulse getilgt
	(xxx fixed, 0 rejected), also auch solche innerhalb der Nutzmodulation,
	wodurch dort sehr kurze Dropouts entstehen, die das Signal holprig
	und zerrissen klingen lassen. In den allermeisten Fällen empfiehlt
	sich [2]; hier werden meist nur störende Pausen-Clicks
	getilgt (wir können das auch graphisch an der Veränderung
	des Modulationsverlaufs ablesen), andere zurückgewiesen (rejected) und
	daher belassen.
      
 - 
	Wiederholen wir diese Prozedur (= multiples Declicking), so werden
	möglicherweise jeweils hunderte oder gar tausende weiterer (kleinerer)
	Clicks getilgt, was sich nur geringfügig auswirkt, doch zur weiteren
	Beruhigung des Signals beitragen kann. Die Bearbeitung des
	Kasseler Beispiels zeigte, daß etwas
	rauh modulierte Stimmen dabei "rissig" werden können. In solchen
	Fällen sollte nach nur einmaligem Declicking
	
	  - 
	    SONIC FOUNDRYs "Noise Reduction  2"
	     oder
	  
 - 
	    WAVES (tm) X-Noise(s. auch unten)
	
 
	
	bemüht werden:
	** Durch zu scharfe Präsenz- bzw. Brillanzanhebung werden mit SF NR
	in der Nutzmodulation liegende Clickstörungen zurückgeholt.
	---
    
 
   - 
    Allgemein ist ein ausgewogenes Klangbild anzustreben: das von Technikern
    wie dem früher sehr bekannten Ing. Fritz KÜHNE
    geforderte Idealprodukt 400.000 aus tiefster und höchster Frequenz
    (also 40...10.000 Hz, 80...5.000 Hz, 100...4.000 Hz) entspricht dem früher
    favorisierten "warmen" (Mittelwellen-)Klang. Wird dieses audiophile
    Ideal strikt beachtet, so entstehen in apparativ bzw. akustisch ungünstigen
    Fällen möglicherweise überproportional dumpfe bzw.
    baßlastige Aufnahmen mit folgenden Nachteilen:
    
      - 
	die Grund(ton)frequenzen beanspruchen den größten Teil innerhalb
	der Amplitudenstatistik und damit auch der nutzbaren Übertragungsenergie
      
 - 
	"bumsige" Signale neigen zur Übersteuerung
      
 - 
	Trittschall und andere tieffrequente Störungen (Möbelrücken,
	Türenschließen usw.) in unprofessionellen Aufnahmen behindern
	mehr als gewöhnlich die Sprachverständlichkeit.
    
 
    
    Dumpf klingende Signale können mit einer Kombination verschiedener
    Methoden verbessert werden:
    
      - 
	steilflankiges Abschneiden im Grundtonbereich unter 150 / 180 Hz,
	ggf. als Bandpaß-Parameter. Generell darf eine Tiefenabschneidung
	nicht so weit gehen, daß das Signal spitz, körperlos und
	"künstlich" klingt.
      
 - 
	Frequenzkorrektur (=Anheben des formantkritischen Bereichs) mit einem
	Parametrischen Equalizer oder dem Noise-Reduction-Modul (NR 2.0a)
	von Sonic Foundry
      
 - 
	Dynamik-Kompression oder Hard Limiting, danach ggf. (nochmals)
	Bandpaß 180...5500 Hz.
    
 
    
    Dadurch erhöhen sich Sprachverständlichkeit und
    Störabstand (signal-to-noise ratio), damit die wahrnehmbare
    Lautstärke der Sprachinformation. Durch zusätzliche
    Dynamik-Kompression oder ein verzerrungsarmes Hard Limiting
    ergibt sich ein seit langem in der drahtlosen Nachrichtenübermittlung
    (z.B. Überseerundfunk, Amateurfunk) bekannter Effekt: die Sprache wird
    schon bei geringer Leistung als lauter, eindringlicher empfunden
    als ein unkomprimiertes, "natürliches" Signal mit seinen in der Regel
    hohen Amplitudendifferenzen. Positiv betroffen sind hierbei vor allem
    druckschwache Laute wie /s/, /f/, /k/, /t/ oder /ch/, die in stark
    gestörten und/oder schmalbandigen Aussendungen oft kaum wahrzunehmen
    sind, andererseits die Hauptrolle spielen in puncto
    Sprachverständlichkeit und Dialektdistinktion. Ein gutes
    Beispiel für eine solche methodische Kombinatorik ist die (am 8.3.2003
    erstellte) Lautdenkmal-Probe aus Worpswede, wo in
    zwei Durchgängen mit einem Bandpaßfilter 12. Ordnung jeweils bei
    150 Hz abgeschnitten und das Signal per Hard Limiting und
    Dynamik-Kompression nivelliert wurde; zudem wurden überlange
    Pausen getilgt und trotz der Filterung und des mehrmaligen
    De-Clickings verbliebene Störgeräusche zweimal mit
    Wavestm-X-Noise so weit reduziert, daß zuvor mit
    einem Harmonic Exciter angehobene Präsenz- und Brillanzanteile
    des Spektrums zugunsten der didaktischen Präsentierbarkeit erhalten
    blieben.
    Wenn zu "scharf" eingestellt, erzeugen Software-Kompressoren (z.B.
    Blue Compr. von DigiLogue) eine Art Raumresonanz-Effekt, der
    besonders in längeren Hör-Dateien demotivierend wirkt. Wenn
    es nicht möglich ist, diesen Effekt rückgängig zu machen (und
    statt dessen den klangneutraleren Hard Limiter einzusetzen), ist der
    Resonanz-Anteil im Spektrum mittels Notch-Filter zu reduzieren.
  
 - 
    Für breitbandige, aber beträchtlich gestörte
    (Knistern, Knacken, Schaben) Aufnahmen (wie
    Fredeburg /Meschede) empfehlen sich folgende (*
    ggf. mehrmalige) Maßnahmen:
    
      - 
	* Bandpaß (Tschebyscheff, 18. Ordnung) ca. 170...6000
      
 - 
	* Declicking (Option 2)
      
 - 
	X-Noise und/oder SF Noise Reduction oder
      
 - 
	De-Noising mit 40 dB (High Hiss Reduction) und hohem
	Präzisionsfaktor (20)
      
 - 
	Dynamik-Kompression oder Hard Limiting (+10 / -2 dB); wenn
	optimal eingestellt, ist der HL ist klangneutraler und wirkungsvoller.
    
 
    
    Weiteres dazu:
    
      - 
	multiples Declicking (s.o.) und Höhenabschneidung erst
	ab ca. 7 kHz, wenn Bandbreitenerhalt gewünscht
      
 - 
	Dynamik-Kompression mit
	digilogue
	BlueCompressor (max.
	Soft-Knee-Einstellung)
	oder
	Sonic
	Foundry Track Compressor nur dann, wenn hierbei kein verfremdender
	Raumresonanz-Effekt entsteht
      
 - 
	Bursts: Das periodische Schaben bzw. Kratzen der Fredeburg-Aufnahme
	kennen wir von vielen anderen älteren Schallplatten; Ursachen sind partielle
	Verunreinigungen (Verklebungen, Schmutzflecken; chemisch entfernbar) oder
	Zerstörungen. Genau betrachtet, handelt es sich hier um eine stetig
	wiederkehrende definierte Folge ultra-kurzer Nadelimpulse, die zusammen einen
	Burst bilden; tritt dieser in Modulationspausen auf, ist er problemlos
	zu tilgen, nicht jedoch, wenn er der Nutzmodulation überlagert ist.
	Gelänge es, ein Filter zu konstruieren, das den Burst im Echtzeit-Durchgang
	oder einem anderen Bearbeitungsmodus (z.B. gegenphasig) auslöscht, so
	wäre das ein Durchbruch in der restaurativen Tonbearbeitung.
    
 
   - 
    Alternativen zum Declicking :
    
      - 
	ggf. mehrmaliger Bandpaß (s.o.)
      
 - 
	Hiss / Noise Reduction auf der Basis eines automatisch ermittelten
	Noise Floors
	bzw. Noise Profiles. Eine NR mit 40 dB oder mehr filtert nicht
	nur die hochfrequenten Störimpulse weg; sie beschneidet auch den
	Nutzfrequenzgang sowohl im Grundton- wie vor allem im
	Brillanzbereich. 
	b) extrem steilflankige Bandpaßfilterung (200...3500 Hz) und
	/ oder 
	c) *.ra-Encodierung mit nur 8 (oder gar 6) kBps.
     
   - 
    Maßnahmen gegen Verzerrungen:
    
      - 
	präventiv bei steilflankiger Bandpaßfilterung:
	"normalisieren" Sie vor einer solchen Maßnahme auf etwa 80 bis
	85%
      
 - 
	korrigierend: gehen Sie in den Modus Noise Reduction / Clip
	Restoration und wählen Sie "Lightly Clipped". Wird die betroffene
	Passage dabei zu stark abgesenkt, korrigieren Sie sie mit einem den
	Durchschnittsmaxima entsprechenden Normalizing.
    
 
   - 
    Bandpaßfilterung, Dynamik-Kompression / Hard
    Limiting und Normalizing bis ca. 90 % erhöhen zusammen
    Lautstärke und damit Verständlichkeit
    nebentoniger Lautsequenzen, die (z.B. als Flexionsendungen) meist
    dialektale Merkmale enthalten.
  
 - 
    Stark gestörte und schmalbandige Aufnahmen können
    informationell verbessert werden durch:
    
      - 
	* Bandpaß 180...3000 Hz
      
 - 
	* Declicking (Option 1)
      
 - 
	X-Noise (maximal) und / oder Encoding mit 8,5 kbps
    
 
    
    Senken Sie generell Zischlaute und Obstruenten nur so weit ab, daß
    Sprachverständlichkeit und Dialektdistinktion erhalten
    bleiben, auch wenn dies zu Lasten der Hör-Ästhetik geht.
  
 - 
    Breitbandige, wenig gestörte Einspielungen erfordern nur
    geringfügige Filtermaßnahmen (BP 80...8.000 Hz, X-Noise) und
    können als 32-kBps-*.ra encodiert werden, sofern nicht angestrebt wird,
    wie im Falle von Danzig,
    Elbing und Jabel, nach
    zusätzlichem Declicking und (höhenanhebender) SF-Noise Reduction
    (nachbearbeitend) eine Basis für "pre-emphatische" 16-kbps-Encodierung
    zu schaffen.
  
 - 
    Sichern Sie grundsätzlich alle
    Bearbeitungs-Zwischenschritte (*.mp3 / 64 kBps reicht aus).
    Protokollieren Sie die jeweiligen Maßnahmen und
    Einstellungen.
 
Links:
  - 
    How
    to begin restoring old records (Allen Rény)
  
 - 
    About
    sound restoration (Sound & Vision Engineering Department Technical
    University of Gdansk)
  
 - 
    Audio
    preservation and restoration (Univ. Libraries, Univ. of Washington;
    Bibliographie)
 
(c) Dr. W. Näser 8/2k1 
Wird ergänzt. Stand: 7.4.2003