JAZZ-HARMONIE-LABOR: TONSYSTEME

Hauptseite (Gesamtübersicht)   

Diese Seite basiert auf einem z.T. komplexen Zusammenspiel von Akustik (physikalische, mathematische, physiologische und psychologische (siehe insb. unten 14), visualisierende) und Informatik.
Generell (Ausnahmen sind unten vermerkt) berechnet sie (der Computer) zudem verwendete oder veränderte Sample-Sequenzen, allenfalls grafische Darstellungen etc. und Veränderungen hiervon in Echtzeit.

Die Seite kann daher je nach Verwendung den Computer leistungsmässig andauernd stark belasten (Netzwerk, Batterie (Laptops...) etc.). Empfehlung: Seite nach Gebrauch explizit schliessen!
Insb. auch das Laden (auch ein Reload) und Vorbereiten dieser Seite benötigt je nach Netzwerk, Computer oder Browser einige Sekunden. Bitte daher warten, bis die drei Felder unten auf Grün stehen und / oder
die Hintergrundfarbe der Seite auf Gelb wechselt. Während der Ladezeit kann aber bereits nach unten gescrollt werden um die entsprechenden Laborpositionen anzusteuern rsp. zu suchen
.
   ( auto )  

Ladezeit Mediataien ms.: 0    Ladezeit übrige Seite ms.: 0    AudioContext: ---

Man kann bei diversen Labor-Positionen eine Audio-Datei (MP3, WAV, OGG) mit einem Datei-"Explorer" laden (man kreiere allenfalls eine mit Labor-Position 18)
Eine Datei sollte immer unbedingt gewählt werden! Eine für den PLAYER nicht kompatible Datei führt zu einer Fehlermeldung und in gewissen Fällen zu einem Page-Reload (siehe oben)!
Und u.a. zur Informatik-Sicherheit!: Eine Datei mit der Erweiterung mp3 (oder MP3, wav, ogg etc.) muss nicht zwingend eine Audiodatei sein; eine Datei "dateiname.xyz" kann u.U. seine Audiodatei sein!
Dies gilt nicht nur für den Audio-Bereich oder dieses Labor. Man experimentiere selber auf dem jweiligen Computer! Wie reagiert er z.B. bei Datei-Umbennungen? Welche Risiken bestehen?

Pro Laborposition (1 - 18) ist nur ein PLAY gleichzeitig möglich (um neu zu starten zuerst STOP drücken oder Ende abwarten). Siehe aber dazu z.B. 9) Echo! I.d.R. können aber PLAYs verschiedener Laborpositionen gleichzeitig aktiv sein.

Zusätzliche Informationen liefert die Labor-Software auch via den Konsolen-Log des jeweilgen Browsers (z.B. unter MS Windows: FIREFOX CTRL+SHIFT+k; EDGE CTRL+SHIFT+c; CHROME CTRL+SHIFT+i).

Hilfreich sein können z.B. Links auf folgende Drittseiten rsp. -quellen:
Online-Rechner: Online Tontechnik-Rechner   Logarithmen   Integrale   Diverses Mathematik   Fourier-Transormation (-Synthese)   Funktionsgraphen-Darstellung

Theorie: Audio-Operatoren   Boris Smus: WEB-Audio-API   github: WEB-Audio-API   mozilla: AudoWorkletNode   Streaming / Recording / Downloading   Audiodatenkompression
Fourier-Reihen   Fourier-Analysis   Phasenverschiebung   Time-Stretching   Pitch-Shifting

Zu den zum Teil verwendeten Grafiken (Oszillatoren etc.): Diese sollten i.d.R. ohne Erläuterung verstanden werden. Ansosnten wird jeweils entweder eine grobe Erläuterung gegeben oder aber man findet eine solche in der Labordokumentation.
Es werden zudem sowohl einkanalige ("Mono") wie mehrkanalige ("Stereo ") Beispiele verwendet. Dargestellt wird grafisch immer nur ein Kanal (Begründung siehe auch Labordokumentation).









GENERELL SETZBARER PARAMETER:

Main Gain (x 100): Nur für Piano- und Schlagzeugs-Samples und z.T. Oszillatoren. Aber nicht für MP3-/WAV-/OGG-Dateien und Line-/Mikro-In.

100


1) IM LABOR VERWENDETE PIANO-SAMPLES (QUELLE: UNIVERSITÄT IOWA):

                     

                     

                     

                     

                     

                     

                     



2) WEITERE IM LABOR VERWENDETE SOUND- UND VIDEO-QUELLEN:

  Siehe z.B. auch: Sample- und Bit-Rate, Bit-Tiefe, Kanal, Bandbreite, Buffergrösse, Abspieldauer, Playbackrate, WAV, AIFF, MP3, OGG, WMV, AAC etc. und LAME


2a) SCHLAGZEUG- UND METRONOM-SAMPLES



2b) MP3-/MP4-/OGG-/WAV-DATEIEN, MP4-VIDEO-DATEIEN, MIKROFON- RSP. LINE-IN-STREAMS

Unterscheide, aus welcher der folgenden Quelle Informationen über Audiodate(ie)n stammmen. Möglich sind primär:
• Z.B. ein Windows-Datei-Explorer rsp. Filesystem (FS);
Metadaten einer Audio-Datei selber (META);
• Das (jeweilige) WEB Audio API rsp. Javascript-Audio-System (JAS) welches Informationen eruiert rsp. berechnet;
• Das Ohr rsp. Hirn (OHR) des Höhrers (Bsp.: Die Verwendung von 2 (Buffer)-"Kanälen" muss nicht zwingend Stereofonie bedeuten;
• Implizites Wissen (IMP) oder Vermutungen über die Art der Analog-Digital-Wandlung und/oder über die Erstellung und Vorberbeitung der Audio-Datei (z.B. Kompression etc.) (IMP).

Quelle/Titel Audiodateien
Type (FS)
Buffer-Sample-Rate (JAS)
Bit-Rate (FS)
Buffer-Länge (JAS)
Buffer-Dauer (JAS)
Anzahl Buffer-Kanäle (JAS)
Dateigösse (FS)
UNI IOWA / Piano A4
MP3
48'000 Hz
320 KBit/s
71'281 Samples
1.485 sec.
2 (Stereo)
61 KByte
Diana Krall / Peel Me A Grape
MP3
48'000 Hz
128 KBit/s
16'926'094 Samples
352.627 sec.
2 (Stereo)
5'511 KByte
Diana Krall / Peel Me A Grape
OGG
48'000 Hz
1'411 KBit/s
16'926'094 Samples
352.627 sec.
2 (Stereo)
4'162 KByte
Ch. Burchell / Trompete
MP3
48'000 Hz
128 KBit/s
3'231'243 Samples
67.317 sec.
2 (Stereo)
1'053 KByte
P. Trachsel / Bluesakkordfolge
MP3
48'000 Hz
320 KBit/s
1'446'07 Samples
30.162 sec.
2 (Stereo)
1'180 KByte
P. Trachsel / MISTY
MP3
48'000 Hz
320 KBit/s
5'196'069 Samples
108.251 sec.
2 (Stereo)
4'231 KByte
P. Trachsel / MISTY (z.Z. nicht verwendet)
WAV
48'000 Hz
1'411 KBit/s
5'196'069 Samples
108.251 sec.
2 (Stereo)
18'694 KByte
P. Trachsel / Short Hammond-Sample
MP3
48'000 Hz
320 KBit/s
552'412 Samples
11.508 sec.
2 (Stereo)
452 KByte


Quelle/Titel direkte Eingänge
Type (IMP)
Audio-Parameter
Benutzer
Mikrofon rsp. Line-In
System- oder auch Benutzerbestimmt: Siehe unten Laborposition 18! "BLOB" anstelle einer konventionellen Datei.


Quelle/Titel Videos
Type (FS)
Bildbreite (FS)
Bildhöhe (FS)
Datenrate (FS)
Gesamtbitrate (FS)
Einzelbildrate (FS)
Birate (FS)
Kanäle (FS)
Abtastrate kHz (FS)
Dateigösse (FS)
Sample Videos / Sample Video
MP4
1'280
720
1'017 KBit/s
1'396 KBit/s
25/s
378 KBit/s
6
48'000
5'131 KByte


Zur Bit-Tiefe: Diese bestimmt die Anzahl Bits, welche der jeweilige Analog-Digital-Wandler (Analog -> Digital) pro Kanal-Sample zur Verfügung stellt. Je höher die Sampling-Rate und/oder Bit-Tiefe, desto "genauer oder naturgetreuer" wird von Analog nach Digital umgewandelt. Das digitale Javascript-Audio-System stellt seinerseits für je ein digitales Sample (rsp. Bufferelement welches je ein Sample trägt und der digitalen Bearbeitung (Effekte) des Mediums dient) generell 64 Bit zur Verfügung. Siehe auch Javascript Numbers). Je nach Art der Komprimierung bei der Erstellung einer Media-Datei (Digital -> Digital) wird die Informationsmenge für die ganze Datei mehr oder weniger reduziert (verlust- oder nicht verlustfrei). Daraus resultiert die "Bit-Rate" der Datei (siehe oben). Offensichtlich sind also Computer schnell genug, für die Verareitung digitaler Medien eine Bit-Tiefe 64 anzubieten. Dies ob nun die Bit-Tiefe des Wandlers so gross ist (war) oder nicht. Analog-Digital-Wandler bieten quasi immer "nur" eine Bit-Tiefe < 64 an. Dies einerseits aus technischen Gründen und auch weil die menschliche Wahrnehmung nur beschränkt differenzieren kann rsp. hohe Bit-Tiefen gar nicht "verdankt". Aus diesem Grund, aber auch weil kleinere Media-Dateien viele andere Vorteile haben (Speicherplatz, Netzwerkbelastung bei der Übertragung etc.) macht Komprimierung Sinn. Komprimierungs-Verfahren wiederum basieren z.T. auf math. anspruchsvollen Prinzipien und brauchen auch Speicher und Rechenzeit! Diese fallen aber oft nur bei der Erstellung einer Datei an werden daher dann in Kauf genommen. Die obigen Tabellenwerte beschreiben also (weitgehend) Parameter, welche sich auf eine mehr oder weniger komprimierte Mediadatei beziehen. Insb. kann z.B. aus der Bit-Rate i.d.R. nicht auf die Bit-Tiefe geschlossen werden. Für unkomprimierte Formate wie WAV und AIFF berechnet man Bitrate = Kanäle * Samplerate * Bit-Tiefe. Bei komprimierten Verfahren kann zudem die Bitrate konstant sein (CBR Modus) oder variabel (VBR Modus). Zudem: Der Begriff "Sample" wird (nicht nur in diesem Labor) zweideutig verwendet: Einerseits bezeichnet er einen Abtastwert eines Analog-Digital-Wandlers, andererseits versteht man unter einem Sample auch eine Media-Datei. So verwendet dieses Labor in letzterem Sinn z.B. 85 MP3-Piano-Samples, 12-Schlagzeug-Samples etc. (alles MP3-Dateien). Samples der letzteren Art werden oft als "Einzeltöne" (rel. kurze Abspieldauer) in digitalen Instrumenten (geeignet sind z.B. v.a. Tasteninstrumente und Schlagzeuge) verwendet. Formal können auch längere Media-Dateien (siehe oben) als Samples bezeichnet werden. So gesehen bestehen also "Samples" aus "Samples"...

Audio-File-Analyzer und -Player:

    Status: Bestimme die Datei!

Prog.-Dauer (sec.):
--------
Play.-Dauer (sec.):
--------
Buffer-Dauer (sec.):
--------

Analyse der META-Daten durch JAS:

Dateiname: ---    Dateityp: ---    "Size" Bytes: ---    Rel. Datei-Pfad (Auslesen vom Browser i.d.R. aus Sicherheitsgründen verweigert): ---    Letzte Änderung: ---

Buffer-Analyse durch JAS:

Anzahl Kanäle: ---    Buffergrösse (Anzahl Samples): ---    Sample-Rate (Hz.): ---    Playback-Rate: ---    Buffer-Bit-Tiefe (Bit): ---    Buffer-Kanal-Bit-Rate (KBit/s): ---

Diverse Analysen durch JAS:

Client-Betriebssystem / Browser etc.: ---    Diverses: ---



2c) VERWENDUNG EINES AUDIO-WORKLET-NODE (AWN) (SIEHE AUCH AUDIO-NODE (AN) AB 3a) ALS "SOURCE"-NODE-KLANG-GENERATOR.
GEWÄHLT WERDEN KANN DIE WELLENFORM UND DER GAIN.

Bezeichnungen und Parameter die vom Benutzer (noch) nicht verändert werden können:

Name des Base-Audio-Context (BAC):   wn_Context    Name des dem BAC zugeordneten AWN:   worklet_node    Name des dem AWN zugeordneten Prozesses:   random-noise-processor

AWN-Inputs:   0 (Source)    AWN-Outputs:   1 (an Destination)    AWN-Output-Channel-Count:   [1]    AWN-Parameter-Data:   ---    AWN-Processor-Options:   ---

Ansonsten sind alle folgenden Optionen vom Benutzer während einem PLAY mit akustischer und grafischer Wirkung veränderbar.

AWN-Prozessor-Funktions-Wahl:

Context-Sample-Rate:
48000
Gain (nicht. log. korr.):
1.00
"Playbackrate": 1.0000    Frequenz in Hz (Wert zwischen 187.5 und 750.0): WHITE...!    Nächstgelegener Tonname (vergl. mit Piano-Samples): WHITE...!

Kanal / Lautsprechersteuerung (siehe auch Up- and Down-Mixing) rsp. hier Kanalausgabe auf:           

Heutzutage ist computerseitig eine Samplerate von 48000 Hz. möglich und Standard (Bit-Tiefe: Siehe oben).
Nun umfasst ein Audio-Worklet-Node-Window ("AWN-Window"; siehe auch "Fourier-Fenster") i.d.R. 128 Samples (hier Sample 0 bis Sample 127 rsp. s[0] ... s[127]).
Anstelle von "Window" wird in insb. in den Unterlagen zu den WEB-Audio-Systemen auch oft der Begriff "Processor-Block" (AWN-processor-block) verwendet (siehe auch 2e).
Damit ergibt sich: Peridodendauer T = 0,002666 sec.; Winkelgeschwindigkeit w = 2356,2 Radian / sec; Frequenz: 375 Hz.; r = 2π / 128 (math. Intervallschritt)
Der nächst gelegene Ton bei gleichstufiger Stimmung und Kammertonfrequenz 440 Hz ist F#4/Gb4 (369,994 Hz., ca. in der "Mitte" einer Klaviertastatur).
Die Grafik zeigt das jeweilige AWN-Window unter Berücksichtigung des Gain. Beachte: s[128] (das 129. Sample) gehört zum Folge-AWN-Window!
Die Grafikfläche umfasst also math. in x-Richtung [0, 2π] und in y-Richtung [-1, 1]. Aufgeteilt ist sie in 129 Samples (sichtbar die ersten 128).
Wichtig (insb. wenn es um Fourier-Reihen geht): G (Gerade) bedeutet: s[i] = s[129 - i]; U (Ungerade) bedeutet: s[i] = -[129 - i]. Beachte dass hier auftreten: G, U, weder G noch U (siehe auch 2d)!
Zu den math. Funktionen: Es gibt grundsätzlich 3 Möglichkeiten, s[i] zu bestimmen:
• Mittels eines manuell vorberechneten konstanten IKT-Arrays VA-XY. Dies ist oft die pragmatischste und effizienteste Variante.
• Mittels einer Funktion f(i) auf der Basis von Fourier-Reihen (Approximation mit n-ter Partialsumme (siehe unten 2d)).
• Mittels einer Funktion ohne Verwendung der Fourier-Synthese.
Für Funktios-Formeln wird hier (2c) i.d.R. die Javascript-Notation verwendet.
Beachte den Aspekt Lautstärke anhand der Bsp. 3a/3b rsp. 4a/4b rsp. 5a/5b etc.: Der "Sound / Klang" zwischen je der a- und b- Version variiert kaum, die b-Version ist aber lauter (Amplitude!).



2d) VERWENDUNG EINES AWN ALS "SOURCE"-NODE-KLANG-GENERATOR, IMMER UNTER VERWENDUNG EINER FOURIER-REIHE (-SYNTHESE). SIEHE UNTEN AUCH 13).
GEWÄHLT WERDEN KANN DIE WELLENFORM, DIE ANZAHL DER FOURIER-REIHEN-SUMMANDEN (n), DIE PHASENVERSCHIEBUNG, DIE "KOMPRESSION" UND DER GAIN.

Alle Parameter ausser der Wellenform-Wahl können während einem PLAY mit akustischer und grafischer (Oszillator) Wirkung verändert werden.

Wellenform:  

n (Wellenform-Approx.)
4
Phasenverschiebung:
0.0
De-/Kompressionsfaktor:
1.00
Gain (nicht. log. korr.):
1.00

Fall IV und V: an (wenn verwendet) und bn zufällig ∈ {-1, 1}:            

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
a:
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
b:
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--

Zur Grafik: Es gelten die gleichen Bemerkungen wie bei 2c) mit dem Unterschied, dass
• die Grafik das jeweilige AWN-Window unter Berücksichtigung von n, Phasenverschiebung, Kompression und Gain zeigt;
• als math. Funktion (wie bereits titelvermerkt) immer eine Fourierreihe (-synthese) verwendet wird. Beachte, dass (Ausnahme V) nur G (gerade) oder U (ungerade) auftreten (siehe oben 2c).
• Funktionsformeln mittels ∑ und Laufzahlbereich (z.B. n ∈ [1, 3, 5, 7, 9, ... ∞]) notiert werden können.
n kann hier im Labor max. auf 20 gesetzt werden. Letzteres reicht in den meisten Fällen bereits für eine (akustisch) brauchbare Approximation.
Werte, die ausserhalb der sichtbaren schwarzen Grafikbereichs liegen, werden akustisch trotzdem berücksichtigt.
Eine Phasenverschiebung während einem PLAY wird hier vom Ohr kaum / speziell ("WAH-WAH-Effekt?") wahrgenommen.
Aber Phasenverschiebungen sind dennoch wichtig (Auslöschung (siehe 17) oder Schallquellenortung durch das Ohr (Hirn)).



2e) VERWENDUNG EINES INTERMEDIÄREN (NICHT "SOURCE" WIE BEI 2c und 2d) AWN MIT SELEKTIERBAREN FUNKTIONEN RSP. EFFEKTEN (ALSO KEIN PREPROCESSING WIE BEI DEN VARIANTEN VON 3d!):

Hier kommen als Bsp. nur Audio-Dateien zum Einsatz mit
• einem einzigen Eingang welcher zwei Kanäle umfasst: Eingangs-Kanal 1 (EK1, LINKS) und Eingangs-Kanal 2 (EK2, RECHTS)
• einem einzigen Ausgang welcher zwei Kanäle umfasst: Ausgangs-Kanal 1 (AK1, LINKS) und Ausgangs-Kanal 2 (AK2, RECHTS).
Zum Thema LINKS/RECHTS: Lautsprecher sind vertauschbar, Kopfhörer eher weniger.
Unter "ORIGINAL" versteht man hier den unveränderten Sample-Fluss durch den AWN gemäss: EK1 = AK1, EK2 = AK2.
Während einem "switchbaren" PLAY kann beliebig oft zwischen zwei Status gewechselt werden: ORIGINAL und SWITCHED. Jeder zweite PLAY ist aber (aus IKT-technischen Gründen noch) nicht switchbar.
Beim Start jedes PLAY ist der Default immer ORIGINAL. Die AWN-Konfiguration kann während einem PLAY nicht verändert werden (vor dem PLAY bestimmten!).

Hier versteht man unter
• EKn + EKm die Superposition von EKn und EKm ohne Volumenkorrektur (je pro "Window", siehe auch 2c).
• EKn-Reverse die Umkehrung der Sample-Reihenfolge von EKn (je pro Window).
• -EKn die "Umkehrung" der Sample-Amplituden von EKn rsp. deren Multiplikation mit dem Faktor -1 (je pro Window).
• AKn-Random dass die Samples von AKn zufällig (Wertebereich [-1 1]) gesetzt werden (je pro Window).
• einem "leeren AWN(-Prozessor)" ein solcher, welcher keinen "Code" enthält. AWNs implizieren für unbearbeitete Ausgangs-Samples den Wert 0!
Wo nötig oder einfacher werden auch math. Formeln (i.d.R. in Javascript-Syntax) verwendet, um Prozessor-Funktionen an Samples oder Windows zu beschreiben.

Bei den folgenden Beispielen achte man generell auf folgende Punkte:
• Wie könnte man den mit einem SWITCH erzielten Effekt (sofern er logischerweise überhaupt eine Wirkung hat) umschreiben?
• Ist ein potentieller Effekt überhaupt hörbar? Von was hängt die Art und Stärke der Wahrnehmung ab? Es gibt diverse Kriterien!
• Die hier verwendeten Audio-Dateien sind grundsätzlich "Stereo". Ist "Stereo" ein klar definierter Begriff? Welchen Einfluss hat die Abweichnung der beiden "Stereo"-Kanäle?

Die verschiedenen Selektoren sind in 3 Gruppen aufgeteilt: "A) EINFACH-, B) MITTELSCHWER- und C) SCHWIERIG IMPLEMENTIERBAR".
Was sind die Gründe für diese Einteilung rsp. welche Faktoren spielen wohl eine Rolle (Mathematik, (IKT-)Algorithmik, Computer-Perfromance (HW oder SW), Sample-Rate, etc.)?
Die Darstellung des PLAY-Fortschrittes und der beiden Volume-Meter für AK1 und AK2 wird direkt aus dem AWN heraus ("Port-Messages") gesteuert und generiert auch Aufwand. Sie ist daher nicht für alle Bsp. implementiert.
Speziell zu C1: Welche Effekte ergeben sich in Funktion von FFT-Window-Size und STFT-OS-Faktor? Warum ist das akustische Ergebnis hier generell nicht sehr befriedigend?

AWN-Konfiguration:


Nur für die Steuerung von C1 (Fast-Fourier-Pitching):
   Tonhöhenänderung (Faktor, HTS, Cents):   FFT-Frame- rsp. -Window-Grösse (Samples):   STFT-oversampling-factor:


Play:   Status:  

Fortschritt PLAY:
Volume-Meter AK1:
Volume-Meter AK2:

Dateiname: ---    Dateityp: ---    "Size" Bytes: ---    Anzahl Kanäle: ---    Buffergrösse (Anzahl Samples): ---    Sample-Rate (Hz.): ---    Playback-Rate: ---

Buffer-Dauer formal (sec.): ---    Buffer-Dauer effektiv (sec.): ---    Buffer-Delay (msec.): ---

AWN-Datei-Name: ---    AWN-Prozess-Name: ---    Anzahl-AWN-Windows über Buffer: ---    AWN-Window-Grösse (Samples, Konstante): 128    Formale-AWN-Window-Time (ms.): ---    Formale-Sample-Time (ms.): ---   



AB HIER NUR NOCH VERWENDUNG VON AUDIO-NODES (SIEHE OBEN 2c UND 2d).
3a) VARIABLE ABSPIELGESCHWINDIGKEIT (PLAYBACKRATE, DAUER) BEI VERÄNDERTEM ABER AUCH KONSTANTEM (!) PITCH:

R = Effektive Geschwindigkeit / Original- rsp. Bezugsgeschwindigkeit (R > 0). Bestimmte Extremwerte werden je nach Browser/Computer ignoriertIG und/oder sind nicht mehr hörbar (zu kurz).

Soll der Pitch bei veränderter Abspielgeschwindigkeit verändert werden (V) oder konstant bleiben (K)?  

R (Slider log. korrigiert):   1.0000

Play:        Dauer (sec):   Original (R = 1):   ---   Effktiv ca. (kleiner als):   ---




3b) VARIABLER PITCH IN CENTS BEI VERÄNDERTER ABSPIELGESCHWINDIGKEIT (DAUER) (SIEHE ABER AUCH 3d):

Pitch-Abweichung in Cents (pro +/-100 Cents 1 Halbtonschritt nach oben/unten; Wert kann auch während PLAY verändert werden):  

     Dauer (sec):   Original:   ---   Effktiv ca. (kleiner als):   ---




3c) VARIABLE ABSPIELGESCHWINDIGKEIT (DAUER) EINES VERTONTEN VIDEOS (MP4; QUELLE: SAMPLE-VIDEOS) BEI KONSTANTEM (!) PITCH:
BITTE WARTEN BIS VIDEO GELADEN RSP. BILD SICHTBAR!

R (Slider log. kor.):




3d) BEARBEITUNG VON AUDIO-DATEIEN BATCHMÄSSIG (PRE-PROCESSED) RSP. NICHT MIT AUDIO-NODES REALTIME WÄHREND DEM PLAY:


Variante I: Variabler Pitch bei konstanter (!) Abspielgeschwindigkeit rsp. Gesamt-PLAY-Dauer

Es wurden, in diesem Fall z.B. mit der Software audacity aus gegebenen Ausgangs-Dateien mit einem gegebenem Ausgangspitch Zieldateien mit einem Zielpitch erstellt. Hier:
• orgel_c4_ausgang.mp3 ⇒ orgel_f4_ziel.mp3 und orgel_g3_ziel.mp3
• trompete_c4_ausgang.mp3 ⇒ trompete_f4_ziel.mp3 und trompete_g3_ziel.mp3
Die Software audacity verwendet dabei die mathematisch elegante aber recht komplexe FFT (Fast-Fourier-Transformation) (siehe auch unten 3d Variante V). Ansosnten ist aber das Verfahren hier für
alle Beteiligten (Programmierung, Benutzer) weder elegant noch flexibel... Immerhin ist die Latenz für den Benutzer beim PLAY klein (dafür die Rechenzeit für den audacity-Batch-Shift mit FFT relativ gross).

Abweichung (Intervallschritt; Wert kann nicht während PLAY verändert werden):  

      Dauer Original (sec.):   ---   Dauer Ziel (sec.):   ---


Variante II: Audio-Dateien mit Online-Diensten Dritter im Internet bearbeiten

Warum selber programmieren? Es gibt gute Online-Dienste, welche die Aufgabe erledigen (sogar mit Download-Möglichkeit!). Zum Bsp. den Time-Strech-Player von Jonas Wagner.
Allerdings sollte man bedenken, dass bei solchen Verfahren Audio-Dateien auf einen fremden Server geladen werden (Vertraulichkeit, Urheberrechte etc.).


Variante III: Stretchen des Gesamtbuffers um einen Faktor f

Es wird vor jedem PLAY ein gegenüber dem Originalbuffer um den Faktor f vergrösserter rsp. verkleinerter Zielbuffer erstellt.
Verwendet werden dafür 2 formal unterschiedlich aufwändige (schnelle) Algorithmen (siehe Unterlagen).
Der Zielbuffer kann dann a) mit Time-Stretching (Playbackrate ≠ 1) oder b) ohne Time-Stretching (Playbackrate = 1) abgespielt werden. Im Fall
a) bleiben Tonhöhe und Abspieldauer erhalten.
b) resultiert eine Veränderung von Tonhöhe und Abspieldauer.
Formal ergibt sich aber (sofern f nicht 1) immer eine Komprimierung oder "Aufblähung" der Buffergrösse. Was ist die akustische Wirkung in Funktion von Algorithmus und Buffergrösse?
Sämtlche Parameter können während einem PLAY nicht mit akustischer Wirkung verändert werden.

Steuerung von f (im Fall b: resultierende HT↓↑ rsp. Cents (gleichstufig)):     Algorithmus:     Korrektur Playback-Rate:        

Dauer Original-PLAY (sec.): ---     Quotient f: ---   Cents: ---     Länge Original-Buffer (Samples): ---   Länge Ziel-Buffer (Samples): ---   Preprozess-Dauer (ms): ---

Fortschritt/Dauer (sec.) Ziel-PLAY:
---


Variante IV: Zielbuffer = Funktion(Originalbuffer):

Die mit 😂 versehenen Funktionen sind als "didaktischer Scherz" zu verstehen...

Funktion:        

Preprozess-Dauer (ms): ---

Fortschritt/Dauer (sec.) Ziel-PLAY:
---



Variante V: Pitching mit FFT (Fast-Fourier-Transformation) bei originalgetreuer Abspieldauer!:

Das hier verwendete Programm basiert auf:
COPYRIGHT 1999-2006 Stephan M. Bernsee, The Wide Open License (WOL)
Translated to javascript by Seth Kitchen 2019.
Angepasst / Ergänzt (Parametrisierungs-Optionen, Benutzeroberfläche, Zeitmessungen etc.) durch Peter Trachsel (Ersteller dieses Labors), 2025.

Hier hört das Scherzen wieder auf 😬! Fourier-Algorithmen sind mathematisch komplexer und deren (IKT-)Anwendung (v.a. wenn SW- und nicht HW-mässig implementiert) rechenintensiver.
Es ist wichig (UX-Design, UX-Psychologie) in den zeitlichen Aufwand für 3 Phasen zu unterscheiden:
Phase 1 Buffer-Bereitstellung: Via Filesystem dauert natürlich länger als direkt mit "preloaded" Bsp.-Dateien (nichts neues gegenüber den meisten anderen Laborpositionen).
Phase 2 FF-(Pre-)Processing: Hier braucht es für Pitching eine Analyse, eine Transformation und eine Synthese. Der zeitliche Aufwand hängt stark ab von Buffergrösse, FFT-Window-Size und STFT-Oversampling.
Phase 3 PLAY: Nur diese Phase (nicht aber Phasen 1 und 2) können hier im Labor vom Benutzer abgerochen werden!
Im Gegensatz zu den Varianten I bis IV braucht v.a. Phase 2 mehr Zeit (je nach Einstellungen bis zu mehreren Minuten) und damit Geduld!
Während Phase 1 und Phase 2 muss der Benutzer also (evtl. "lange") warten. Erst mit Beginn von Phase 3 ist für ihn ersichtlich (hörbar), wie weit Phase 1 und Phase 2 (erfolgreich) abgeschlose wurden.

Es kann also eingestellt werden:
• die Tonhöhenänderung.
• die FFT-Frame- rsp. -Window-Grösse (mehr dazu siehe Unterlagen). Der gesetzte Default-Wert von 1024 wird häufig verwendet und sollte i.d.R. vernünftige Resultate und FF-Processingzeiten ergeben (man spiele aber mit ihm...!).
• der STFT-oversampling-factor (mehr dazu siehe Unterlagen). Der gesetzte Default-Wert von 10 sollte i.d.R. vernünftige Resultate und FF-Processingzeiten ergeben (man spiele aber mit ihm...!).
Parameter-Veränderungen (sofern nicht temporär gesperrt) haben während einem PLAY keine Wirkung (erst für den nächsten PLAY). Ein Download der gepitchten Datei ist nicht möglich (siehe Variante II).

Tonhöhenänderung (Faktor, HTS, Cents):   FFT-Frame- rsp. -Window-Grösse (Samples):   STFT-oversampling-factor:

 

Fortschritt/Dauer (sec.) PLAY:
---

Buffer-Grösse (Samples): ---     FFT-Prozess-Dauer (sec.): ---

Fragen rsp. "Denksportaufgaben" 😜 rsp. analysiere höre:
• Unter welchen Bedingungen kann man obiges FF-Pitching auch ohne Preprocessing, rsp. mit einem Audio-Worklet-Node (AWN, siehe u.a. 2e) vollziehen?
• Was stellt man insb. fest bei "Peel me a Grape (Diana Krall)" was das Pitching der Gesangsstimme und der übrigen Instrumente anbetrifft?
• Für was alles (ausser Pitching wie oben) kann FF sonst noch verwendet werden (im Audio- oder anderen Bereichen; mit oder ohne Preprocessing)?
• Könnte man evtl. aus einer Aufnahme mit Gesangsstimme eine Karaoke-Vorlage generieren (Audio-Exarction))?



3e) VARIABLER DELAY (EFFEKT EINES EINZIGEN DELAY-NODE):

Siehe unten 6 (Vibrato unter Verwendung deines Delay-Node, JOSH REISS, YouTube).
Eine Delay-Wert-Vergrösserung (dD) während eines Zeitintervalls (dt) beansprucht einen FIFO-Queue-Buffer und damit u.U. (hängt vom Differntal dD/dt ab) viel Hauptspeicher.
I.d.R. ist daher programmtechnisch ein "Max-Delay" als Absicherung eingebaut! Der besagte FIFO-Queue-Buffer wird aber auch wieder abgebaut bei einer Delay-Reduktion.
Logischerweise ist ein Delay < 0 nicht möglich (wird vom System ignoriert) weil ein Ereignis nicht stattfinden kann bevor es initial stattgefunden hat; es kann aber verzögert (delayed) stattfinden.
Oft glaubt man zwar, den Delay-Node rasch verstanden zu haben. Aber die Methematik rund um Delays (Deutsch: Retardierung) kann komplex werden. Siehe auch Retardierte Differentialgleichung oder Warteschlangen-Theorie.
In diesem Sinn ist dieser Laborposition hier in der Tat als experimentell aufzufassen. Man versuche z.B. von Hand mit dem oberen Slider ein Vibrato zu erzeugen.
Zu Hard-Ended / Soft-Ended: Man untersuche den Effekt mit A4 PIANO MP3 mit maximalem Delay und maximalem Delay-Faktor. Siehe auch 8 REVERB und 9 ECHO.

Delay in Sec. (wirksam während PLAY):     0.00

Delay-Faktor (unwirksam während PLAY): 1.00

       Dauer (sec):   Original:   ---   Effktiv ca. (kleiner als):   ---




4) ANWEDNUNG EINES BIQUAD-FILTERS (BIQUAD-FILTER-NODE) (PEEL ME A GRAPE OGG):

    Filter-Type:

Die 3 Slider sind nur während der PLAY-Phase wirksam!:

FREQUENCY:
440
Q-Faktor (log. korr.):
0
Biquad-Gain (dB):
0




5a) STEREO-PAN KOMBINIERT MIT EINEM COMPRESSOR:

Pan-Setting:  

Compressor-Setting: Starker Effekt (Ohren...!) z.B. mit Threshold: -67, Knee: 11, Ratio: 5, Attack: -17, Release: 0.00):
Threshold (Dezibel):
-24
Knee (Dezibel):
30
Ratio (Dezibel):
12
Attack (Sekunden):
0
Release (Sekunden):
0.25<
     




5b) ROTOR-PAN (ROTIERENDE KEGELFÖRMIGE SCHALLQUELLE VARIABLER POSITION):

pannernode.png

Die Veränderung der folgenden Parameter sollte erst erfolgen nachdem man die Systematik (sh. Anleitungen oder Panner-Node) betrf. ROTOR-PAN verstanden hat!
Alle Werte ausser (sinnvollerweise) C a) (Rotationswinkel beim Start) können im Sinne der unmittelbaren Vergleichbarkeit auch während einem PLAY verändert werden.
Die Distanzeinheit ist normalerweise Meter (kann je nach Browser / System aber abweichen!). Ein Winkel 0 des Schallkegels bedeutet Ausrichtung zum Hörer.
X-Komponente: "Links/Rechts"; Z-Komponente: "Tiefe"; Y-Komponente: "Höhe". Die Y-Komponente hat i.d.R. keine Wirkung da meistens kein Surrounding-Laustsprechersystem vorhanden ist.
Wirkung ergibt sich also i.d.R. nur in der X-Z-Ebene! Das Rotor-System in diesem Labor ist aus Effizienzgründen nur für die X-Z-Ebene programmiert.
Z.T. werden je nach Browser rsp. Computer vereinzelt Parameter ignoriert und durch einen konstanten Default-Wert ersetzt.

Thema
Parameter
Selector oder Eingabefeld
Check / Calc.
A) Schallkegel:
Winkel
und Gain(s)
1) coneInnerAngle (Grad):
30
2) coneOuterAngle (Grad):
60
3) coneOuterGain (unkorr.!):
0.15
B) Distanz-Modell
und Gain-Bereich
4) distanceModel:
inverse
5) maxDistance:
Nur verwdt. m. distanceModel = linear
10000
C) Schallkegel:
Ausrichtung
und Rotation
a) Rotationswinkel (Grad):
Eingabe: Beim Start
Ausgabe: Bewegt
0
b) Rotation-Speed (RPM):
430
D) Panning-Modell
rsp. -Algorithmus
9) panningModel:
equalpower
E) Schallkegel-
Position
Kaum Wirkung bei
distanceModel = linear
10) positionX:
0
11) positionY:
0
12) positionZ:
3
F) Referenz-Distanz
für Gain
>= 0   Default: 1
13) refDistance:
1.00
G) Roll-Off-Faktor
>= 0   Default: 1
14) rolloffFactor:
1.00
H) Rotor-Sample-Rate
a) Rotor-Sample-Rate (Hz.):
100

Umgerechnete Rotationsparameter (Grad (modulo 360) für Benutzer praktischer; Trigonometre (auf 1 normalisiert) für Programmierung besser rsp. System-Standard):    6) Start orientationX: 1    7) Start orientationY: 0    8) Start orientationZ: 0

Play:    

Zur Orgel: Instrument: NORD 4 HP; Emulation: Hammond B3; Registrierung: 888000000; Leslie: No; Chorus: No; Percussion: Soft; Weitere Effekte: No




6a) VIBRATO (PERI. TONHÖHENVARIATION), ALGORITHMUS MIT DELAY-NODE: JOSH REISS, YouTube, SIEHE AUCH 3e) UND VIBRATO BEI 19):

Funktioniert auch für den Mikrofon- oder Line-In-Eingang!

Play:    

Vibrato-Stärke (Depth), Min: 0, Max: 0.1:       Vibrato-Frequenz, Min: 0.1, Max: 8:  

Vibrato-Form:       Initial-Delay (sec.) (Änderung wirkt (logischerweise) nicht während PLAY!):  




6b) VIBRATO (PERI. TONHÖHENVARIATION), ALGORITHMUS MIT SOURCE-DETUNE (ABSPIELGESCHWINDIGKEIT):

Funktioniert (logischerweise) nicht für den Mikrofon- oder Line-In-Eingang!

Play:    

Vibrato-Stärke (Depth) in Cents, Min: 0, Max: 200:       Vibrato-Frequenz, Min: 0.1, Max: 8:  




7a) TREMOLO (PERI. LAUTSTÄRKE-VARIATION, SIEHE ABER AUCH OBEN 3d IV UND LABORSEITEN OBERTÖNE RSP. SCHWEBUNG) UND ORGEL RSP- CHORUS UND UNTEN 7c (SCHWEBUNG):

 

Tremolo-Stärke (Depth), Min: 0, Max: 0.5:       Tremolo-Frequenz, Min: 0, Max: 8:  

x-Achse: Zeit (0 - 1 sec.), y-Achse: Gain: (0 - 1):




7b) OUT-FADER (SIEHE AUCH 10 CROSS-FADER):

Die beiden Parameter "Outfade-Dauer" und "Outfade-Art" (siehe auch 14) haben (logischerweise) während einem PLAY keine akustische Wirkung.

Outfade-Dauer (Start bis % Gesamtdauer):   100     Outfade-Art:  

Gesamtdauer (Sek.):   ---     Fade-Out-Dauer ab Start (Sek.): ---

 




7c) DIE SCHWEBUNG (SIEHE AUCH LABORSEITEN OBERTÖNE UND ORGEL RSP- CHORUS):

Die Ausgangswerte beim Laden der Seite: Referenzton (Ton 1): 440 Hz. (A4); Tonhöhen-Abweichung des Tones 2 vom Referenzton: 0 Cents (also auch 440 Hz.). Es resultiert keine Schwebung.
Die Tonhöhen-Abweichung von Ton 2 gegenüber Ton 1 erfolgt in Cent-Schritten im Bereich -100 bis 100 (also max. 1 Halbton nach oben rsp. unten rsp. in der Ausgangslage G#4/Ab4 bis A#/Bb4).

   

Ton 1: Freq. Hz. (Referenzton: Immer 0 Cents):
440
Ton 1: Gain:
1.00
Ton 2:Abweichnung von Ton 1 in Cents (result. Hz.):
0   (440)
Ton 2: Gain:
1.00

Fragen rsp. "Denksportaufgaben" 😜 rsp. analysiere rsp. höre:
• Worin unterscheidet sich die Schwebung vom Tremolo (7a) formal (physikalisch / mathematisch) und in der akustischen Wahrnehmung?
• Warum wird hier "nur" mit 2 Oszillatoren gearbeitet und nicht z.B. mit einer MP3-Datei oder mit dem Mikrofoneingang (siehe 18)? Was wäre, wenn man mehrere gegenseitig (leicht) verstimmte Oszillatoren verwenden würde?
• Warum dürfte es i.d.R. schwierig sein, den Schwebungseffekt grafisch zu visualisieren?
• Welchen Einfluss auf die Schwebungs-Stärke (max. Veränderung der Lautheit) und Schwebungs-Frequenz (zeitliche Verlauf der Veränderung der Lautheit) haben die Frequenzen rsp. Gains der beiden Oszillatoren?
• Warum ist die Tonhöhen-Abweichung von Ton 2 mit Bezug zum Referenzton auf den Bereich -100 Cents bis 100 Cents beschränkt?



8) REVERB (HALL, RAUMAKUSTIK) (HIER NUR MIT DEM BSP. PEEL ME A GRAPE OGG):

Generell zu den Settings hier: Eine Veränderung hat keine Wirkung während einem PLAY (vor dem PLAY setzen!).

Modus / Berechnungsart:  

Zu den folgenden Settings: Erst 3 von 5 sind anwendbar. Generell sind sie nur wirksam, wenn oben Wahl 3) getroffen wurde.

       

 




9) ECHO:

Gain-Keep-Faktor: 0.30

Delay (sec.): 0.7

   

Insb. hier interessant: Beachte die Wirkung von Hard-Ended / Soft-Ended in Kombination mit den beiden Reglern am "Ende" des Samples.
Dieser Aspekt ist auch IKT relevant: Die Variante Soft-Ended terminiert (auch bei 3e SINGLE-DELAY und 8 REVERB) den jeweiligen Context nicht, was zu mehr Speicher und Rechenzeit führt!
Man untersuche die Wirkung zum Bsp. mit A4 PIANO MP3 mit Gain-Keep-Faktor 0.8 und Delay 0.3 sec. Siehe auch 3e SINGLE DELAY und 9 ECHO.




10) CROSS-FADER (SIEHE AUCH 7b OUT-FADER): Trompete MP3 ↔ PEEL ME A GRAPE MP3:

"BUS/TRACK/KANAL" 1
"BUS/TRACK/KANAL" 2

         




11) PLAY: DELAY, OFFSET, DAUER, REVERSE, LOOP (MISTY MP3):

Generell zu den Settings hier: Eine Veränderung hat keine Wirkung während einem PLAY (vor dem PLAY setzen!).

Dauer des gesamten Originals und damit auch der gesamten Reversierung: 108.25 sec. (siehe Tabelle oben). Intro-Dauer (original und reversiert): 12.50 sec. Anwendungsbeispiel:

Voreinstellung unten: Spiele Original-Intro: Sofort (Delay: 0.00 sec.) von 0.00 sec. (Offset) während 12.50 sec. (Dauer)      Spiele Reverst.-Intro: Sofort (Delay: 0.00 sec.) von 95.75 sec. (Offset) während 12.50 sec. (Dauer)

Alternative: Spiele vom Original alles aber ohne Intro: Sofort (Delay: 0.00 sec.) von 12.50 sec. (Offset) während 95.75 sec. (Dauer)      Spiele reversiert alles aber ohne Intro: Sofort (Delay: 0.00 sec.) von 0.00 sec. (Offset) während 95.75 sec. (Dauer)

Loop-Prinzip: Gespielt wird ANFANG -> LOOP END -> LOOP OFFSET -> LOOP END -> LOOP OFFSET ... (ohne Berücksichtigung des Delay)


Schritt 1: Bestimme die Parameter des "Originals" (keine Reversion):     DELAY (sec.):     OFFSET (sec.):     DAUER (sec.):

Schritt 2: Bestimme ob obiges "Original" reversiert gespielt werden soll:         DELAY REVERSIERT (sec.): 0.00     OFFSET REVERSIERT (sec.): 95.75     DAUER REVERSIERT (sec.): 12.50

Schritt 3: Bestimme ob/wie "Original" oder seine Reversion gelooped werden soll und wie oft:         LOOP OFFSET (sec.):     LOOP END (sec.):     Max. Loop-Dauer sec. (falls man vergisst...):

Schritt 4:      




12) DISTORTION / WAVESSHAPING MIT VISUALISIERUNG DER KORREKTURFUNKTION:

Generell zu den Settings hier: Eine Veränderung hat keine Wirkung während einem PLAY (vor dem PLAY setzen!).

Oversizing (beeinflusst Kurve unten nicht):       Kurvensteuerungswert (try and error oder: Setze insb. bei der Orgel einen höheren Wert):     (sh. auch Sigmoid-Funktion)

 




13) VISUALISIERUNG (WELLENFORMEN UND FREQUENZ-BALKENDIAGRAMME) U.A. MITTELS FOURIER-ANALYSE VON WAV- UND MP3-DATEIEN SOWIE EINEM OSZILLATOR. SIEHE OBEN AUCH 2c), 2d) UND 3d).

Generell zu den Settings hier: Nur die Veränderung des Sliders (FFT-Size) hat während einem PLAY Wirkung. Die anderen Parameter müssen vor dem PLAY gesetzt werden!

FFT-Size (2n, 5 ≤ n ≤ 15;
vor erstem PLAY inaktiv):
2048
Darstellung / Grafik:  

Smoothing-Time-Konstante k (Range: 0 bis 1):  

Min. dB <= 0:       Max. dB <= 0:       Es muss gelten: Min. dB < Max. dB! Diese beiden Parameter wirken nur für FREQUENZ-BALKENDIAGRAMM; siehe Analyser-Node

Oszillator-Frequenz f (0 < f):       Oszillator-Wellenform:       Diese beiden Parameter wirken nur für den A4-Oszillator

Play:         Abspieldauer sec:   0     Anzahl Bilder:   0     Bilder / sec:   0




14) TONHÖHE UND GAIN: TONERZEUGUNG MIT DEM OSZILLATOR DES COMPUTERS RSP. BROWSERS:

Fundamentale Anmerkung zur Psycho- rsp. Physio-Akustik:

• Die "Lautstärke" L in Dezibel wird mit folgender Formel berechnet: L(I) = 10 * log10(I / I0). Dabei ist I die physikalische Schallintensität und I0 die physikalische Schallintensitä die es mindestens braucht,
damit "man" überhaupt etwas akustisch wahrnehmen kann (Hörschwelle als Referenz).

• Die Beziehung zwischen wahrgenommener Tonhöhe und Frequenz kann hingegen mit dem Logarithmus zur Basis 2 (log2) dargestellt werden, um die Anzahl der Halbtonschritte zwischen zwei Tönen zu berechnen.
Letzteres weil eine Frequenzverdoppelung als Oktave wahrgenommen wird. Die Formel: n = 12 * log2(fn / fGrund). Dabei ist fn die Frequenz des zu messenden Tons und fGrund die Frequenz des Grund- rsp. Referenztons.
Letzterer ist oft der Kammerton A4 mit (i.d.R.) der Frequenz 440 Hz.

In diesem Labor werden Slider (Schieberegler) für die Gain- oder Tonhöhensteuerung z.T. "logarithmisch korrigiert".
Dies mit dem Zweck, dass sich die pot. wahrnehmbare Gesamtveränderung gleichmässig auf den Slider- rsp. Schiebergelerweg verteilt.


Ton-Höhe / Frequenz (Hertz) (muss zwischen 55 (A1) und 3520 (A7) liegen):      Gain (Min 0 - Max 40, z.B. 0.8, 33 etc.); > 1: Lauter (verzerrter); < 1: Leiser      Dauer (Sek.):     




15) TONHÖHE, GAIN UND LAUTHEIT: LOGARITHMISCHE SLIDER-KORREKTUREN; TONERZEUGUNG MIT OSZILLATOR DES COMPUTERS RSP. BROWSERS:

  während     Sekunden mit:

Frequenz 55-3520 (Slider log. korr.):
440
Gain 0-40 (Slider log. korr.) (sh. unten 16!):
1.000




16) GAIN UND LAUTHEIT (LAUTSTÄRKE): PSYCHOAKUSTISCH NOTWENIDGE (?) LOGARITHMISCHE SLIDER-KORREKTUR ; TONERZEUG. MIT OSZ. DES COMPUTERS RSP. BROWSERS:

Main Gain (x 100) hier:   100

Ungleichmässige Wahrnehmung (unkorrrigierte Slider-Wertung) Ton 1: 1.00
Gleichmässige Wahrnehmung (korrrigierte Slider-Wertung) Ton 2: 1.00

Der gesamthaft resultierende Gain für Ton 1 1.00 resp. Ton 2 1.00 ergibt sich aus dem Produkt: Gain Ton 1 (logarithmisch unkorrigiert) rsp. Gain Ton 2 (logarithmisch korrigiert) * Main-Gain hier (dividiert durch 100).




17) KONSTRUKTIVE UND DESTRUKTIVE INTERFERENZ (AUSLÖSCHUNG) (THEORETISCHE VISUALSIERUNG) ZWEIER OSZILLATOR-TÖNE T1 UND T2 GLEICHER FREQUENZ UND DYNAMIK (LAUTHEIT):

Frequenz von T1 und T2 (55 - 3520 Hz):   Periodendauer von T1 und T2 (ms): 2.0000     Form:     Phasenverschiebung T1/T2 + 2π *

Phasenverschiebung T1/T2 (Radian rsp. 0 bis 2π): 0.00

Gain von T1 und T2: 1.00

   Im Fall "TRP-VARIANTE" muss die Änderungswirkung aller obiger Parameter während einer STOP-Phase bestimmt werden. Im Fall "MIT DELAY-NODE" ist dies für die beiden Sliderwerte auch in der PLAY-Phase möglich.

 




18) MIKROFON- ODER LINE-IN-EINGANG MIT AUFNAHME-OPTION (SIEHE AUCH Audio-Kozepte):

Bedenke / Beachte:
Security, Datenschutz, Privacy und Copyrights beim Umgang mit Aufnahmegeräten: Versteckt oder versehentlich aktivierte oder "vergessene" Recorder können unliebsame Folgen haben. Nicht alle Browser reagieren bei der Aktivierung gleich ("Sandboxing")! Siehe evtl. auch den Konsolen-Log des Browsers. Es wird empfohlen, Kopfhörer zu verwenden (Vermeidung von Rückkopplungen)! Gesamtheitlich kann das Verhalten insb. bei dieser Labor-Position in Funktion von der Art des Browsers (Javascript-Audio-Systems), des Betriebssystems und der Audio-HW varieren! Vorausgesetzt ist ein analoger (i.d.R. 3.5 mm Klinke) oder digitaler (i.d.R. via USB) Mikrofon-Eingang. I.d.R. können aber auch analoge Geräte (z.B. MP3-Player, Radio etc.) an den Mik-Eingang angeschlossen oder sog. Line-Eingänge als Mik deklariert werden. Für Mikrofone werden aber i.d.R. tiefere Signalpegel impliziert als für "Line-In-Geräte"! Die Audio-Systeme der meisten Computer verbinden den analogen (Mik- (oder Line-))Eingang direkt mit dem analogen (Kopfhörer- oder Lautsprecher-)Ausgang. Eine Schlaufe durch einen Effekt-Context erfolgt i.d.R. parallel dazu! Implementierte Effekte (Gain, Delay, Pan etc.) wirken nur auf dem direkt abgetasteten Kanal (nicht für den allfl. erstellten BLOB oder die daraus allfl. erstellte Download-Datei). Im Fall eines Downloads wird eine "mp3"-Datei geliefert. Analysiere diese Datein bei Bedarf mit dem Audio-File-Analyzer und -Player in Labor-Position 2b. Man beachte auch die unterschiedlichen Rahmenebdingungen beim a) Umgang mit bereits vorhandenen Audiodateien, beim b) Umgang mit Mikrofon- oder Net-Streams und c) beim Umgang mit Recording (Blobbing). Ja nach Rahmenedibgung und Computer-Konstellation (siehe oben) tauchen auch verschiedene rsp. spezielle Steuerungs-Parameter auf (z.B. Noise-Supression oder Audio-Codec der Aufnahme-Datei; beide hier nicht verwendet) die zu verschiedenen Zeitpunkten zur Verfügung stehen rsp. verändert oder ausgegeben werden können:

Echo-Cancellation (sollte auch bei 6 Vibrato wirken):  

          Download allfällige Aufnahme:

 

Gain:
1.00
Delay (sec.):
0.00
Pan:
0.00

I) Aufnahme: BLOB-Size in Bytes: -
II) Dauer der Aufnahme in sec. (wird von diversen Browsers auf "unendlich" gesetzt auch wenn Dauer (natürlich) beschränkt...). Wird erst nach einem PLAY ausgegeben.: -
III) Vom Programm berechnete Bit-Rate in KBit/sec. gem. BLOB-Size / Dauer der Aufnahme (kann 0 sein wenn Dauer "unendlich", siehe oben II). Wird erst nach einem PLAY ausgegeben. Vergleiche mit IV).: -
IV) Recorder-Parameter "audioBitsPerSecond" (wohl die Bit-Rate nach Kompression) (Abgefragter Default rsp. Wahl des Browsers). Vergleiche mit III).: -




19) MEHRERE OBIGE AUDIO EFFEKTE KOMBINIERT:

(Noch) Nicht angwendet hier sind 1 bis 2d; 3c Video; 3d Batch- / Preprocessed; 3e Single-Delay; 4 Biquadfilter; 5 Rotor-Pan; 6b Vibrato mit Source-Detune; 7b Out-Fader; 7c Schwebung;
10 Crossafader; 11 Reverse, Delay, Loop; 14, 15, 16 und 17 als reine Oszillator-Bsp. Hingegen ist mit 20 abschliessend zusätzlich ein Gain-Node und zwecks Visualisierung noch einmal ein Oszilloskop (13) eingebaut.

Für Oszillatoren und den Mikrofon- rsp. Line-In-Stream (Deaktivierung nicht vergessen! Siehe generell 18) oben) sind bestimmte Slider rsp. Selektoren (z.B. für Tempo oder Tonhöhe) nicht sinnvoll und werden ignoriert.
Zudem bedeutet z.B. "Pitch (Tonhöhe, evtl. auch Tonart) eines Musikstückes in einer MP3-Datei" etwas anderes als "Pitch (Tonhöhe) eines Oszillatoren oder eines MP3-Instrumenten-Samples"...! Siehe oben auch 3a), 3b), 3c und 3d).

   

General PRE-SETTINGS und SAVE / RESTORE: Diese haben keine Veränderunswirkung wähernd einem PLAY. Ein SAVE ist nur gesichert wähernd die Seite geladen bleibt.

          

Eff.
Setting
Selector(en) oder Eingabefeld(er)
Akt. Wert(e)
3a)
TEMPO bei variablem Pitch
1.0000
3b)
PITCH in Cents (Halbtöne) bei variablem Tempo
5a)
STEREO-PAN (OHNE COMPRESSOR)
0.0
6)
VIBRATO Stärke / Frequenz (Initial-Delay: 0 sec.)
Empfehlung wenn mit Mik: Pfeife konstant...
 
0.05   5.0
7)
TREMOLO Stärke / Frequenz
 
0.25   5.0
8)
REVERB
Keine Veränderungswirkung während PLAY.
Vor dem PLAY setzen!
 
9)
ECHO Gain-Keep-Faktor / Delay (sec.)
Siehe auch oben 9)
 
0.30   0.7
12)
DISTORTION Oversizing / Kurvensteuerung
Keine Veränderungswirkung während PLAY.
Vor dem PLAY setzen!
 
20)
GAIN
1.00


VISUALISIERUNG (SIEHE OBEN 13)

FFT-Size (2n, 5 ≤ n ≤ 15;
vor erstem PLAY inaktiv):
2048
Darstellung / Grafik:       Einkopplung ("Connect") im Context nach:  

Smoothing-Time-Konstante k (Range: 0 bis 1):  

Min. dB <= 0:       Max. dB <= 0:       Es muss gelten: Min. dB < Max. dB! Diese beiden Parameter wirken nur für FREQUENZ-BALKENDIAGRAMM; siehe Analyser-Node

Oszillator-Frequenz f (0 < f):       Oszillator-Wellenform:       Diese beiden Parameter wirken nur für den A4-Oszillator

Abspieldauer sec:   0     Anzahl Bilder:   0     Bilder / sec:   0

Hier ist für 19) der Default für die digitale Audio-Node-Sequenz (Context: "C-19"):

AUDIO-SUBSYSTEM (Analog/Digital → Digital)SOURCESTEREO-PANVIBRATOTREMOLOREVERBECHODISTORTIONGAINVISUALISIERUNGDESTINATIONAUDIO-SUBSYSTEM (Digital → Analog/Digital)

Siehe auch: Audio-Context für Beispiel 19 (PDF)

Wie weit
a) wirken sich die Settings (Effektveränderungen) an den einzelnen Nodes auf den gesamtheitlich wahrgenommenem "Sound" (Gesamteffekt) aus?
b) wirkt sich die Reihenfolge der Nodes (SOURCE ist immer Start, DESTINATION immer Abschluss) bezüglich wahrgenommenem Gesamteffekt aus (Verknüpfungen kommutativ)? Reihenfolge-Kombinationen: n Nodes → (n-2)!
c) Welche Verzögerungen (Latenzen durch Berechnungen in den Nodes) ergeben sich (siehe unten)? Nicht bei allen Browsern / Computern lassen sich Werte auslesen...

Aktuell gesetzte C-19-Sequenz: ---

Gesamtlatenz C19 (sec.) (SOURCEAUDIO-SUBSYSTEM): 0.0000000

Latenz (sec.) (DESTINATIONAUDIO-SUBSYSTEM): 0.0000000

AUSGABE-AUDIO-SUBSYSTEM (Info, Bezeichnung oder "Nichts" ("undefined"); OK z.B. mit MS EDGE / MS WINDOWS aber nicht mit FIREFOX / MS WINDOWS...): ---




Evtl. werden noch entwickelt: "FLANGER", "PHASER", "WAH-WAH", "LESLIE" mit Raum-Effekt (schwierig...!), etc.
Die Themen "CHORUS" und "PERKUSSION" (Orgel) werden auf der Labor-Seite (Hammond-) Orgel abgehandelt.




Generell /Wichtig: Gains deutlich über 1 bewirken grösserer Lautstärke und allenfalls Verzerrungen (Schutz der Ohren!). Obige Effekte hängen stark ab vom Sound-System der Form resp. Reihenfolge:
Signal-Generator des Computers (Oscilator) -> Vorverstärker des Computers (Gain) -> Hauptverstärker (des Computers oder extern) -> Lautsprecher/Kopfhörer etc.
Generell werden die Effekte mit wachsender Laustärke (Volumen) besser wahrnehmbar.

Eine Midi-Schnittstelle ist noch nicht implementiert.


Besucher: 24672