Digitaalinen ääni

Digitaalisesta äänestä

Cd tasoinen ääni on 44100 Hz 16 Bit x 2(stereo).

Digitaalisen äänen rakennetta on pyritty selventämään alla olevassa kuvassa.

Digitaalisen äänen rakenne kaaviokuvana.

Digitaalinen ääni rakentuu näytteenottotaajuudesta ja yksittäisen näytteen bittisyvyydestä:

Jos näytteenottotaajuus Hz puolitetaan tiedoston koko puoliintuu.
Jos bittisyvyys puolitetaan tiedoston koko puoliintuu.
Jos stereo muutetaan monoksi tiedoston koko puoliintuu.
Mitä laadukkaampi alkuperäinen ääni, sitä paremmin se kestää tiedostokoon pienentämistä.

Pakkaamattoman äänitiedoston koko määräytyy seuraavista tekijöistä:

Pakkaamattoman äänitiedoston koko voidaan laskea käyttäen seuraavanlaista yhtälöä:

44100 Hz x 16 Bit x 2(stereo) x 60 s(aika) = 84672000 Bit
84672000 / 8 = 1058400 Tavua
1058400 / 1024 = 10336 Kilotavua
10336 / 1024 = 10,1 Megatavua

Jos, taas tiedetään tiedoston koko esim. 10 Mb, näytteenottotaajuus, bittissyvyys ja mono/stereo voidaan laskea tiedoston soittoaika.

44100 Hz x 16 Bit x 2(stereo) = 1411200 Kbps
1411200 x 60 s(minuutti) = 84672000 Bit
84672000 / 8 = 10584000 Bit
10584000 / 1024 = 10335,9375 Kb
10335,9375 / 1024 = 10,09368896484375 Mb
10 Mb / 10,09368896484375 Mb = 0,99 minuuttia

Taajuuksista

Keskimääräisesti ihminen kuulee noin 20-20000 Hertsiä. Parhaimmillaan ihmisen kuulo voi yltää korkeilla taajuuksilla 28000 hertsiin ja matalilla taajuuksilla 15 hertsiin. Ihmiskorva on herkimmillään taajuusalueella 2000 -6000 hertsin.

Puheen perusääni, miehillä noin 120 hertsiä ja naisilla noin 250 hertsiä. Puhe muodostuu perusäänen lisäksi erilaisista äänteistä ja niiden yhdistelmistä, jotka sisältävät huomattavasti korkeampia taajuuksia. Puheen ymmärtämisen kannalta tärkeimmät taajuudet ovat 500 - 2000 hertsiä.

Matalat äänet saavat aikaan pitkän harvan aallon, ne eivät menetä nopeasti liike energiaansa. Niinpä ne helposti etenevät pitkälle ja voiden lävistää tai kiertää esteitä juurikaan menettämättä voimaansa.

Korkeat äänet saavat aikaan tiheän lyhyen aallon, ne menettävät nopeammin liike energiaansa edetessään. Niinpä ne eivät myöskään etene pitkälle, eivätkä ne juurikaan lävistä tai kierrä esteitä.

Dopplerin ilmiö (jota kaikki "lapset" rakastavat).

Äänilähdettä lähestyessä kuuluu ensin matalat äänet ja korkeammat taajuudet kuuluvat vasta lähempänä. (Ohi ajavan auton ääni muuttuu kuulijan korvissa auton etäisyyden muuttuessa kuulijaan nähden.)

Desibeleistä

Äänen voimakkuuden yksikkö Bel keksijänsä Bellin mukaan. Bel, jonka kymmenesosa on desibeli ( dB).

Ihminen kykenee aistimaan ilmakehän normaalipaineessa tapahtuvan jopa 1/10 000 000 000 olevan paineen muutoksen.

Desibelit ja äänilähteet
Desibelimäärä Vastaavuus äänilähteenä
0 dB Kuulokynnys (viitearvo 2000-5000 Hz taajuuksilla, joilla korva on herkin)
30 dB Asunnon taustamelu
50-70 dB Puhe ääni
70-90 dB Vilkas liikenne
120 dB Kipukynnys (lentokone)

Mikään desibelimäärä ei ilmaise äänen absoluuttista voimakkuutta. Desibelit ilmaisevat ainoastaan lukujen suhteita. Mitä suurempaa paineenvaihtelu on, sitä voimakkaampana ääni kuullaan.

Esimerkiksi mikrofonilla nauhoitettaessa.
+6dB äänenpaine kaksinkertaistuu mikrofoniin.
-6dB matka mikrofoniin kaksinkertaistuu.

Myös äänen dynamiikkaa voidaan kuvata desibeleinä. Esim. musiikki kappaleen voimakkaimman 100 dB ja hiljaisimman 40 dB kohdan välinen ero, tällöin musiikki kappaleen dynamiikka olisi siis 60 dB.

Äänen dynamiikka-alue muodostuu voimakkaimmilla tasoilla uhkaavan äänensäröytymisen ja hiljaisimmillaan pohjakohinan välisestä alueesta.

Liittimistä

Audiolaitteissa yleisesti käytössä olevia liittimiä ovat:

Mikrofoneista

Mikrofonien suuntakuvioita: Pallo, kahdeksikko, hertta, superkardiodi ja haulikko.

Äänen käsittelystä

Normalize

Muutetaan äänenvoimakkuus standardi tasolle. Voimakkain ääni korotetaan mahdollisimman korkealle tasolle, niin ettei se vielä säry samalla kaikkia muita ääniä korotetaan samassa suhteessa.

Audio level compression

Kompressio pienentää äänen dynamiikkaa, jos se ylittään määritelty maksimitaso. Tätä dynamiikan muutosta kuvataan suhdeluvulla esim.:

Tällä toimenpiteellä saadaan luotua voimakkuutta ääneen pienemmillä tehoilla, kun halutaan korostaa esim. puhetta tai mainoksen ääntä.

Noise gate

Signaalitason pudotessa alle noise gatessa määritellyn minimi tason allapuolelle signaalitie suljetaan pudottaen signaalitaso nollaan attack kontrollissa määritellyssä ajassa.

Signaalitason noustessa yli noise gatessa määritellyn minimi tason signaalitie avataan release kontrollissa määritellyssä ajassa.

Tällä toimenpiteellä saadaan rajattua pois häiritsevä osa signaalista, jota ei haluta äänessä esiintyvän esim. taustakohina tai muu heikko taustalla oleva ääni.

Tämän osion lopuksi vielä pari ääninäytettä:

Alkuperäinen ääni (normaa. mp3 224 Kt) ja Muunneltu ääni (muunne. mp3 224 Kt).


Digitaalisesti sinunSivuston laatija Kimmo Kaila © 6.4.2006, revisio 0   Valid XHTML 1.0 Strict Valid CSS!