Cd tasoinen ääni on 44100 Hz 16 Bit x 2(stereo).
Digitaalisen äänen rakennetta on pyritty selventämään alla olevassa kuvassa.

Jos näytteenottotaajuus Hz puolitetaan tiedoston koko puoliintuu.
Jos bittisyvyys puolitetaan tiedoston koko puoliintuu.
Jos stereo muutetaan monoksi tiedoston koko puoliintuu.
Mitä laadukkaampi alkuperäinen ääni, sitä paremmin se kestää tiedostokoon pienentämistä.
44100 Hz x 16 Bit x 2(stereo) x 60 s(aika) = 84672000 Bit 84672000 / 8 = 1058400 Tavua 1058400 / 1024 = 10336 Kilotavua 10336 / 1024 = 10,1 Megatavua
Jos, taas tiedetään tiedoston koko esim. 10 Mb, näytteenottotaajuus, bittissyvyys ja mono/stereo voidaan laskea tiedoston soittoaika.
44100 Hz x 16 Bit x 2(stereo) = 1411200 Kbps 1411200 x 60 s(minuutti) = 84672000 Bit 84672000 / 8 = 10584000 Bit 10584000 / 1024 = 10335,9375 Kb 10335,9375 / 1024 = 10,09368896484375 Mb 10 Mb / 10,09368896484375 Mb = 0,99 minuuttia
Keskimääräisesti ihminen kuulee noin 20-20000 Hertsiä. Parhaimmillaan ihmisen kuulo voi yltää korkeilla taajuuksilla 28000 hertsiin ja matalilla taajuuksilla 15 hertsiin. Ihmiskorva on herkimmillään taajuusalueella 2000 -6000 hertsin.
Puheen perusääni, miehillä noin 120 hertsiä ja naisilla noin 250 hertsiä. Puhe muodostuu perusäänen lisäksi erilaisista äänteistä ja niiden yhdistelmistä, jotka sisältävät huomattavasti korkeampia taajuuksia. Puheen ymmärtämisen kannalta tärkeimmät taajuudet ovat 500 - 2000 hertsiä.
Matalat äänet saavat aikaan pitkän harvan aallon, ne eivät menetä nopeasti liike energiaansa. Niinpä ne helposti etenevät pitkälle ja voiden lävistää tai kiertää esteitä juurikaan menettämättä voimaansa.
Korkeat äänet saavat aikaan tiheän lyhyen aallon, ne menettävät nopeammin liike energiaansa edetessään. Niinpä ne eivät myöskään etene pitkälle, eivätkä ne juurikaan lävistä tai kierrä esteitä.
Dopplerin ilmiö (jota kaikki "lapset" rakastavat).
Äänilähdettä lähestyessä kuuluu ensin matalat äänet ja korkeammat taajuudet kuuluvat vasta lähempänä. (Ohi ajavan auton ääni muuttuu kuulijan korvissa auton etäisyyden muuttuessa kuulijaan nähden.)
Äänen voimakkuuden yksikkö Bel keksijänsä Bellin mukaan. Bel, jonka kymmenesosa on desibeli ( dB).
Ihminen kykenee aistimaan ilmakehän normaalipaineessa tapahtuvan jopa 1/10 000 000 000 olevan paineen muutoksen.
| Desibelimäärä | Vastaavuus äänilähteenä |
|---|---|
| 0 dB | Kuulokynnys (viitearvo 2000-5000 Hz taajuuksilla, joilla korva on herkin) |
| 30 dB | Asunnon taustamelu |
| 50-70 dB | Puhe ääni |
| 70-90 dB | Vilkas liikenne |
| 120 dB | Kipukynnys (lentokone) |
Mikään desibelimäärä ei ilmaise äänen absoluuttista voimakkuutta. Desibelit ilmaisevat ainoastaan lukujen suhteita. Mitä suurempaa paineenvaihtelu on, sitä voimakkaampana ääni kuullaan.
Esimerkiksi mikrofonilla nauhoitettaessa.
+6dB äänenpaine kaksinkertaistuu mikrofoniin.
-6dB matka mikrofoniin kaksinkertaistuu.
Myös äänen dynamiikkaa voidaan kuvata desibeleinä. Esim. musiikki kappaleen voimakkaimman 100 dB ja hiljaisimman 40 dB kohdan välinen ero, tällöin musiikki kappaleen dynamiikka olisi siis 60 dB.
Äänen dynamiikka-alue muodostuu voimakkaimmilla tasoilla uhkaavan äänensäröytymisen ja hiljaisimmillaan pohjakohinan välisestä alueesta.

Muutetaan äänenvoimakkuus standardi tasolle. Voimakkain ääni korotetaan mahdollisimman korkealle tasolle, niin ettei se vielä säry samalla kaikkia muita ääniä korotetaan samassa suhteessa.
Kompressio pienentää äänen dynamiikkaa, jos se ylittään määritelty maksimitaso. Tätä dynamiikan muutosta kuvataan suhdeluvulla esim.:
Tällä toimenpiteellä saadaan luotua voimakkuutta ääneen pienemmillä tehoilla, kun halutaan korostaa esim. puhetta tai mainoksen ääntä.
Signaalitason pudotessa alle noise gatessa määritellyn minimi tason allapuolelle signaalitie suljetaan pudottaen signaalitaso nollaan attack kontrollissa määritellyssä ajassa.
Signaalitason noustessa yli noise gatessa määritellyn minimi tason signaalitie avataan release kontrollissa määritellyssä ajassa.
Tällä toimenpiteellä saadaan rajattua pois häiritsevä osa signaalista, jota ei haluta äänessä esiintyvän esim. taustakohina tai muu heikko taustalla oleva ääni.
Alkuperäinen ääni (normaa. mp3 224 Kt) ja Muunneltu ääni (muunne. mp3 224 Kt).
Sivuston laatija Kimmo Kaila © 6.4.2006, revisio 0