Med digital lydbehandling kan vi trekke ut en rekke måltall som kan brukes til å analysere musikk. De fleste av disse metodene er beskrevet teknisk i tidligere avsnitt, men det kan være nyttig å se litt mer på hvordan de kan anvendes i en musikologisk sammenheng.
Et sonogram er et spektrogram der tiden går langs x-aksen, frekvens langs y-aksen og amplityder vises som gråtoner (se figur 3.10). I kombinasjon med et oscillogram som viser amplityde, er dette en meget nyttig og lettlest representasjonsform som egner seg godt til publikasjon og i undervisning.
Det finnes mange programmer som kan produsere sonogrammer, men ikke alle gir like pene resultater. På NoTAM har vi laget et lite program for SGI-maskinene som heter Sono. Vi bruker Sono bl.a. til å lage partiturer for lydteknikeren under framføring, som hjelpemiddel under produksjon av musikkvideoer, og som generell dokumentasjon.
Et sonogram inneholder altfor mye informasjon til at det kan brukes direkte til f.eks. statistiske sammenlikninger. Det er endel måltall som vi kan bruke til å karakterisere visse egenskaper ved spekteret og dermed redusere datamengden.
For det første kan vi prøve å finne grunntonefrekvensen (pitch) ut fra deltonene i spekteret. Dette er pitch-tracking i frekvensdomenet. Slike metoder vil i utgangspunktet bare fungere for enkle, monofone lydkilder, og selv for ideelle lydkilder vil man kunne få feilaktige resultater. Imidlertid er det gjerne slik at dersom pitch-trackeren først har funnet riktig grunntone, vil den gi et meget nøyaktig resultat. Analyser med hensyn på f.eks. intonasjon og mikrotonalitet vil derfor kunne fungere meget bra.
Et annet nyttig måltall er det spektrale tyngdepunktet (centroiden). Hvis vi har N deltoner (eller kanaler i FFT-analysen) med frekvenser og amplityder , er det spektrale tyngdepunktet gitt ved en vektet og normalisert sum:
Tyngdepunktet gir et godt mål for hvor "lyst" spekteret låter, tildels uavhengig av eventuell pitch.
Spektral entropi er et måltall som sier noe om hvordan energien er spredt i spekteret. En enkel sinus gir meget lav entropi, fordi energien er konsentrert i ett lite bånd. Hvit støy gir meget høy entropi, fordi energien er spredt fullstendig ut. Entropien korrellerer med støyinnhold i lyden, og vi kan også si at den er et mål for kompleksitet. Spektral entropi kan måles med Shannons informasjonsindeks:
der er amplityder for de N FFT-kanalene. Disse amplitydene bør være normaliserte slik at .
Alle disse måltallene, samt amplityden, kan presenteres sammen med et sonogram i et integrert diagram som gir et rimelig komplett bilde av lyden. På NoTAM har vi laget programmet Bio (opprinnelig ment for bioakustisk analyse) til dette formålet.
Vi vet ikke om noen robuste analysemetoder som kan finne starttidspunkter for lyder i et komplekst lydbilde. For analyser av rytmikk er det nok derfor foreløpig nødvendig å markere tidspunktene manuelt ved hjelp av f.eks. Bio. Ved å se på analysedataene og lytte samtidig, kan man bestemme tidspunktene forholdsvis nøyaktig og raskt.
Numeriske verdier for måltallene som er nevnt over kan behandles videre statistisk for f.eks. å finne korrelasjoner og grupperinger.