compression.gif (2582 octets)

 

Une fois le document numérisé, il a un poids ou une taille informatique exprimé en ko (kilo octet) ou Mo (Méga octet).

Sur un CD audio du commerce

il faut environ 10 Mo pour 1 minute de son stéréo.

La capacité maximale d'un CD-R est d'environ 650 Mo donc 65 minutes (je simplifie, il existe une différence entre les cédéroms et les CD Audio). Or il existe des cédéroms qui contiennent 2 à 3 heures de commentaires. Même en mono, 2 heures de commentaires avec un son de qualité CD audio occuperaient la totalité du cédérom, ne laissant aucune place pour les images et le texte. Ce n'est évidemment pas possible. Il faut impérativement réduire la place qu'occupent ces 2 heures de commentaires (c'est à dire diminuer le nombre d'octets nécessaires pour les coder).

C'est la compression des données.

Le problème sera le même pour Internet mais les réponses sont différentes.

Pour plus d'informations sur les problèmes de son sur Internet, cliquez ici.

La compression des données est un problème commun à toute l’informatique, pas uniquement au son. Il faut bien différencier compression et compactage.

Le compactage est une réduction des données (par exemple réduire la taille d’un fichier texte) avec la possibilités de récupérer intégralement les données de départ sans aucune perte. L’exemple le plus connu est le compactage avec des outils comme WinZip.

Dans la compression, il y a réduction des données sans possibilités de récupérer toutes les donnée du départ. Il y a donc une perte irréversible d’une partie des données. Il faut donc bien s’interroger sur ce que l’on fait lorsque l’on compresse car on ne peut revenir en arrière.

Compactage  = réduction et récupération de l’intégralité des données possible

Compression = réduction et perte d’une partie des données

Les outils utilisés pour le compactage dépendent de la nature des données. WinZip fonctionne très bien pour des fichiers « texte » mais très mal pour des fichiers « son ». Cela est du à la structure même des données dans un fichier son. Il existe des logiciels spécifique pour compacter des fichiers : Waves TrakPac et Emagic Zap (voir liste logiciels dans les liens). Attention, le taux de réduction ne dépasse guère 30% à 70%. Bien loin des réductions que l’on obtient avec WinZip sur un fichier « texte ». Cela est du, encore une fois, à la structure même des données dans un fichier « son ».

Ce qu’il faut retenir c’est que compression en audio numérique signifie réduction de taille et pertes de données.

Tout ce qui vient d’être dit (écrit) plus haut concernait le numérique (digital) en général. En fait dans les métiers du son, compression possède un sens plus particulier. Il s’agit toujours de réduction mais appliqué à la dynamique d’un signal (écart entre le niveau le plus faible et le niveau le plus fort). La compression d’un signal sonore c’est donc la réduction d’écart entre ces deux niveaux alors qu’en informatique, la compression c’est la réduction de la taille d’un fichier..

 

puceorange10.gif (155 octets) Comment compresser ?

Sur un CD audio, le son est numérique. Il est codé selon un format appelé PCM (Pulse Code Modulation). Deux paramètres sont importants :

  • la fréquence d'échantillonnage, 44,1 kHz pour un CD audio
  • la quantification, 16 bits pour un CD audio.

On peut jouer sur ces deux paramètres pour réduire (compresser les données) le fichier son.

Exemple, vous avez 1 minute de musique stéréo, elle occupe 10 Mo.

Si vous convertissez cette minute de musique

  • de stéréo en mono, vous gagnez un facteur 2 (un seul canal à la place de deux)
  • de 44,1 kHz en 22 kHz (en fait 22,05 kHz), vous gagnez encore un facteur 2
  • de 16 bits en 8 bits, vous gagnez encore un facteur 2.

En définitive vous avez converti votre minute de musique stéréo, 44,1 kHz, 16 bits qui fait 10 Mo en une minute de musique mono, 22 kHz, 8 bits qui ne fait plus que 10/8 (car 2x2x2=8) 1,25 Mo.

Évidemment, la qualité n'est plus la même, vous entendez du souffle, des crachotements,

une partie des aigus a disparu.

Si vous choisissez 11 kHz (en fait 11 025 Hz) au lieu de 22 kHz, vous gagnez encore un facteur 2. Votre fichier de départ ne fait plus que 625 ko.

Tous les possesseurs d'ordinateurs multimédias peuvent effectuer ces conversions (compression) eux-mêmes. Les outils sont généralement fournis sous forme de logiciels avec la carte son. Mais il existe des outils professionnels comme Sound Forge, Wave Lab, Cool Edit Pro, Waves Convert qui permettent de minimiser les désagréments dus à la compression et d'obtenir un résultat répondant à des standards professionnels.

 

puceorange10.gif (155 octets) Des exemples, des exemples, des exemples. Bon d'accord !

« The Microsoft Sound » que vous entendez à l'ouverture d'une session Windows 95 (si vous êtes sous Windows 95 évidemment) est un fichier mono, 22 kHz, 8 bits. Il fait 132 ko et dure 6,123 secondes. Il a été composé par Brian Eno. Eh oui ! Vous pouvez le vérifier et l'écouter. Il est situé en C:\WINDOWS\MEDIA. Si vous travaillez sous Windows 98, il existe un nouveau « The Microsoft Sound ». C’est un fichier stéréo, 22 kHz, 16 bits. Il fait 676 ko et dure 7.859 secondes. La qualité (sonore) n’est pas du tout la même. C’est le jour et la nuit.

Autres exemples.

puceorange10.gif (155 octets) Téléchargez le fichier Spa4416.wav (632 ko).
C'est un fichier de voix mono, 44,1 kHz, 16 bits d'une durée de 7,33 secondes.
C'est le fichier original, sans aucun traitement. La voix est enregistrée en studio avec du matériel professionnel. N'espérez pas avoir cette qualité avec une carte son et le micro livré avec.

puceorange10.gif (155 octets) Téléchargez le fichier Spa118.wav (80 ko).
C'est le même fichier de voix mono mais 11 kHz, 8 bits d'une durée de 7,33 secondes.
La durée du fichier est identique mais le poids est réduit d'un facteur 8.
Le logiciel utilisé pour la conversion est un logiciel de gamme moyenne.
Remarquez le souffle important qui "grésille", les sifflantes sur la voix et la perte dans les aigus.

puceorange10.gif (155 octets) Téléchargez le fichier Spa118T1.wav (80 ko).
Toujours le même un fichier de voix mono, 11 kHz, 8 bits d'une durée de 7,33 secondes.
Le traitement est effectué avec des logiciels professionnels.
Le souffle est présent (on ne pas l'enlever complètement) mais constant, les "s" sont moins sifflants, la voix est plus présente et plus chaude.

puceorange10.gif (155 octets) Téléchargez le fichier Spa118T2.wav (80 ko).
Toujours le même un fichier de voix mono, 11 kHz, 8 bits d'une durée de 7,33 seconde.
Le traitement est différent du précédent.
Le souffle est encore moins présent mais pas constant.

 

Votre ordinateur multimédia est en général capable de relire les fichiers sons compressés de cette manière. Ils sont reconnus directement par le lecteur de votre ordinateur.

Toutes les compression que nous venons d’illustrer sont des compressions « sauvages ». Il existe des compressions plus subtiles qui utilisent des algorithmes (des suites de calculs très compliqués). Vous en connaissez certainement ; Real Audio ou le mp3 par exemple (le vrai nom est MPEG1 Audio Layer-3, pour en savoir plus sur le mp3, cliquez ici). Il y en beaucoup d’autre ADPCM, le VQF, etc. Le MiniDisc de chez Sony utilise également une compression de ce type. En général, ces compressions exigent des logiciels particuliers ("player" en anglais) pour lire les fichiers ainsi transformés (convertis). Elles sont très utilisées sur Internet.

 

puceorange10.gif (155 octets) Le mp3

C’est évidemment la grande affaire depuis quelque temps.

Son vrai nom est MPEG1 Audio Layer-3. MPEG signifie Moving Picture Experts Group. C’est une compression développée par l’Institut Fraunhofer et l’Université d’Erlangen dans le cadre d’une recherche européenne sur la radio numérique. C’est une compression qui ressemble à celle utilisée par Sony pour son MiniDisc.

Plusieurs taux de compression sont possibles. Celui utilisé sur Internet est en général 12. Ce qui correspond à une vitesse de transfert de 128 kb/s. Un taux de 12 signifie que l’on réduit d’un facteur 12 la taille du fichier de départ.

C’est une compression, il y a donc réduction des données. Ne rêvez pas, la qualité est bonne mais inférieure à celle d’un CD Audio normal.

Il faut absolument tordre le cou à cette croyance qui dit que le mp3 c’est aussi bon que le CD. C’est faux. Le mp3 est pratique sur Internet, le son est correct mais c’est un recul en qualité.

Si vous comparez la vitesse de transfert nécessaire au mp3 (128 kb/s) et la vitesse de votre modem (33,6 kb/s ou 55,6 kb/s), vous voyez tout de suite que on ne peut pas faire de « streaming » avec le mp3 sur Internet, seulement du téléchargement.

Pour en savoir vraiment plus :


Suite de la visite

 

(c) 1999 MSAI Reproduction interdite sans notre accord écrit.
msai@msai-music.com

bl5sommaire.gif (400 octets)

Accueil

Boutique

Artistes

News

Liens

Email

bl5boutique.gif (404 octets)

Catalogue

CD

Sécurité

Kerig

Conditions générales de vente

Arkan

Jack o' Lanternes

Casse Pipe

Vincent Spatari

Long John Silver

Pascal lamour

Amère Olga

Édition musicale

Kerig

bl5technique.gif (430 octets)

Son Multimédia

Compression

Traitements

Son sur Internet

Midi

FAQ

bl5liens.gif (272 octets)

Tous les liens

Annuaires professionnels

Cartes Son

Droit d'auteurs

Son et internet

Logiciels

Magazines

MIDI

Radios

Sites avec de nombreux liens

Synthétiseurs et histoire des synthés

Les news

 

C'est le courrier !!!

10 place du Manoir
35400 ST MALO
France
tél 02 99 19 01 50
fax 02 99 19 01 60

 

© 1999 MSAÏ France Tous droits réservés