PIANOWEB.fr    " Espace Dossiers "
Portail sur la musique et les claviers modernes : piano, synthétiseur et orgue.

TECHNIQUE ET MAO



LE SON, SA CONSTITUTION ET LE NUMÉRIQUE

Si nous pouvons aujourd'hui écouter de la musique, donc du son, c'est parce que nos connaissances et nos expériences passées nous ont permis de fabriquer des appareils capables de le capturer et de le restituer. Alors qu'il est impossible d'emprisonner un son directement puisqu'il s'évapore dans l'air, il fallait trouver un moyen pour le capturer. Toutefois, enregistrer un son sans pouvoir le restituer n'aurait eu aucun intérêt. Le premier problème technique que durent résoudre nos aïeux fut le suivant : passer de la source sonore à un support de mémorisation, et ensuite passer de ce support à la restitution du son d'origine.


LA FIDÉLITÉ SONORE ANALOGIQUE ET NUMÉRIQUE

Depuis les premiers appareils, la restitution sonore est devenue plus fidèle, relayant les craquements des disques vinyles et autres bruits de fond aux oubliettes ou presque ! De nos jours, l'enregistrement repose sur deux approches techniques : l'analogique et le numérique. Le premier aux possibilités limitées a trouvé dans le second une continuité et une véritable révolution qui déborde largement du domaine sonore.


Ad Block

Il semblerait que vous ayez installé un bloqueur publicitaire sur votre ordinateur. Celui-ci vous empêche de consulter cette page dans sa totalité et dans des conditions visuelles optimisées. La mise en ligne d'encarts publicitaires non intrusifs permet à ce service d'exister durablement.

Pour ne plus subir cette restriction sur d'autres pages du site, nous vous conseillons de désactiver votre bloqueur publicitaire pour l'ensemble du site "www.pianoweb.fr". Merci de votre compréhension.

Procédure pour autoriser "pianoweb.fr"


Les modes de fonctionnement de l'enregistrement et de la reproduction sonore analogique et numérique sont fort éloignés, même si les deux principes recherchent le même but : celui de reproduire le plus fidèlement possible la source originale. Alors que l'enregistrement analogique repose sur l'utilisation d'un ruban sur lequel viennent se greffer des particules magnétiques, le numérique convertit le son sous forme de valeurs numériques ; celle-ci étant représentées par une succession de 0 et de 1.

Outre qu'un son musical évolue dans le temps, sa constitution est fort complexe, étant faite de sons graves et aigus. Les sons purs constitués d'une seule fréquence sont rares dans notre environnement. Le plus souvent, ils s'intègrent dans les expériences en laboratoire et dans la recherche sonore (synthèse).

En numérique, il est obligatoire de réaliser de nombreuses mesures. De leur précision dépendra la 'fidélité' de restitution du signal d'origine. Et qui dit précision, dit stockage. Là est le principal inconvénient de cette technologie des 'temps modernes', car dès que la précision augmente, la quantité de données suit le même chemin et demande toujours plus d'espace. C'est pour cette raison que des formats de compression audio ont vu le jour, tel le MP3.

En analogique, la précision de la 'fidélité sonore' existe également. Pour l'améliorer, l'augmentation du défilement de la bande est souvent utilisée. En passant, par exemple, la vitesse de défilement de 19cm/s à 38cm/s, les détails enregistrés sur le support magnétique seront plus nombreux, ce qui se traduira par une restitution sonore plus fidèle (consulter le dossier : L'enregistrement analogique). Toutefois, le problème majeur de l'enregistrement analogique est le 'bruit de fond'. Pour s'en détacher, il faut aimanter un plus grand nombre de particules magnétiques en utilisant une bande plus large et plus épaisse. Un enregistrement réalisé sur une bande quart de pouce sera toujours plus efficace quand toute sa largeur utilisera deux pistes plutôt que quatre (bien que la marque Fostex osera démontrer le contraire en commercialisant le magnétophone R8, un huit pistes qui utilisait une bande quart de pouce !).

Quant à la cassette, avec sa bande étroite et fragile, elle n'a eu son salut que parce qu'elle était plus pratique à utiliser. La platine K7 n'est devenue un des maillons de la chaîne HI-FI qu'au bout de quelques années, quand sont apparus de nouveaux procédés technologiques comme les réducteurs de bruit de fond DNL et Dolby. Le DBX, plus performant, était généralement réservé au magnétophone professionnel.

Si la cassette a été le support de vulgarisation par excellence en possédant le meilleur rapport qualité/prix, la solidité et la fiabilité de la grosse bande magnétique n'a jamais été contesté, surtout aux yeux des professionnels du son.




LES CONTOURS DU SON



En dehors de l'éternel débat entre la chaleur de l'analogique et la fidélité du numérique existe un autre enjeu de taille : comment réagissent nos oreilles à un son, à un bruit ?

'Les oreilles', outre la subjectivité auditive de celui qui les possède, ont toutes un seuil, des limites naturelles. Vous et moi, nous pouvons qualifier un son à travers des adjectifs tels que : agréable, puissant, agressif, profond, beau, laid, inaudible… Ces quelques adjectifs, qui mettent en avant des jugements de valeurs, impliquent également que l'évolution des technologies doit tenir compte des engouements, des modes et des tendances. Aujourd'hui et plus qu'hier, le son est assujetti à des impératifs commerciaux (qui souvent impose leur dictat). Si techniquement nous pouvons mesurer des niveaux et tracer des courbes idéales, dans la réalité nous manquons souvent d'objectivité, les uns trouvant dans un son des sensations que d'autres ne ressentent pas et inversement.



QUAND NOS OREILLES 'VIBRENT'…

Par définition, la sensation auditive d'un son est produite par une onde acoustique qui génère une vibration. L'onde va créer un déplacement de particules dans l'air et ainsi atteindre nos oreilles. Sans la présence de l'air, aucun son ne pourrait circuler. Le son ne peut pas se propager dans le vide.

Autre caractéristique essentielle du son : sa vitesse de propagation. C'est-à-dire le temps qu'il va mettre pour atteindre nos chères oreilles. Sa vitesse dépend de la chaleur - plus celle-ci sera élevée, plus la propagation du son sera rapide - et de la densité du milieu (air, eau, métaux). Par exemple, un son parcourt 340 mètres par seconde à une température de 20°, alors qu'il effectuera 1480 mètres par seconde dans de l'eau à 20°. La sécheresse de l'air joue également un rôle en atténuant les aigus.

Les oreilles entendent certaines vibrations sonores, mais ignorent celles qui descendent trop bas (infrasons) ou montent trop haut (ultrasons). C'est là, une de leurs limites. Dans l'univers technique du son, la vibration sonore s'appelle la fréquence (parfois appelée 'hauteur sonore'). Celle-ci se mesure en Hertz et correspond au nombre de vibration par seconde. Cela signifie que le fameux diapason qui sert à accorder le piano et qui vibre à 440 Hz, produit 440 vibrations par seconde.

Si l'on abaisse une fréquence pour qu'elle avoisine les 20Hz (seuil généralement atteint dans le grave par une jeune oreille normalement constituée), elle est plutôt ressentie comme une onde venant percuter le corps. Cependant, l'onde ne prendra existence qu'à la condition que le volume sonore soit assez puissant. Il est donc nécessaire, pour qu'un son soit ressenti ou perçu, qu'à la fréquence s'ajoute une certaine intensité ou pression acoustique.

Pour tester les fréquences aiguës, si vous possédez un synthétiseur sur lequel vous pouvez modifier la fréquence du son, vous pourrez vous livrer à une petite expérience qui consiste à élever la fréquence d'une onde jusqu'à son maximum (la porteuse d'un synthétiseur FM conviendra parfaitement). Quand le synthétiseur délivrera des fréquences avoisinant le seuil de vos oreilles (généralement entre 16 000 et 20 000 Hz), le son disparaîtra, non pas parce qu'il n'est plus là, mais seulement parce que vos oreilles seront dans l'incapacité d'entendre de telles fréquences.

Autre limite auditive : la sensibilité des oreilles diffère si le son est grave, médium ou aigu et en fonction de la pression acoustique. Par exemple, un signal à 1 KHz (*) et émis à un niveau de 60 dB devra être de 80 dB à 40 Hz et de 70 dB à 8 KHz pour que nous ressentions une sensation sonore identique.

* 1 KHz = 1 000 Hz



LA PLAGE DE FRÉQUENCE

Un son n'est pas constitué d'une seule fréquence. Pour faire simple, un son favorise une plage de fréquence qui est déterminée par une courbe, d'où le nom de courbe de réponse en fréquence (ou bande passante).

Généralement destinée à évaluer le potentiel d'un matériel électronique, la courbe de réponse en fréquence est représentée dans les ouvrages et fiches techniques par un graphique illustrant les diverses fréquences et leur niveau respectif. Par exemple, elle donne une indication sur la plage de fréquence d'un son reproduit par un haut-parleur ou capté par un micro.

Théoriquement, si la courbe était horizontale, elle reproduirait ou restituerait toutes les fréquences à la même intensité. Cet idéal théorique n'existe pas dans la réalité. Suivant les fréquences, des écarts d'intensité plus ou moins importants existent. Le plus souvent, la courbe de réponse est donnée à +/- 3 dB par rapport à une fréquence étalon de 1 000 Hz à 0 dB.

La courbe de réponse en fréquence est facile à lire et donne en un coup d'œil des indications précieuses sur les différents niveaux de chaque fréquence. C'est un critère important qui est utilisé pour évaluer les qualités ou insuffisances d'un matériel, souvent par rapport à un autre. Il arrive parfois que la courbe de réponse en fréquence soit absente des fiches techniques et se trouve remplacée par une indication sommaire écrite comme à travers cet exemple : 50 à 15 000 Hz à +/- 3 dB.

Face aux fréquences, le matériel d'enregistrement et de reproduction ne réagit pas toujours de façon à satisfaire nos exigences. Pour un microphone et un haut-parleur, ce sont généralement les graves qui ont du mal à passer, tandis que pour un magnétophone à bande ce seront les aigus. Heureusement, les tables de mixage et autres correcteurs sont là pour pallier certaines insuffisances, pour améliorer à notre convenance le signal entrant ou sortant.



QUAND NOS OREILLES DEVIENNENT SENSIBLES…

Si l'acoustique sonore est 'encadrée' par des mesures, une fois de plus c'est l'oreille qui juge. Ainsi, un son de 60 dB à la fréquence de 1 000 Hz produira une sensation auditive plus forte que s'il est à une hauteur de 100 Hz. L'oreille est donc sensible au volume sonore et à leur fréquence, si bien que sans une certaine précaution d'usage, n'importe quelle musique peut rapidement devenir nuisible.

Mise en garde : à forte puissance, une sensation douloureuse peut naître, signe que les oreilles sont en danger. Combien de fois n'a-t-on pas entendu dire que la "génération Walkman" deviendrait une génération de sourds ! Un constat s'impose : si vous écoutez de la musique à un niveau pas assez fort pour avoir des sensations douloureuses, mais trop fort dans la limite du raisonnable, vos oreilles en payeront le prix… et il n'y a pas de retour en arrière possible ! Les appareils auditifs ne sont que des béquilles. Prenez en conscience !.

Nos oreilles aiment bien les fréquences qui se situent entre 1 000 et 5 000 Hz. C'est ainsi ! Nous percevons mieux les médiums que les aigus ou les graves. C'est pour ces raisons que nous flattons souvent nos oreilles en utilisant le 'loudness' * de nos amplificateurs lorsque nous écoutons de la musique à faible volume.

Techniquement, le volume sonore est souvent assimilé à de la dynamique que l'on traduit en décibels. Généralement, entre le son le plus fort recommandé par la prudence, et celui le plus faible, on obtient un écart de 100 dB. Aller au-dessus devient dangereux, surtout si le son se prolonge dans le temps, comme le ferait le son d'une basse synthétique. Un niveau de120 dB n'est acceptable que dans la mesure où le signal est très bref, en crête, pas à la façon d'un 747 qui passe au-dessus de votre tête !

* Loudness : correcteur physiologique présent sur les amplificateurs HI-FI. Utilisé à faible puissance, il permet de relever les basses et les aigus afin d'obtenir une sonorité à l'apparence plus ronde et colorée. Son utilisation donne la sensation d'un son plus équilibré sur toute la bande de fréquences audibles.



QUAND NOS OREILLES DIFFÉRENCIENT…

S'il existe des fréquences, des intensités, il existe également des couleurs sonores que l'on traduit sous l'appellation de timbre. Deux instruments de musique jouant une même note ne généreront pas le même timbre. Dans la construction d'un son, interviennent une fréquence fondamentale et des fréquences harmoniques.

Lorsqu'on évoque la richesse d'un son, c'est qu'il contient de nombreuses harmoniques. A l'inverse, un son pauvre en harmonique donnera la sensation que celui-ci est terne, sans relief. Les harmoniques constituent la 'carte d'identité' du timbre.

Si nous reprenons l'exemple du diapason, le LA 440 Hz sera constitué de l'harmonique fondamentale (440 Hz) et d'harmoniques aux fréquences plus aiguës : 880 Hz, 1320 Hz, 1760 Hz… Les rapports de fréquence s'établissant avec la fondamentale seront des quotients de nombres entiers.




QUELQUES INCONVÉNIENTS CONCERNANT L'ENREGISTREMENT



Le premier capteur du son est généralement le microphone. La qualité de cet élément est décisive car il est le premier maillon de l'enregistrement sonore. Pour qu'un microphone capte toute l'agitation des molécules d'air, il doit être d'une grande sensibilité. Il doit posséder une membrane extrêmement fine pour réagir au moindre bruit. Or, la membrane du microphone a le défaut d'être fragile à fort volume (on ne compte pas le nombre de micros qui sont devenus hors d'usage après une mauvaise utilisation !).

Dans ce domaine comme dans tous les autres étages de l'enregistrement sonore, les micros se sont adaptés, transformés, pour faire face aux différents enjeux de la prise de son. Aujourd'hui, il en existe de différents types allant du dynamique à l'électrostatique en passant par ceux à ruban (voir ACHETER UN MICRO… DE LA SCENE AU HOME-STUDIO).

Si la plage des fréquences de nos oreilles est limitée, l'enregistrement peut aller bien au-delà. C'est même indispensable si l'on souhaite éviter les distorsions (appelées : rotation de phase) qui se situent aux extrémités du 20/20 000 Hz de référence. En utilisant une plage plus large (de 10 à 40 000 Hz, voire plus) on contournera en partie le manque de dynamique des graves et des aigus. Il faut bien sûr que l'amplification et les écoutes soient d'excellente qualité pour délivrer une telle plage.

Côté numérique et échantillonnage, le théorème de Nyquist a démontré que si l'on veut enregistrer en échantillonnant toutes les informations jusqu'à 20 kHz, il faut échantillonner au double de la fréquence. L'inconvénient de la procédure est de se retrouver avec des informations inutiles et qui produisent de surcroît des effets 'd'aliasing', effets qui s'estompent si l'on enregistre encore deux fois plus vite.

Pourtant, tout n'est pas encore parfait, car même si l'on réduit les effets 'd'aliasing', encore faut-il que l'ordinateur et les différents circuits soient capables de conserver intactes les valeurs numériques enregistrées. Si c'est correct pour un graveur de CD, un échantillonneur ou un séquenceur audio génèrent souvent des calculs approximatifs qui provoquent des 'erreurs d'arrondis' lors de la conversion.

Cependant, la distorsion de conversion est vraiment négligeable, bien moins que l'analogique qui entraîne inévitablement une dégradation du signal. La distorsion joue sur l'amplitude, le contenu harmonique, le calage des différentes fréquences, etc. Les modes de calcul numérique tout en étant plus importants que les manipulations analogiques, ont permis de faire disparaître certaines distorsions considérées jusqu'alors comme inévitables.




LA QUALITÉ IDÉALE



Alors qu'en numérique, l'idéal serait échantillonné en 24 bits (*) et 80 kHz, le CD du commerce est livré en 16 bits 44,1 kHz. Bien que ce niveau demeure encore le standard officiel, il est depuis longtemps surclassé dans les studios d'enregistrement. Déjà, depuis quelques années, on peut se procurer des cartes sons travaillant en 24 bits. Toutefois, une telle dynamique impose que l'électronique embarquée dans les ordinateurs suive le même chemin, ce qui n'est pas toujours le cas !

En numérique, l'utilisation d'un '16 bits/44,1 kHz' est donc insuffisant pour enregistrer tous les sons. La marque Hohner a été une des premières à proposer un système complet fonctionnant sur 32 bits à la fin des années 90. Mais cela reste encore l'exception. Le plus souvent, les cartes à convertisseurs sont en 24 bits et doivent faire bon ménage avec des logiciels travaillant à un niveau inférieur (16 bits). Sachez également qu'avec 144 dB de dynamique, le traitement en 24 bits va bien au-delà de ce que les amplis du commerce sont capables de supporter.

A cela s'ajoute le problème du blindage qui doit être beaucoup plus efficace si l'on utilise des convertisseurs supérieurs à 16 bits, étant donné que les cartes vont se loger à l'intérieur d'un espace très réduit où circulent des tas de signaux électroniques à hautes fréquences. L'idéal est d'utiliser un convertisseur en rack doté d'entrées numériques S/PDIF.

* un bit = 6 dB


L'ENREGISTREMENT NUMÉRIQUE A AUSSI SES LIMITES !

Comme précisé dans le premier paragraphe, l'enregistrement numérique s'appuie sur des valeurs numériques binaires (0 et 1). Le calcul des opérations se fait sans décimales. Tant que vous copiez un fichier sans apporter de modifications à l'original, la copie générée ne subit pas de dégradation. Elle est identique. Or, il suffit de modifier par exemple le volume pour que des nuances naissent.

Prenons un petit exemple tout simple : imaginons un échantillon qui a pour valeur 3. Si nous le divisons par 2, à la sortie nous aurons 1 et non 1,5, puisqu'il n'existe pas de décimales dans les calculs numériques. Ensuite, si nous souhaitons retrouver le niveau initial, la multiplication par deux donnera 2 et non 3.

A travers ce petit exemple, on peut imaginer aisément que des changements constants de volume entraînent des erreurs d'arrondis. C'est ainsi que le son se dégrade petit à petit à travers d'incessants calculs sans décimales. Bien sûr, comparé à l'analogique, le mal est moindre, car dans ce domaine en baissant de 10 dB le niveau sonore vous vous rapprocherez du bruit de fond, et lorsque vous souhaiterez remonter au niveau initial, le bruit de fond augmentera d'autant.

Pour faire face, les échantillonneurs de dernières générations utilisent des chips spécialisés dans ce genre de calcul (la marque E-mu a été une des premières à se pencher sur ce délicat problème). Pour diminuer considérablement les erreurs, les calculs numériques s'établissent avec une précision nettement supérieure (allant jusqu'à 48 dB, voire plus). Ensuite, le résultat final est converti en 16 bits.




COMPRESSONS POUR CONCLURE



Déjà utilisé avec le son analogique, la compression est en informatique un procédé qui consiste à utiliser un encodage pour gagner de l'espace sur un disque dur, pour ensuite retrouver l'original grâce à un décodeur.

Si un fichier texte est souvent léger, ne pesant que quelques Ko, un fichier audio d'une minute peut facilement dépasser plusieurs Mo, ce qui représente des dizaines de pages dactylographiées. Exemple : un enregistrement de 3 minutes en stéréo pèse plus d'une trentaine de Mo !

Lorsque l'on compresse un fichier au format zip, le logiciel tente de réduire les données sans en perdre. C'est là son grand avantage. Mais pour aller au-delà, quand on cherche à réduire drastiquement le poids du fichier, il faut alors admettre que des informations seront perdues.

Le célèbre compresseur de fichier audio, le MP3, part du principe qu'en éliminant certaines fréquences jugées inutiles on allège le fichier, sans ressentir à l'écoute de sensations trop négatives. Après la compression, qui peut atteindre 80%, le morceau de 3 minutes stéréo passe de 30 à 5 Mo (voire moins si l'on accepte une dégradation du son plus importante).

En studio, des systèmes de compression numérique de meilleure qualité sont utilisés. Proposés notamment par les marques Sony, Philips ou Roland, les appareils de compression utilisent un procédé différent dont le principe repose sur le fait qu'il existe tout un tas de sons que l'on n'entend pas (l'expérience veut qu'après un son fort, on ne perçoit pas certains détails sonores pendant un temps très bref, de l'ordre de quelques millisecondes).

Mais la compression est-elle toujours indispensable ? Si son usage pour un MiniDisc ou un baladeur aux prouesses technologiques limitées semble évident, compresser un fichier devient inutile quand on dispose d'un disque dur de plusieurs centaines de Gigaoctet… à moins, bien-sûr, de vouloir faire voyager votre fichier à travers une messagerie ou pour le déposer en mode streaming sur la Toile !

Pour ceux qui travaillent le montage numérique audio, il existe un moyen de réduire le poids des fichiers, c'est en 'jouant' avec les silences grâce aux pistes virtuelles. Sachant que dix secondes de silence valent dix secondes de musique, autant programmer un timing précis qui indiquera tous les points de démarrage de la musique. En gommant les silences, votre fichier audio n'en sera que plus léger !

par Elian Jougla

SUITE : LA DYNAMIQUE DU SON NUMÉRIQUE


À CONSULTER :
LES FORMATS AUDIO EN MAO
LE STUDIO D'ENREGISTREMENT NUMÉRIQUE

Vous avez aimé cette page ? Partagez-la ou bien suivez-nous !

L'AVIS DES INTERNAUTES

Soyez la première personne à publier votre message ici, en remplissant le formulaire ci-dessous.