Le dithering, ça s'entend?
Je voudrais lancer ici un thread consacré à l'effet d'aliasing ( crénelage ) que l'on rencontre dans le domaine de la numérisation du son. Je suis loin d'être un expert en ingénierie sonore mais j'ai pu acquérir certaines notions au fil du temps qui ont pu me permettre d'aborder le phénomène sans nécéssairement entrer à fond dans de longues explications mathématiques sans doute passionnantes mais demandant un niveau que je ne possède pas.
Pour ouvrir le bal, je vous copie-colle quelques-un de mes message initialement postés sur ce thread du forum de Laurent Schark. Ensuite, à vous de meubler ce thread avec vos connaissances et vos questionnements, ensemble, tentons de mieux cerner le phénomène, et tentons, dans la mesure du possible, de démontrer les effets de l'aliasing, afin que ce sujet n'en vienne pas qu'à être traité seulement comme « une vue de l'esprit ».
Au plaisir !
Franco
====================================================================================================
Raphilou a écrit:Sinon une autre qouechtionne ( lol in english ) pour franco la muerte j'ai lu le terme d'anti aliasing. c'est un mot un peu barbare mais je vien de me rendre compte qu'il est sur mon test oscillator dans logic alors quoi qu'est-ce donc ? ^^
Merci pour vos réponse et a bientot
Hello Raphilou,
À propos de l’Aliasing (crénelage) et l’Anti-Aliasing (Anticrénelage), c’est un domaine qui peut s’avérer assez pointu à comprendre. Je ne suis pas un grand spécialiste de l’ingénierie sonore, mais si mon petit bagage peut t’aider à mieux t’y repérer, je peux te donner l’idée générale qui se cache sous ces termes.
L’Aliasing est, dans le domaine numérique, un repliement spectral survenant dans les hautes fréquences ( harmoniques ) d’un son lorsque la fréquence d’échantillonnage n’est pas assez haute pour gérer convenablement le rendu des fréquences hautes du son donné. Ce repliement spectral se résulte en des fréquences audibles ( souvent inharmoniques ) indésirables plus graves que les hautes fréquences. Plus techniquement, pour ne pas entendre le trouble d’aliasing, une règle fondamentale est à respectée, il faut que la fréquence d’échantillonnage soit au moins le double de la fréquence la plus haute à enregistrer.
Tu sais peut-être qu’il existe plusieurs fréquences d’échantillonnage dans le domaine numérique ?
Je disais que pour éviter les troubles d’aliasing, il faut que la fréquence d’échantillonnage soit au moins le double de la fréquence la plus haute entendue dans une prise donnée.
Si le son ( ou le spectre harmonique ) le plus aigu que tu enregistres se situe disons à 10 000 hertz, une fréquence d’échantillonnage d’au moins 22 050 hertz sera recommandée pour ne pas subir les effets indésirables de l’Aliasing. Si tu enregistres un son ( ou un son avec un spectre harmonique ) de 10 000 hertz toujours et que ta fréquence d’échantillonnage est fixée à 8 000 , 11 025, 16 000 hertz, il y a de fortes chances pour qu’à l’écoute, on entende les effets néfastes de l’Aliasing, car ces fréquences d’échantillonnages ne sont pas au moins le double de la fréquence la plus aigue à enregistrer.
L’oreille humaine peut entendre grosso modo les fréquences jusqu’à 20 000 hertz. La fréquence d’échantillonnage (correspondante à la qualité CD ) de 44 100 hertz est donc jugée suffisante pour rendre, sans artéfacts d’aliasing très audibles, toutes fréquences entendues parce qu’elle fait au moins le double de la fréquence la plus aigue entendue par la meilleure des oreilles humaines.
Sur les synthétiseurs numériques ( comme tous les synths VST ou les synthé de Reason ), quelque fois, la fréquence d’échantillonnage « interne » n’est pas assez haute et c’est ce qui fait qu’un VST ( ou le Subtractor de Reason ) peut comporter quelques troubles apparents d’aliasing. Certains VST comme AbSynth permettent de passer du mode Aliasing au mode Anti-aliasing. Le trouble d’aliasing peut quelque fois être cultivé comme un effet voulu, de plus un filtre anti aliasing demande souvent un certain calcul supplémentaire de la part de l’ordinateur, ce qui fait que le VST devient plus lourd dans la session de travail.
---------------------------------------------------------------------------------------------------------------------------------------
Théorème d'échantillonnage de Nyquist-Shannon ( fiche wikipédia )
wikipedia a écrit:Le théorème de Nyquist-Shannon, nommé d'après Harry Nyquist et Claude Shannon, énonce que la fréquence d'échantillonnage d'un signal doit être égale ou supérieure au double de la fréquence maximale contenue dans ce signal, afin de convertir ce signal d'une forme analogique à une forme numérique. Ce théorème est à la base de la conversion numérique des signaux.
La meilleure illustration de l'application de ce théorème est la détermination de la fréquence d'échantillonnage d'un CD audio, qui est de 44,1 kHz. En effet, l'oreille humaine peut capter les sons jusqu'à 16 kHz, quelquefois jusqu'à 20 kHz. Il convient donc, lors de la conversion, d'échantillonner le signal audio à au moins 40 kHz. 44,1 kHz est la valeur normalisée par l'industrie.
Raphilou a écrit:je ne connaissais pas le terme d'aliasing et surtout cet effet harmonique
Aliasing est en fait un terme anglophone. En français on lui préfère « crénelage ». Mais dans le monde de la M.A.O ( ainsi que dans le domaine du visuel ) et cie, le terme « aliasing » est plus couramment utilisé. C’est un peu comme lorsqu’on parle d’un « LFO » sur un synth ( Low Frequency Oscillator ), rarement, verra-t-on affiché un « OBF » ( Oscillateur de Basse Fréquence ), héhé.
L’effet de l’aliasing est perceptible et s’entend, ce n’est pas une vue de l’esprit. Je faisais référence au monde de l’image, au cinéma le crénelage peut aussi être apparent. Le meilleur exemple est la roue de carriole tirée par des chevaux dans les films westerns par exemple :
On remarquera souvent, quand il y a une caméra qui fixe la roue en mouvement, alors que la course du cheval va en s’accélérant, les mouvements de la roue, semble ralentir puis carrément partir à rouler dans le sens inverse. On a là une manifestation visuelle qui s’apparente à ce qu’on a dans le domaine du son.
Le cinéma fonctionnant à 24 images secondes, les mouvements de roue n’arrivent plus à être restitués correctement. Pour ce faire, il faudrait avoir une meilleure « fréquence d’échantillonnage » ici visuelle. Et encore, sans doute qu'on se buterait à la faculté de l'oeil humain « d'échantillonner » convenablement un détail mouvant d'une image donnée.
Je viens de te faire ces deux .wav, on entend très clairement les effets de l’aliasing. Avec une onde sinusoïdale générée par le VST Moog Modular V d’Arturia, j’ai fait jouer une séquence très aiguë. Voici tout d’abord la piste MIDI déclenchant les sons, on remarquera que je passe d’un demi-ton à un autre, et ce, de façon toujours ascendante :
Voici le résultat en .wav exporté avec une fréquence d’échantillonnage de 44100 hertz :
Test aliasing 44100 Hertz
Malgré l’aspect très aigu, on entend bien les notes se succéder en demi-ton, et ce, de façon constamment ascendante.
Même exemple avec une exportation en .wav avec une fréquence d’échantillonnage de 8000 hertz :
Test aliasing 8000 Hertz
On entend très bien à partir de la 5iem note que les notes suivantes ne montent plus en fréquence, mais descendent. Pourtant, rien n’a été modifié dans les hauteurs à la source, sur la piste MIDI et sur le VST Moog Modular V ! Si on perçoit que le son descend, cela est attribuable à un seul facteur : L’Aliasing ! Ici la fréquence d’échantillonnage de 8000 hertz, permettrait d’encoder pas trop mal les fréquences se situant au plus à la moitié de ce 8000 hertz, soit les fréquences sous le 4000 hertz, les fréquences dépassant ce « plafond » se trouvent à être repliées sur elle-même, c’est ce repliement spectral qui fait entendre des fréquences descendantes alors même qu’elles augmentent ! Un peu comme à l’image de la roue du chariot western qui semble ralentir alors même que le galop du cheval augmente.
Dernière édition par Franco L.M le Lun 15 Juin 2009 - 7:56, édité 1 fois