jeudi 12 juillet 2007

M-JPEG vs MPEG-4 : Les DVD ne sont pas en JPEG animé

En ces temps de prise de conscience de l'intérêt que représente la vidéosurveillance dans la protection des citoyens et des infrastructures, la question du format d'enregistrement, qui n'est pas abordée dans le décret Sarkozy de novembre 2006 (voir l'article sur ce site), est souvent posée.
Deux constatations s'imposent dans cette industrie de la vidéo qui regroupe sans exhaustivité la TV IP ou le broadcast vidéo (triple play des fournisseurs d'accès), la TNT, la vidéosurveillance et la vidéo grand public :
-Le MPEG-4 est en train de devenir le standard des formats d'encodage devant le MPEG-2 et le DV (il suffit d'ouvrir les magazines de vidéo pour s'en persuader) c'est à dire que les caméscopes et plus généralement les systèmes d'encodage vidéo (les systèmes qui produisent des fichiers de vidéo compressée) produisent majoritairement du MPEG-4 (maintenant MPEG-4 AVC ou H264).
C'est vrai pour chacun des segments de cette industrie.
- Ensuite, on constate que dans le domaine de l'image numérique et non plus de la vidéo, le JPEG reste le standard incontesté. Bien plus léger que le bitmap (10 à 20 fois plus léger selon la qualité de l'image recherchée) il permet d'obtenir un ratio qualité/poids très satisfaisant.

Chez les constructeurs d'équipements de vidéosurveillance, le H264 commence à arriver et l'AVCHD est encore rarissime. La vidéosurveillance en vidéo numérique reste encore majoritairement MPEG-4 ASP (704x576 points de résolution par image).
En vidéosurveillance pourtant, la caméra IP n'a pas toujours produit du MPEG-4. Elle a commencé par produire des flux d'images JPEG dans un format appelé le M-JPEG. Le constructeur Suédois Axis a grandement contribué à faire connaître cette technique de transmission vidéo "image par image" qui ressemble au procédé du cinéma argentique.
Rapidement cependant, on a constaté que les images JPEG en résolution CIF (352x288) avaient un poids raisonnable mais qu'il augmentait presque linéairement quand on passait à du 4CIF (704x576). De plus, le JPEG animé ne prévoit aucun mécanisme de synchronisation de l'image et du son.
L'industrie des Télécom a travaillé simultanément sur la compression différentielle (différences entre images consécutives) et sur la synchronisation du son pour définir des solutions de visioconférence, dont le cahier des charges est sur le plan de la compression et de la transmission, quasi identique à celui de la vidéosurveillance pour converger vers le H263.
L'industrie de la vidéo domestique a simultanément travaillé sur les formats de stockage des DVD et a accouché du MPEG-2.
L'industrie du broadcast vidéo sur IP est partie des résultats acquis pour transformer l'essai en transmettant la vidéo compressée en MPEG-4 à travers les infrastructures réseau modernes, bénéficiant tout à la fois des améliorations et des standardisations de l'ITU (Télécom), du MPEG (vidéo) et des réseaux IP.

Ainsi l'industrie a convergé vers le format H264 ou MPEG-4 AVC qui fusionne aujourd'hui les travaux de ITU et MPEG. Si l'on a gagné un format multimédia qui se transmet et s'enregistre de façon standardisé (et qui s'indexera en MPEG-7), on a perdu les images au bénéfice d'un "flux" vidéo.
Derrière cette opposition apparente, pourtant, l'information est préservée.
En effet, dans la compression MPEG-4 de qualité, la reconstitution de chaque image est possible dans les mêmes conditions de qualité que l'image JPEG correspondante qui aurait été prise si l'on codait le flux en M-JPEG. Pourtant la quantité d'information transmise est 2 à 4 fois moindre : la différence vient du fait que l'on a appliqué un algorithme complexe afin de tenir compte des mouvements et des redondances entre les images (redondances spatiales liées aux textures et temporelles liées aux mouvements).
Ainsi, dans le MPEG-4, la notion d'images par seconde correspond à la fréquence de reconstitution d'image alors qu'en JPEG elle correspond à la fréquence de transmission d'image.

Il n'y a donc pas lieu d'écarter le MPEG à cause de problématique de preuve, dés lors que la reconstitution des images JPEG est possible dans des conditions de qualité suffisante à partir du MPEG enregistré.

Il n'y a pas lieu non plus de jeter le MJPEG à la poubelle car ce format est bien adapté à des environnements ou le réseau est perturbé et o๠le nombre d'images par seconde est limité.

In fine, on remarque que les constructeurs de caméscopes tendent à résoudre leur quadrature de cercle en fournissant des modèles hybrides qui filment maintenant en true HD (1080 lignes) au format AVCHD (H264 1080 lignes) et permettent l'extraction de photos en 3 ou 4 Mégapixels de résolution et en JPEG. Voilà probablement une boule de cristal assez fiable pour deviner l'avenir en vidéosurveillance.