Je suis tellement confus ... quelle est la différence entre un codec audio/vidéo (qui est apparemment un raccourci pour "encodeur/décodeur", un peu comme "modem" est vraiment "modulateur/démodulateur") et un audio/format vidéo?
(Est-ce que j'utilise même la terminologie correcte?)
autrement dit, quelle est la différence entre dire que quelque chose est "MPEG-4" et dire quelque chose utilise le codec "DivX"? Pourquoi le lecteur Windows Media exécute-t-il parfois des fichiers .mpg
et parfois pas?
De plus, lesquels des codecs, quels sont les formats de fichiers et lesquels ne sont ni l'un ni l'autre?
Quelques définitions principales:
Comme vous pouvez le constater, nous devrons expliquer certaines choses ici.
Un codec est l'abréviation de codeur/décodeur, ce qui signifie simplement ce qui suit: Les données générées par un codeur peuvent toujours être décodées par un décodeur approprié. Cela s'avère être valable pour la vidéo, l'audio, mais vous pouvez aussi penser à la cryptographie (un encodeur a besoin d'un décodeur approprié pour afficher un message crypté).
De nos jours, lorsqu'un codec vidéo est spécifié, les institutions qui y participent ne spécifient généralement que la syntaxe de la norme. Par exemple, ils diront: "Le format du train binaire doit être comme ceci", "Le 0x810429AAB
sera traduit ici en", etc. Souvent, ils fournissent un codeur et un décodeur de référence, mais comment un codeur est ensuite écrit pour correspondre à un tel codeur. un format appartient entièrement aux fabricants.
C’est la raison pour laquelle vous trouverez autant de codeurs pour le même codec, dont certains sont même commerciaux.
Avant de confondre terminologie, prenons un exemple. Prenons le cas de H.264 . Le nom de la norme est H.264 - ce n'est pas le nom du codeur actuel. Mainconcept est un très bon encodeur commercial, alors que x264 est un encodeur libre et open source. Les deux prétendent offrir une bonne qualité, bien sûr.
Le simple fait que vous puissiez optimiser l'encodage en fait une compétition ici. Les deux codeurs fourniront un train de bits normalisé pouvant toujours être décodé par un décodeur compatible H.264.
Donc, dans l'ensemble, disons simplement qu'un encodeur va:
Le flux binaire est ensuite multiplexé dans un conteneur.
Le décodeur va:
Ils sont tous deux conformes à une norme de codec. C'est tout!
Ces jours-ci, vous ne trouverez probablement que des vidéos codées avec les codecs que je mentionnerai ci-dessous. Fait intéressant, presque tous d’entre eux ont été créés par le groupe d’experts du cinéma (MPEG). Mais il existe également d’autres codecs libres de droits, par exemple. ceux créés par Google ou l'Alliance for Open Media, concurrents des normes MPEG.
Notez que "MPEG" peut faire référence à la fois aux codecs et aux conteneurs, comme vous le verrez ci-dessous. Cela ajoute à la confusion, mais sachez simplement que "MPEG" seul ne veut rien dire, par exemple. "J'ai un fichier au format MPEG" est très ambigu ".
MPEG-2 est assez vieux. Sa première version publique date de 1996. La vidéo MPEG-2 est principalement utilisée pour les DVD et la diffusion télévisée, par exemple. DVB-T ou satellite, et les applications traditionnelles où la compatibilité est importante. Les vidéos MPEG-2 se trouvent principalement dans un conteneur . MPG .
C’est probablement celui qui a été principalement utilisé pour encoder des vidéos pour le Web au milieu des années 2000, mais il a été remplacé entre-temps. Il offre une bonne qualité pour les fichiers de taille pratique, ce qui signifie que vous pouvez graver un film entier de 90 minutes sur un CD de 600 Mo (alors qu'avec MPEG-2, vous auriez eu besoin d’un DVD , voir ma réponse ici ). Cela ne fonctionne plus très bien pour le contenu HD ou 4K.
Certains encodeurs qui produisent une vidéo MPEG-4 Part 2 sont DivX , son arnaque open source XviD et . ) Nero Digital .
Les vidéos MPEG-4 Part 2 sont pour la plupart dans un conteneur AVI, mais MP4 est également utilisé fréquemment.
Ceci est également connu sous le nom de codage vidéo avancé MPEG-4 (AVC) ou H.264 ; c'est le codec le plus utilisé aujourd'hui. Il offre une bonne qualité pour les fichiers de petite taille et convient donc parfaitement à tout type de vidéo pour Internet ou les appareils mobiles. Vous trouverez le H.264 dans presque toutes les applications modernes, des téléphones aux caméscopes. Sur les disques Blu-ray, la vidéo est maintenant encodée en H.264.
Certains encodeurs sont: x264 , NVENC (de NVIDIA), Mainconcept . Les vidéos viennent principalement dans MP4 , MKV ou MOV.
Également appelé MPEG-H Partie 2, il s'agit du successeur de MPEG-4 Partie 10/AVC/H.264. Il vise des résolutions plus élevées (jusqu'à 8K ) et peut offrir des performances de codage jusqu'à 50% supérieures (en termes de qualité par rapport au débit) par rapport à H.264 (voir ce document , par exemple).
La norme a été publiée en 2013 et, lentement, le codec commence à être utilisé de plus en plus, par exemple pour la transmission IPTV ou la transmission vidéo en ligne. HEVC est également utilisé par Apple pour stocker des vidéos et des images (avec HEIF ) sur iOS. Cependant, le fait qu'il existe plusieurs pools de brevets associés à HEVC a poussé de nombreuses sociétés (presque toutes sauf Apple) à adopter des solutions de remplacement sans redevance. HEVC est également non pris en charge de manière native par tous les navigateurs, ce qui le rend inutilisable pour la diffusion Web.
Le codeur le plus connu est x265 . Il y a aussi NVENC. Les vidéos viennent généralement dans des conteneurs MP4 .
VP9 (le successeur de VP8) est un codec principalement développé par Google. Il est ouvert et libre de droits, et implémenté dans de nombreux navigateurs . Sa qualité est presque aussi bonne que HEVC, et parfois même meilleure (voir ce document de Netflix). VP9 est ce que vous obtenez lorsque vous regardez YouTube sur un navigateur qui le prend en charge.
VP9 peut être codé avec le codeur libvpx , et il entre souvent en WebM ou MKV .
Certaines entreprises se sont regroupées pour former un concurrent encore plus puissant à HEVC - mais en tant qu'alternative sans redevance. AV1 sera le successeur de VP9 et est basé sur ce qui était supposé devenir VP10. Il est soutenu par l'Alliance for Open Media (fondée par Amazon, Cisco, Google, Intel, Microsoft, Mozilla et Netflix). Lisez plus à ce sujet ici .
Le codeur libaom peut être utilisé pour générer des trains de bits AV1, mais il est toujours expérimental.
Jusqu'à présent, nous n'avions expliqué que le "flux binaire" brut, qui consiste essentiellement en de véritables données vidéo brutes. Vous pouvez réellement regarder la vidéo en utilisant un flux de données aussi brut. Mais dans la plupart des cas, cela ne suffit pas ou n'est pas pratique.
Par conséquent, vous devez envelopper la vidéo dans un conteneur. Il y a plusieurs raisons pour lesquelles:
Pour toutes ces raisons, les formats de conteneur ont été inventés, certains simples, d'autres plus avancés. Ce qu'ils font tous, c'est "envelopper" le flux vidéo dans un autre flux.
Un conteneur synchronise les images vidéo et audio en fonction de leur horodatage de présentation (PTS), ce qui garantit leur affichage exact au même moment. Cela permettrait également d'ajouter des informations pour les serveurs de diffusion en continu, si nécessaire, afin qu'un serveur de diffusion en continu sache quand envoyer quelle partie du fichier.
Jetons un coup d'oeil à certains conteneurs populaires.
Vous trouverez des vidéos principalement emballées dans les conteneurs suivants. Il y a aussi d'autres moins populaires, mais comme je l'ai dit, ce sont principalement:
Entrelacement audio/vidéo - c'est le conteneur le plus élémentaire, il est juste là pour entrelacer l'audio et la vidéo. Il a été écrit en 1992 et est encore utilisé aujourd'hui, mais considéré comme un héritage, ne l'utilisez plus.
est également appelé MPEG-4 Part 14 et est basé sur le format de fichier QuickTime. C'est le format idéal pour la vidéo H.264, mais il englobe également HEVC, MPEG-4 Part 2 et MPEG-2.
Ce conteneur peut également uniquement encapsuler de l'audio, c'est pourquoi vous trouverez autant de fichiers .mp4 qui ne sont pas des vidéos mais plutôt des fichiers audio codés AAC , ainsi que dans les fichiers .m4a (juste une extension différente). L'extension .m4v est généralement utilisée pour les trains de bits vidéo.
Matroska Video (MKV) est un format de fichier gratuit et à source ouverte, souvent utilisé de nos jours, car il prend en charge pratiquement tous les codecs, du H.264 à VP9, ainsi que de nombreux codecs audio.
WebM est basé sur MKV et est principalement utilisé pour la vidéo VP9 et l'audio Opus. Il s'agit du conteneur de choix pour la vidéo en continu sur le Web lorsque ces codecs sont utilisés.
Le conteneur Ogg est le conteneur de choix pour le codec vidéo Theora (et le codec audio de Vorbis ), également créé par la fondation Xiph.Org. C'est également gratuit et open source (tout comme le codec).
Le format vidéo Flash a été créé par Adobe pour être utilisé dans leurs applications de diffusion en continu. Il n'est plus beaucoup utilisé, car la façon dont le streaming est effectué a considérablement changé au cours des dernières années.
De plus, lesquels des codecs, quels sont les formats de fichiers et lesquels ne sont ni l'un ni l'autre?
libavcodec
et libavformat
pour créer des codecs et des conteneurs, respectivement. La plupart des outils vidéo que vous trouvez aujourd'hui sont basés sur celui-ci.Sur une note de côté:
Est-ce que j'utilise même la bonne terminologie?
J'imagine qu'une fois, je préférerais utiliser spécifiquement "codec" et "conteneur" au lieu de "format" pour éviter les malentendus. Un format peut théoriquement être n'importe quoi, car les conteneurs codecs et spécifient un format (c'est-à-dire comment les données doivent être représentées).
Cela étant dit, la terminologie FFmpeg consisterait à utiliser "format" pour le conteneur. C'est aussi à cause de la distinction entre:
libavcodec
, la bibliothèque d'encodage/décodagelibavformat
, la bibliothèque pour les conteneursEn général, un 'format' de média est en réalité un conteneur, contenant un flux audio (de certains codecs audio) et un flux vidéo (de certains codecs vidéo) et parfois des informations supplémentaires. la plupart des 'fichiers' que vous avez ont un type de fichier basé sur le conteneur et non sur le codec
FFmpeg n'est ni un conteneur, ni un codec - c'est une suite polyvalente de bibliothèques, de codecs et de logiciels pour la conversion de fichiers qui est à la base de nombreux convertisseurs et lecteurs de musique.
H.264/AVC et xvid/divx sont des codecs
AVI (qui sont des fichiers divx/xvid), mp4, mpeg sont des conteneurs.
Quicktime mov n'est pas sûr - .mov est un conteneur, quicktime est un codec.
il y a codec s et conteneurs (formats de fichier). Le codec décrit comment les données sont codées/décodées. L'autre décrit comment les données encodées sont placées dans le fichier.
La plupart des lecteurs multimédias prennent en charge plusieurs types de codecs et de conteneurs. C'est déroutant, alors je vous suggère de lire mes références pour plus d'informations.