Analyse technique d’une vidéo de Podcast YouTube

Je vais m’atteler ici à analyser avec précision la vidéo « Les Pictes – Chroniques de Prof #8 » produite par « La Prof » en considérant les conditions de créations d’une vidéo YouTube amateur

Publié le

Tout le monde a maintenant l’équivalent d’une station de télévision dans sa poche, et de plus en plus d’entre nous a des choses à montrer ou à raconter aux autres, en images, et sans à avoir la prétention de se dire professionnel de la télévision.
Cette démocratisation du tournage d’images permet une grande liberté d’action et de diversification des sujets, des thèmes au prix le plus souvent d’un niveau technique général un peu faible. La fraicheur et l’originalité du contenu arrive à dépasser ce niveau technique.

Les métiers de l’audiovisuel (je fais l’impasse sur le contenu éditorial, ce n’est pas le sujet ici) s’apprennent, ce n’est pas une surprise, bien que chaque débutant pense en avoir fait le tour avant même de commencer, et ces métiers ont une grande marge de progression dans leur apprentissage et sont très compatibles avec une approche autodidacte.

Essayer donc de caler les exigences techniques du monde de la télévision broadcast sur une vidéo de podcast YouTube semble stupide, mais je me suis dit que le jeu pouvait être instructif, aussi bien pour le regard de ceux du métier : en présentant le niveau technique que l’on peut attendre d’un « amateur » en 2016 (et ce n’est pas si mal), et instructif pour de celui qu’il l’ai fait, pour l’aider à progresser.

La vidéo:

Nous avons ici une Youtubeuse, professeure d’Histoire géo dans la vraie vie, parle de sujets d’Histoire et plutôt dans la période médiévale, dans un format de podcast vidéo. La vidéo alterne des plans face caméra type « narrateur », des insertions d’images (photos, gravures…), d’extrais vidéos courts, des citations audios courtes, et de la comédie en Cosplay jouée par la vidéaste elle même. Il s’agit de la 10 ème vidéo de la chaine Youtube La Prof.

La vidéo dure 7 minutes et 2 secondes, en version française et disponible en 1080p @ 25 images par secondes sur Youtube.
Le générique de fin, de l’Arial blanc sur un carton au noir arrive à 6:51.
La vidéo a été sous-titré (transcription) en français. Elle est tout public. J’ignore si elle est monétisée.

Le niveau de qualité technique attendu est donc celui d’un amateur éclairé qui a de bonnes notions de cadre et de montage.
Il va s’agir ici de noter des éléments à problèmes, et relever différentes remarques que l’on peut voir parfois sur des vidéos du même type, et en proposant des solutions pour y remédier.

Image

Le rendu général laisse à penser que le dispositif de prise de vue est soit un reflex vidéo avec une optique d’entée de gamme, soit un petit camescope de poing. En effet, les titres et les illustrations sont très nettes alors que l’image tournée est globalement molle, même en 720p.
Je pense que certains plans manquent de lumière, ce qui force le capteur dans ses limites de sensibilité et donne cette image « moyenne ». C’est très courant avec les reflex vidéos pour des prises de vues sous une lumière un peu faible.

Les faces caméra (narrateur) on un petit problème de cadre. Je doute que ça soit volontaire, et c’est classique quand on est seul pour se filmer.
Le meuble noir derrière impose sa géométrie. On s’attend à le voir plutôt rectangulaire, centré, et non un genre de trapèze traviole et déformé.

Capture d’écran 2016-03-02 à 23.00.37

Les faces caméra ont aussi un problème de lumière.
La partie droite du visage est très, voir trop bien exposé à la lumière de la fenêtre. La partie gauche ne reçoit que la lumière indirecte qui se reflète dans la pièce. Cela cause une importante différence d’exposition entre les deux parties d’un visage. C’est utilisé au cinéma pour marquer négativement un personnage. Je ne pense pas que ça soit le cas ici.

Capture d’écran 2016-03-02 à 22.59.28 2

Comment corriger ?
– Reculer le camescope le plus possible : une plus grande focale déformera moins l’image.
– Eclairer le plus possible, soit en ajoutant une source de lumière plutôt froide à droite pour compenser la fenêtre, soit en obturant la fenêtre et en ajoutant beaucoup de lumière dans toute la pièce. Le diaph sera plus fermé, le capteur travaillera moins, et l’image sera plus nette.
– Remonter un peu le camescope: il est actuellement au niveau du cou de la narratrice : une légère contre plongée peut révéler un coté professoral (elle debout nous parle et nous assis, nous l’écoutons), mais dans ce cas il n’est pas assez accentué. Et cela casse un peu le format classique « podcast/face cam » qui est plutôt en plongée.

Sur les plans Cosplay d’intérieur, la bulle est aussi cassée et nous retrouvons aussi un petit contre-plongée . On dira ici que c’est un choix assumé.

Titrages

La vidéo utilise dans son titre et dans les synthés des rubriques une police très médiévale. Cela correspond très bien au thème mais cette police est difficilement lisible rapidement, et chercher à lire fait vite décrocher l’écoute de ce qui est dit. Un synthé doit être très lisible pour être lu.
Le carton à 0:31 montre le logo de la chaine et sert de générique. Cette police médiévale est très grosse, et est difficile à lire en plein écran. Le générique dure 6 secondes environ, la petite animation nous pousse à oublier de faire l’effort de lire le titre « Chronique de Prof ». Le titre de la vidéo qui apparait à la fin, lui est déjà mieux lisible, en plus d’être court.

Son

Le son de la vidéo repose principalement sur la prise de son du micro d’ambiance des faces caméra, apparemment sans doublage, et de la musique de fosse plus ou moins liée au thème de la chaine Youtube.
La narratrice présente au début de la vidéo la pose d’un micro cravate et nous annonce sa présence, comme il est parfois coutume pour ce type de vidéo (le quatrième mur tombe vite dans les podcasts vidéo lorsque du nouveau matériel de production arrive, et il est souvent présenté par le podcasteur lui même).
Ce nouveau micro cravate sera présent visuellement tout au long de la vidéo, mais absent au son.

Mixage

La vidéo souffre de difficultés à ce niveau.

Le son d’ambiance, qui est la voix de la narratrice, n’est pas assez sec. Quand la musique de fosse arrive, on assiste à un combat entre la voix et la musique (comme à 4:00).

Revoir la prise de son, notamment avec ce fameux micro cravate, peut être mixer au casque ou au moins avec de bonnes enceintes et mieux juger du gain a apporter à la musique. Et soyons fous, appliquer un traitement audio sur la voix (EQ + compresseur).

Statistiques son

L’histogramme RMS nous montre que le niveau moyen tourne autour de -22 dBFS, avec des pointes à -10 dBFS et des creux à -40 dBFS.

Capture d’écran 2016-03-02 à 23.59.39

Une dynamique plutôt étendue, mais encore assez raisonnable qui montre l’absence de traitement de dynamique comme souvent pour ce type de vidéo.

Loudness

L’analyse du LUFS aux normes EBU r128 nous donne ces statistiques :

Integrated loudness:
 I: -19.9 LUFS
 Threshold: -30.2 LUFS
Loudness range:
 LRA: 5.9 LU
 Threshold: -40.2 LUFS
 LRA low: -23.0 LUFS
 LRA high: -17.1 LUFS

Ici, le signal est un peu fort, mais cela importe peut sur Youtube.
Cependant, un meilleur mixage d’une meilleure prise de son ne peut qu’aider à l’homogénéité de l’ensemble de la vidéo.

Voici la vidéo de l’analyse complète du Loudness (via ffmpeg) :

Et la forme d’onde associée :

Capture d’écran 2016-03-03 à 00.35.35

Phase

L’ensemble de la vidéo est en phase, et la quasi totalité des musiques sont en mono, c’est dommage. Peut être un problème de Pan sur les pistes des musiques ?

Spectre audio

Configuration en Hamming, 8192, 119 dB de plage sur Adobe Audition.

Capture d’écran 2016-03-03 à 00.35.24

La résonance de la pièce se voit sur les passages où la voix est seule, et cela fait un spectre plutôt chargé.
On peut noter à 0:10 et à 3:40 l’absence de grave (- de 100 Hz) qui reflète l’absence de musique, et à 2:35 le « trou » du silence absolu (pause d’un gag).
Le spectre ne révèle pas de manque ou de bosse dans des plages de fréquences, ni même de résonante particulière. Le max va jusqu’a 15 kHz, ce qui est totalement normal.

Relevé de défauts/remarques sur le métrage

On peut noter :
0:04 Image : Défocus, le camescope fait une correction de point pendant la prise de vue.
Toujours sur ce plan là, la peau des mains est cramée. Ce plan semble être pris devant une fenêtre par beau temps. Baisser le diaph ?
1:19 Image : correction de diaph (auto), pendant la prise de vue. Il baisse un peu quand elle lève la main. Désactiver le diaph (auto) ?
1:27 Montage, raccord de deux plan de même valeur (saute). Insérer un jump cut, un plan de coupe, ou un volet ? Idem à 1:34 Cela arrive souvent. La coupe au son est super sèche presque à chaque fois. Insérer un fondu audio à défaut de pouvoir laisser respirer entre les plans.
1:40 Montage, insérer un contour et/ou une ombre sur le texte pour le décoller légèrement de l’image.
1:51 Montage, retour de la police « médiévale », avec une ombre cette fois si, mais elle reste très dure à lire.
1:59 Montage, apparition d’un décalage image/son constant jusqu’a la fin de la vidéo.
2:03 Son, il est très étouffé (utilisation du micro cravate ?) par rapport au son d’ambiance des plans avant et après.
2:16 Montage, l’image est très pixélisée et sur fond noir. Peut être l’afficher sur un flou en arrière plan et réduire sa taille ?
2:19 Montage, idem pour le fond noir. Même remarque pour d’autres photos.
6:51 Montage, gain brusque du son de la musique. Fade in ?
6:51 Montage, le carton du générique de fin est peut-être un peut froid (Arial blanc sur noir), compte tenu des efforts de fait sur les autres titres ? Peut être déjà changer le fond noir ?

En conclusion

Les points positifs

  • Le programme est constant et cohérent tout au long du métrage.
  • Equilibre couleur correct.
  • Pas de freeze, ni de surexposition, ni de sous exposition flagrante.
  • Pas de silence, pas de sous modulation, ni de saturation. Dynamique audio correcte.
  • L’intelligibilité générale est correcte.
  • Trim correct
  • Pas de défaut majeur de montage.
  • Pas d’artefact de compression ou de traitement d’image gênant en tout cas pas plus que ce que l’on peut trouver sur Youtube.

Les pistes pour améliorer le résultat

  • Revoir le cadre : tester différentes configurations, débrailler les automatismes de la caméra (autofocus, diaph auto), se faire aider pour le cadre
  • Revoir l’exposition et la photo. Essayer la aussi différentes configurations de lumières.
  • Intégrer le son du micro cravate.
  • Revoir le montage son et surtout le mixage. Prendre plus de temps à maitriser les fades et les courbes de mix, si possible.
  • Essayer de nouvelles présentations pour les cartons, les titres et les synthés.

Pour une non-professionnel, travaillant seule, sans formation particulière, avec du matériel limité et des connaissances limité dans son utilisation, le résultat est très bon, voir peut-être meilleur qu’avec un étudiant utilisant du matériel pro.

La démocratisation de la production de vidéos est vraiment en marche.

J’ dis déjà pas merci dans ma langue, alors je vais pas l’apprendre en picte.

  • Lionnel Astier, Kaamelott, Livre II, L’Enlèvement de Guenièvre, écrit par Lionnel Astier