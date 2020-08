Cela fait plusieurs mois que j’ai écrit une mise à jour sur mes efforts en cours pour restaurer Deep Space Nine. J’ai pris une pause dans le projet pendant une grande partie du mois de juin en raison d’un déménagement et d’une blessure associée, mais je suis revenu dessus en juillet et je travaille régulièrement depuis lors. La majorité de mon temps a été consacrée à comprendre comment le passage de l’épisode à diverses fréquences d’images alternatives aurait un impact sur la fluidité du mouvement et la qualité de l’image.

Par le passé, j’écrivais des mises à jour lorsque j’atteignais des jalons spécifiques que je me fixais ou découvrais quelque chose que j’avais trouvé intéressant. Il s’agit davantage d’un rapport d’étape. Donc, pour commencer: un petit récapitulatif: je suis un fan de longue date de Deep Space Nine qui a commencé ce projet en janvier et qui le poursuit depuis. J’ai appris le traitement et l’encodage vidéo à partir de zéro en travaillant, et selon toutes les personnes à qui j’ai parlé, je n’ai pas choisi de projet de niveau débutant.

Deep Space Nine est une émission VFR (Variable Frame Rate), ce qui signifie que le DVD alterne entre la lecture à 23,976 fps et 29,97 fps à différents moments de l’épisode. Il s’agit d’un format courant pour la science-fiction de la fin des années 1990. Les émissions encodées de cette manière incluent Babylon 5, Stargate SG-1, Buffy the Vampire Slayer, Star Trek: The Next Generation (DVD uniquement) et Star Trek: Voyager.

L’épisode de Deep Space Nine que j’ai choisi de traiter comme mon véhicule de test, «Sacrifice of Angels», contient environ 14% de séquences à 29,97 ips et environ 86% de séquences à 23,976 ips. Le problème est que les applications comme AviSynth ne peuvent pas éditer la vidéo VFR et doivent la convertir en CFR (Constant Frame Rate). Des applications telles que DaVinci Studio Resolve peuvent techniquement «gérer» les fichiers VFR, en ce sens qu’elles les ingéreront correctement, mais la sortie qui en résulte s’interrompt périodiquement d’une manière pour laquelle je n’ai pas pu trouver de solution propre. Pour l’instant, sauf si je comprends cela, le traitement de l’émission nécessite qu’il soit converti en CFR dans un premier temps.

Si vous encodez une émission VFR à 23,976 CFR, le contenu à 29,97 ips sera coupé à 23,976 ips et la lecture risque de ne pas être parfaitement fluide. Dans certains cas, vous ne verrez pas de bégaiement car il n’y a pas assez de mouvement à l’écran pour que la décimation de l’image soit visible. Il y a un bloc de plusieurs minutes de contenu à 29,97 ips dans « Sacrifice of Angels » lorsque Dukat, Dumar, Weyoun et la femme Changeling parlent tous à Ops. Bien qu’il y ait quelques signes révélateurs, vous ne le voyez vraiment que lorsque Dukat se promène autour de la table – et cela après le post-traitement et la mise à l’échelle.

La raison pour laquelle la main et le corps de Dukat sont flous quand il bouge est que, si vous allez image par image, ce qu’il fait ressemble à ceci:

J’ai un peu augmenté la luminosité ici, pour rendre l’ombre plus facile à voir. La plupart des images semblent normales, mais vous pouvez voir où la main de Dukat va se trouver dans l’image suivante. L’erreur est visible mais petite et limitée à une partie de l’écran.

Le fait que beaucoup de Star Trek de l’ère TNG soient des conversations rend les changements de fréquence d’images beaucoup plus faciles à gérer, mais c’est toujours perceptible quand cela se produit. Mon objectif a été de trouver une méthode automatisée de traitement de DS9 qui produirait généralement un meilleur mouvement pendant les sections de contenu à 29,97 ips. J’ai passé les derniers mois à jouer avec diverses méthodes de conversion de la fréquence d’images de l’émission pour voir à quoi ressembleraient les options.

Sensibilité de la source

La propriété transmutative des mathématiques stipule que lorsque vous multipliez deux nombres ensemble, l’ordre dans lequel vous écrivez les nombres n’a pas d’importance. 1 * 2 * 3 * 4 = 24. Il en va de même pour 4 * 3 * 2 * 1. Le traitement vidéo est pas transmutatif. L’ordre dans lequel vous appliquez les filtres modifie ce que sera la sortie finale. Les flux de travail de traitement vidéo doivent être dupliqués exactement afin de garantir des résultats précis, pouvant aller jusqu’à et potentiellement utiliser exactement les mêmes versions d’application et de filtre.

Il y a plusieurs raisons pour lesquelles j’ai exploré les résultats de Handbrake et MakeMKV par opposition à l’utilisation de DVD Decrypter pour créer une copie VOB des données DVD au format entrelacé 59.94.

Avant tout, je n’ai pas encore trouvé comment obtenir une qualité de sortie vidéo aussi bonne que ce que j’ai réalisé avec HB / MMKV sans créer de scripts pour chaque épisode. En fait, je n’ai pas non plus complètement compris le scénario de l’épisode. C’est ce que j’obtiens en suivant mon dernier cours de programmation vers «Je le veux comme ça».

Deuxièmement, Handbrake offrait des options très simples pour regrouper et tester une vaste gamme de préréglages d’encodage de fichiers. À la mi-juillet, j’ai déchiré «Sacrifice of Angels» plus de 250 fois dans Handbrake afin d’examiner l’impact de divers paramètres de contrôle de qualité, des indicateurs H.264, des fréquences d’images et des options de désentrelacement. Troisièmement, j’ai finalement trouvé comment remettre à StaxRip un ensemble de drapeaux qui synchroniseraient la lecture audio / vidéo d’un fichier VFR MakeMKV, et je voulais l’expérimenter. Enfin, une partie de l’apprentissage de quelque chose consiste à déterminer ce qu’il ne faut pas faire. Je fais beaucoup d’erreurs et j’en fais exprès, juste pour voir comment diverses idées changent le résultat final.

J’ai passé beaucoup de temps au cours des deux derniers mois à jouer avec diverses méthodes de modification des fréquences d’images. AviSynth a un certain nombre de filtres pour changer la fréquence d’images et différents filtres source produisent des sorties subtilement différentes. J’ai expérimenté diverses méthodes d’interpolation jusqu’à 119,88 ips avant de réduire de nouveau – soit à une fréquence d’images de compromis comme 59,97, soit à 23,976. J’ai fait de nombreux tests combinant un passage par Davinci Studio Resolve à un traitement supplémentaire avec AviSynth, ou avant AviSynth, ou après. J’ai expérimenté divers niveaux de qualité H.264 et des préréglages spécifiques pour examiner l’impact que ceux-ci auraient sur les zones de mouvement gênantes de l’émission. Pour être honnête, j’ai élaboré une stratégie pour ce que je voulais encoder et j’ai laissé l’encodage prendre une longueur d’avance sur mes évaluations réelles. J’évalue toujours ce que j’ai créé. Si l’une de ces méthodes avait donné un seul gagnant clair, je l’aurais dit, mais j’ai certainement vu des différences intrigantes entre les données. J’ai même joué avec certaines des méthodes d’interpolation basées sur l’IA pour voir comment elles se comparaient.

À part cela, j’ai expérimenté le désentrelacement basé sur 59,97 fichiers VOB. Même avec l’aide de script d’une partie de la communauté de Doom 9, je n’ai pas trouvé de solution unique, large et facile à oublier qui me donne une qualité d’image aussi claire que celle que j’ai obtenue de MakeMKV et Handbrake. Une partie de la raison pour laquelle j’ai choisi de m’en tenir à ces sources lors de l’évaluation du mouvement est que je savais que j’avais déjà atteint quelque chose d’assez proche de ce que je considérerais comme la qualité finale. Je voulais maintenir cet ensemble de variables constant et expérimenter les méthodes avec lesquelles j’avais déjà travaillé, en particulier lorsque j’avais du mal à obtenir la même qualité d’image. J’espère toujours en trouver un, mais c’est pourquoi j’ai choisi de concentrer mon temps là où je l’ai fait.

Les avantages et les inconvénients de 119.88fps

Une façon de résoudre le problème de lecture à 23,976 ips et 29,97 ips consiste à déplacer le contenu jusqu’à 119,88 ips. Le problème avec 119.88 – enfin, l’un d’entre eux, car il n’y a pas qu’un problème – est que vous avez quintuplé votre charge de travail par définition. S’il faut 15 heures d’horloge murale de temps de traitement mixte CPU et GPU pour mettre à l’échelle un épisode de 23,976 DS9, cela prendra environ 75 heures pour 119,88.

Ce n’est pas génial. Et pour ajouter une insulte à la blessure, vous avez besoin d’un écran 120 Hz pour regarder la sortie sans perdre la moitié des images.

Je suis toujours en train de déconner avec 119,88, car jusqu’à présent, j’ai obtenu les meilleurs résultats globaux dans ces correctifs gênants à cette fréquence d’images, mais il est difficile d’imaginer essayer de faire le spectacle de cette façon. Ampère devrait être plus de 2x plus rapide que la GTX 1080 Ti pour rendre les temps de traitement du GPU presque raisonnables.

Alternativement, on peut essayer une fréquence d’images entre 23,976 et 119,88, et j’ai fait des expériences là aussi. Ces fréquences d’images nécessitent toutes que la partie film ou vidéo du matériau décale la vitesse de lecture d’un multiplicateur non entier, ce qui signifie qu’il y a toujours un certain degré de détection. Ce qui varie, c’est exactement ce qu’est ce quelque chose et à quelle fréquence il apparaît. J’ai également testé les résultats si vous augmentez d’abord la vidéo, puis la traitez. Les résultats finaux sont plutôt bons, mais la pénalité de temps d’horloge pour le traitement des clips 2560 × 1920 par rapport aux clips 720 × 480 est plus grande que l’augmentation de la résolution seule ne le suggère.

Où cela va

Mon plan est d’assembler un ensemble d’options qui font des compromis raisonnables en ce qui concerne la fluidité du mouvement par rapport au temps de traitement par rapport à la fréquence d’images, avec au moins deux et éventuellement trois cibles. J’ai également expérimenté le masquage et l’anticrénelage ces derniers temps, notamment en utilisant une version d’un épisode avec moins de problèmes d’aliasing comme guide d’anticrénelage externe pour une version du même épisode optimisée pour un mouvement plus fluide. Et il fonctionne!

… Ish.

L’une des choses que j’ai apprise, c’est que lors de la recherche de la meilleure ligne qui ajustera en toute sécurité une émission de télévision, vous serez peut-être très chanceux de trouver une seule méthode qui fonctionne pour un épisode. Demander une méthode qui fonctionne globalement bien pour 176 épisodes demande beaucoup.

La plupart du temps, ce que vous obtenez est… ish, et certaines choses sont beaucoup plus «ishier» que d’autres. Le concept de clip externe est intéressant, mais après avoir joué avec pendant un petit moment, j’ai des doutes quant à sa capacité à fonctionner. Il y a des scènes que cela transforme aussi parfaitement que je pourrais le demander – et des scènes qui, euh, ne le sont pas.

Je suppose qu’une question pertinente pour vous serait la suivante: quelle part de ce qui ne fonctionne pas êtes-vous curieux de voir en premier lieu? À ce jour, je n’ai pas beaucoup publié ni parlé des expériences qui ont échoué, et la raison pour laquelle cette histoire ne contient pas plus de vidéo est que je ne sais pas ce que les gens trouveraient intéressant en premier lieu. Il ne semble pas très intéressant de parler de ce qui ne fonctionne pas. Si vous trouvez ce genre de travaux en cours plus intéressant, ou si vous le trouvez plus intéressant si je vous en donne plus à regarder, dites-le.

