Un développeur prétend avoir procédé à une rétro-ingénierie de l’algorithme NeuralHash utilisé dans la détection CSAM d’Apple. Des points de vue contradictoires ont été exprimés sur la question de savoir si cela permettrait de vaincre le système de détection de matériel pédopornographique…

Le développeur Asuhariet Ygvar a publié le code sur GitHub.

Convertir l’image en RVB. Redimensionner l’image à 360 x 360. Normaliser les valeurs RVB à [-1, 1] gamme. Effectuez une inférence sur le modèle NeuralHash. Calculez le produit scalaire d’une matrice 96×128 avec le vecteur résultant de 128 flottants. Appliquez un pas binaire au vecteur flottant 96 résultant. Convertissez le vecteur de 1,0 et 0,0 en bits, ce qui donne des données binaires de 96 bits.

Un commentateur de son fil Reddit a demandé comment il pouvait être sûr que c’était correct, et Ygvar a décrit les preuves.

Tout d’abord, les fichiers modèles ont le préfixe NeuralHashv3b-, qui est le même terme que dans le document d’Apple.

Deuxièmement, dans ce document, Apple a décrit les détails de l’algorithme dans la section Présentation de la technologie -> NeuralHash, ce qui est exactement le même que ce que j’ai découvert. Par exemple, dans le document d’Apple :

« Le descripteur est passé à travers un schéma de hachage pour convertir les N nombres à virgule flottante en M bits. Ici, M est beaucoup plus petit que le nombre de bits nécessaires pour représenter les N nombres à virgule flottante.

Et comme vous pouvez le voir d’ici et d’ici N=128 et M=96.

De plus, le hachage généré par ce script ne change presque pas si vous redimensionnez ou compressez l’image, ce qui est à nouveau le même que celui décrit dans le document d’Apple.