Datation de documents d’archives audiovisuelles par intelligence artificielle

Avec mon école, j'ai participé à un projet d'intelligence artificielle pour la Cinémathèque de Bretagne. Il consiste à predire le plus fidèlement possible la date d'une vidéo d'archive à l'aide d'intelligence artificielle.

Le projet a été divisé en deux méthodes à tester : l'approche qui consiste à dater une vidéo directement, et la méthode qui tente de détcecter des véhicules dans la vidéo afin d'en déduire le modèle puis la date probable de la vidéo. J'ai choisi la deuxième approche avec deux autres collègues.

Détecter les voitures

Pour ce projet, nous nous sommes intéressé uniquement aux images, nous n'avons pas essayé de faire de la datation des vidéos en tant que tel. La première étape est donc de mettre en place la détection de voitures dans les images des vidéos.

Pour cela, nous avons utilisé la bibliothèque YOLOv8, un modèle de détection d'objets très rapide et précis. Le modèle de taille moyenne (yolov8m.pt) était déjà très performant pour détecter des voitures / camions, nous n'avons donc pas eu besoin de le réentrainer.

Classifier les voitures

La prochaine étape est la classification des voitures par modèle. En effet, si l'on a le modèle de la voiture, on possède la date de début de production, et donc une date minimum pour la création du document d'archive

Afin d'entrainer un modèle de classification d'image, nous avons besoin d'une base de données conséquente avec des images de voitures classées par modèle. Certains sites fournissent une liste de modèles de voitures, avec les photos associées. Nous nous sommes concentré sur les modèles français, car les vidéos à dater sont françaises et datent pour la plupart d'avant les années 2000. Nous avons donc privilégié les marques comme Renault, Peugeot et Citroën, tout en vérifiant d'avoir les modèles les plus anciens.

Afin d'obtenir ces bases de données, nous avons utilisé la bibliothèque python Selenium et effectué du web scrapping sur les sites que nous avons trouvé. Nous avons ainsi pu constituer un base de données d'environ 6000 photos de voitures françaises triées par modèle.

Nous avons alors fine-tuné le modèle ResNet34 sur la base de données que nous avons récolté, en effectuant de la data augmentation pour améliorer notre efficacité. Nous avons obtenu une précision de 80%.