Type de document : article scientifique publié dans Scientific Reports
Auteurs : Phelipon, R., Lansade, L. & Razzaq, M.
Résumé en français (traduction) : Utiliser des modèles d’apprentissage profond pour décoder les états émotionnels des chevaux
Dans cette étude, nous explorons les modèles d’apprentissage automatique pour prédire les états émotionnels des chevaux montés. Nous étiquetons manuellement les images pour entraîner les modèles de manière supervisée. Nous explorons les données et utilisons différentes méthodes de recadrage, principalement basées sur Yolo et Faster R-CNN, pour créer deux nouveaux ensembles de données : 1) le corps recadré et 2) la tête recadrée. Nous entraînons divers modèles de réseaux neuronaux convolutionnels (CNN) sur les deux ensembles de données, recadrés et non recadrés, et nous comparons leurs performances en matière de prédiction des émotions des chevaux montés. Malgré l’absence de régions importantes comme la queue (communément annotée par les experts), l’ensemble de données de la tête coupée donne les meilleurs résultats avec une exactitude de 87%, une précision de 79% et un rappel de 97%. En outre, nous mettons à jour nos modèles à l’aide de diverses techniques, telles que l’apprentissage par transfert et le réglage fin, afin d’améliorer encore leurs performances. Enfin, nous utilisons trois méthodes d’interprétation pour analyser le fonctionnement interne de nos modèles, et nous constatons que LIME identifie efficacement des caractéristiques similaires à celles utilisées par les experts pour l’annotation.
Résumé en anglais (original) : In this study, we explore machine learning models for predicting emotional states in ridden horses. We manually label the images to train the models in a supervised manner. We perform data exploration and use different cropping methods, mainly based on Yolo and Faster R-CNN, to create two new datasets: 1) the cropped body, and 2) the cropped head dataset. We train various convolutional neural network (CNN) models on both cropped and uncropped datasets and compare their performance in emotion prediction of ridden horses. Despite the cropped head dataset lacking important regions like the tail (commonly annotated by experts), it yields the best results with an accuracy of 87%, precision of 79%, and recall of 97%. Furthermore, we update our models using various techniques, such as transfer learning and fine-tuning, to further improve their performance. Finally, we employ three interpretation methods to analyze the internal workings of our models, finding that LIME effectively identifies features similar to those used by experts for annotation.
Publication ayant donné lieu à un communiqué de presse publié par INRAE : L’IA au service du bien-être des chevaux montés
