Projet de fin d'étude : TransFuse : Fusing Transformers and CNNs for Medical Image Segmentation.

Etudiant : KABBOU MERIEM

Filière : Master Informatique Décisionnelle et Vision Intelligente (MIDVI)

Encadrant : Pr. RAMADAN HIBA

Annèe : 2023

Résumé : La segmentation des images médicales - préalable à de nombreux besoins cliniques - a été considérablement favorisée par les progrès récents des réseaux de neurones convolutifs (CNN). Cependant, il présente des limitations générales sur la modélisation d'une relation explicite à longue portée, et les remèdes existants, en recourant à la construction d'encodeurs profonds avec des opérations de sous-échantillonnage agressives, conduisent à des réseaux approfondis redondants et à la perte de détails localisés. Par conséquent, la tâche de segmentation attend une meilleure solution pour améliorer l'efficacité de la modélisation des contextes globaux tout en maintenant une bonne compréhension des détails de bas niveau. Dans cet article, nous proposons une nouvelle architecture à branches parallèles, TransFuse, pour relever ce défi. TransFuse combine les transformateurs et les CNN dans un style parallèle, où la dépendance globale et les détails spatiaux de bas niveau peuvent être efficacement capturés de manière beaucoup moins profonde. En outre, une nouvelle technique de fusion - le module BiFusion est créée pour fusionner efficacement les fonctionnalités à plusieurs niveaux des deux branches. Des expériences approfondies démontrent que TransFuse obtient les résultats les plus récents sur les ensembles d'images médicales 2D et 3D, y compris la segmentation des polypes, des lésions cutanées, de la hanche et de la prostate, avec une diminution significative des paramètres et une amélioration de la vitesse d'inférence.