Supprimer les doublons dans Excel prend quelques clics. Fusionner les lignes en double sans perdre les informations complémentaires qu’elles contiennent, c’est une autre affaire. Le bouton « Supprimer les doublons » du menu Données efface des lignes entières, y compris les cellules remplies qui n’existent pas ailleurs dans le fichier. Cet article compare les méthodes disponibles pour trouver les doublons dans Excel, puis les consolider proprement.
Configurations régionales : le piège invisible avant toute détection de doublons Excel
Deux lignes apparemment identiques peuvent être traitées différemment par l’outil de suppression selon la version d’Excel ou la configuration régionale du poste. Un séparateur décimal en virgule sur un PC français et un point sur un PC anglais suffisent à faire échouer la détection.
A voir aussi : Access vs Excel : Quand et pourquoi choisir Microsoft Access
Le format de date pose le même problème. Une date saisie en « JJ/MM/AAAA » et une autre en « MM/JJ/AAAA » ne seront pas reconnues comme doublons, même si elles désignent le même jour. Avant toute recherche, uniformiser les formats de cellules sur l’ensemble de la colonne clé évite des fusions incomplètes.
Les espaces invisibles (espace insécable, retour chariot en fin de cellule) constituent un troisième cas fréquent. La fonction SUPPRESPACE appliquée à la colonne clé élimine ces caractères parasites. Sans ce nettoyage préalable, aucune méthode de détection ne produit un résultat fiable.
A lire aussi : KPIS dans Excel : comprendre et les utiliser efficacement
Comparatif des méthodes pour fusionner les doublons dans Excel

Le choix de la méthode dépend du volume de données, du niveau de conflit entre les lignes et de la version d’Excel disponible. Le tableau ci-dessous synthétise les approches documentées.
| Méthode | Détection | Fusion automatique | Gestion des conflits | Limite principale |
|---|---|---|---|---|
| Bouton « Supprimer les doublons » | Oui | Non | Aucune | Supprime la ligne entière sans conserver les données complémentaires |
| Mise en forme conditionnelle | Oui (colorisation) | Non | Aucune | Repérage visuel uniquement, traitement manuel ensuite |
| Formule NB.SI / RECHERCHEV | Oui | Partielle (RECHERCHEV) | Aucune | Ne récupère qu’une seule valeur par clé |
| Power Query (Excel 2016+) | Oui | Oui (regroupement) | Règles paramétrables | Courbe d’apprentissage, pas disponible sur toutes les versions |
| VBA (macro personnalisée) | Oui | Oui | Personnalisable | Maintenance du code, risque d’erreur sur fichiers volumineux |
La colonne « Gestion des conflits » est le critère déterminant. Quand deux lignes partagent la même clé mais affichent des valeurs différentes dans une colonne (deux numéros de téléphone distincts pour le même contact, par exemple), seules les approches Power Query et VBA permettent de définir une règle de priorité.
Pourquoi le bouton natif ne suffit pas pour une vraie fusion
Le bouton « Supprimer les doublons » conserve la première occurrence et supprime les suivantes. Si la deuxième ligne contenait un email absent de la première, cette information disparaît. La suppression native ne fusionne rien, elle efface.
Ce comportement convient aux cas simples : un export où chaque ligne est strictement identique. Dès que les doublons sont partiels (même nom, adresses différentes), il faut passer à une autre méthode.
Power Query : regrouper et fusionner les doublons sans formule
Power Query, accessible depuis l’onglet Données dans Excel 2016 et versions ultérieures, permet de regrouper les lignes par une colonne clé, puis d’appliquer une opération sur chaque groupe. La fonction « Grouper par » offre plusieurs options d’agrégation.
- Sélectionnez la plage de données, puis cliquez sur « À partir d’un tableau » dans l’onglet Données pour ouvrir l’éditeur Power Query
- Dans l’éditeur, choisissez « Grouper par » sur la colonne clé (nom, identifiant, email), puis définissez l’opération pour chaque colonne restante : première valeur non nulle, concaténation, somme ou maximum selon le type de donnée
- Pour les colonnes texte, l’opération « Toutes les lignes » crée une sous-table par groupe, que vous pouvez ensuite développer pour inspecter les conflits avant de valider la fusion
Power Query conserve le fichier source intact et travaille sur une copie. Le résultat se charge dans une nouvelle feuille. Ce fonctionnement non destructif élimine le risque de perte accidentelle, à condition de ne pas écraser le fichier d’origine.

Traiter les valeurs conflictuelles manuellement après regroupement
Lorsque deux lignes affichent des valeurs différentes pour la même colonne et la même clé, aucune automatisation ne peut décider laquelle est correcte. Power Query signale ces cas en conservant les deux valeurs dans la sous-table. Les conflits doivent être arbitrés ligne par ligne pour éviter de perdre la bonne information.
Un fichier de contacts avec deux adresses email différentes pour le même nom illustre ce cas. Concaténer les deux adresses dans une seule cellule (séparées par un point-virgule) préserve les données, mais crée un format non standard qu’il faudra retraiter ensuite.
Validation des données Excel : bloquer les doublons à la source
Corriger les doublons après coup prend du temps. Verrouiller la saisie à la source réduit le volume de nettoyage sur les fichiers alimentés régulièrement par plusieurs utilisateurs.
La validation des données d’Excel permet de créer une règle personnalisée sur une colonne. En utilisant la formule NB.SI dans le critère de validation, chaque nouvelle saisie est comparée aux valeurs existantes. Si la valeur est déjà présente, Excel affiche un message d’erreur et refuse l’entrée.
- Sélectionnez la colonne cible, puis ouvrez Données, Validation des données
- Choisissez « Personnalisé » et entrez la formule =NB.SI(A:A,A2)=1 (adaptez la référence à votre colonne)
- Personnalisez le message d’erreur pour indiquer clairement à l’utilisateur que la valeur existe déjà dans le fichier
Cette approche ne remplace pas le nettoyage des doublons existants. Elle empêche l’apparition de nouveaux doublons dans un tableau déjà assaini. Combinée à un passage initial via Power Query, elle constitue un workflow complet : corriger une fois, puis protéger le fichier pour la suite.
La gestion des doublons dans Excel repose sur deux temps distincts. La détection est simple, les outils natifs (mise en forme conditionnelle, NB.SI, bouton Supprimer les doublons) la couvrent correctement. La fusion sans perte de données exige Power Query ou une macro VBA, parce qu’elle implique de comparer, arbitrer et consolider des informations réparties sur plusieurs lignes. Nettoyer le formatage et les caractères invisibles avant toute opération reste la précaution la plus rentable en temps.

