Excel trouver les doublons et les fusionner sans casser vos données

10 mai 2026

Supprimer les doublons dans Excel prend quelques clics. Fusionner les lignes en double sans perdre les informations complémentaires qu’elles contiennent, c’est une autre affaire. Le bouton « Supprimer les doublons » du menu Données efface des lignes entières, y compris les cellules remplies qui n’existent pas ailleurs dans le fichier. Cet article compare les méthodes disponibles pour trouver les doublons dans Excel, puis les consolider proprement.

Configurations régionales : le piège invisible avant toute détection de doublons Excel

Deux lignes apparemment identiques peuvent être traitées différemment par l’outil de suppression selon la version d’Excel ou la configuration régionale du poste. Un séparateur décimal en virgule sur un PC français et un point sur un PC anglais suffisent à faire échouer la détection.

A voir aussi : Access vs Excel : Quand et pourquoi choisir Microsoft Access

Le format de date pose le même problème. Une date saisie en « JJ/MM/AAAA » et une autre en « MM/JJ/AAAA » ne seront pas reconnues comme doublons, même si elles désignent le même jour. Avant toute recherche, uniformiser les formats de cellules sur l’ensemble de la colonne clé évite des fusions incomplètes.

Les espaces invisibles (espace insécable, retour chariot en fin de cellule) constituent un troisième cas fréquent. La fonction SUPPRESPACE appliquée à la colonne clé élimine ces caractères parasites. Sans ce nettoyage préalable, aucune méthode de détection ne produit un résultat fiable.

A lire aussi : KPIS dans Excel : comprendre et les utiliser efficacement

Comparatif des méthodes pour fusionner les doublons dans Excel

Homme en télétravail comparant des doublons Excel sur laptop et document imprimé

Le choix de la méthode dépend du volume de données, du niveau de conflit entre les lignes et de la version d’Excel disponible. Le tableau ci-dessous synthétise les approches documentées.

Méthode Détection Fusion automatique Gestion des conflits Limite principale
Bouton « Supprimer les doublons » Oui Non Aucune Supprime la ligne entière sans conserver les données complémentaires
Mise en forme conditionnelle Oui (colorisation) Non Aucune Repérage visuel uniquement, traitement manuel ensuite
Formule NB.SI / RECHERCHEV Oui Partielle (RECHERCHEV) Aucune Ne récupère qu’une seule valeur par clé
Power Query (Excel 2016+) Oui Oui (regroupement) Règles paramétrables Courbe d’apprentissage, pas disponible sur toutes les versions
VBA (macro personnalisée) Oui Oui Personnalisable Maintenance du code, risque d’erreur sur fichiers volumineux

La colonne « Gestion des conflits » est le critère déterminant. Quand deux lignes partagent la même clé mais affichent des valeurs différentes dans une colonne (deux numéros de téléphone distincts pour le même contact, par exemple), seules les approches Power Query et VBA permettent de définir une règle de priorité.

Pourquoi le bouton natif ne suffit pas pour une vraie fusion

Le bouton « Supprimer les doublons » conserve la première occurrence et supprime les suivantes. Si la deuxième ligne contenait un email absent de la première, cette information disparaît. La suppression native ne fusionne rien, elle efface.

Ce comportement convient aux cas simples : un export où chaque ligne est strictement identique. Dès que les doublons sont partiels (même nom, adresses différentes), il faut passer à une autre méthode.

Power Query : regrouper et fusionner les doublons sans formule

Power Query, accessible depuis l’onglet Données dans Excel 2016 et versions ultérieures, permet de regrouper les lignes par une colonne clé, puis d’appliquer une opération sur chaque groupe. La fonction « Grouper par » offre plusieurs options d’agrégation.

  • Sélectionnez la plage de données, puis cliquez sur « À partir d’un tableau » dans l’onglet Données pour ouvrir l’éditeur Power Query
  • Dans l’éditeur, choisissez « Grouper par » sur la colonne clé (nom, identifiant, email), puis définissez l’opération pour chaque colonne restante : première valeur non nulle, concaténation, somme ou maximum selon le type de donnée
  • Pour les colonnes texte, l’opération « Toutes les lignes » crée une sous-table par groupe, que vous pouvez ensuite développer pour inspecter les conflits avant de valider la fusion

Power Query conserve le fichier source intact et travaille sur une copie. Le résultat se charge dans une nouvelle feuille. Ce fonctionnement non destructif élimine le risque de perte accidentelle, à condition de ne pas écraser le fichier d’origine.

Deux collègues collaborant pour fusionner des doublons dans Excel sur poste de travail partagé

Traiter les valeurs conflictuelles manuellement après regroupement

Lorsque deux lignes affichent des valeurs différentes pour la même colonne et la même clé, aucune automatisation ne peut décider laquelle est correcte. Power Query signale ces cas en conservant les deux valeurs dans la sous-table. Les conflits doivent être arbitrés ligne par ligne pour éviter de perdre la bonne information.

Un fichier de contacts avec deux adresses email différentes pour le même nom illustre ce cas. Concaténer les deux adresses dans une seule cellule (séparées par un point-virgule) préserve les données, mais crée un format non standard qu’il faudra retraiter ensuite.

Validation des données Excel : bloquer les doublons à la source

Corriger les doublons après coup prend du temps. Verrouiller la saisie à la source réduit le volume de nettoyage sur les fichiers alimentés régulièrement par plusieurs utilisateurs.

La validation des données d’Excel permet de créer une règle personnalisée sur une colonne. En utilisant la formule NB.SI dans le critère de validation, chaque nouvelle saisie est comparée aux valeurs existantes. Si la valeur est déjà présente, Excel affiche un message d’erreur et refuse l’entrée.

  • Sélectionnez la colonne cible, puis ouvrez Données, Validation des données
  • Choisissez « Personnalisé » et entrez la formule =NB.SI(A:A,A2)=1 (adaptez la référence à votre colonne)
  • Personnalisez le message d’erreur pour indiquer clairement à l’utilisateur que la valeur existe déjà dans le fichier

Cette approche ne remplace pas le nettoyage des doublons existants. Elle empêche l’apparition de nouveaux doublons dans un tableau déjà assaini. Combinée à un passage initial via Power Query, elle constitue un workflow complet : corriger une fois, puis protéger le fichier pour la suite.

La gestion des doublons dans Excel repose sur deux temps distincts. La détection est simple, les outils natifs (mise en forme conditionnelle, NB.SI, bouton Supprimer les doublons) la couvrent correctement. La fusion sans perte de données exige Power Query ou une macro VBA, parce qu’elle implique de comparer, arbitrer et consolider des informations réparties sur plusieurs lignes. Nettoyer le formatage et les caractères invisibles avant toute opération reste la précaution la plus rentable en temps.

Haipallzizopnoz face aux autres projets quantiques : ce qui le distingue

Haipallzizopnoz est un terme sans définition référencée dans les dictionnaires, les bases de données scientifiques ou

Certificate of Networthiness : retours d’expérience terrain de responsables SSI

Un audit ne sauvera jamais une entreprise d'un piratage. Pourtant, des milliers de responsables SSI s'y

Comment personnaliser le bouton Actualiser Google Chrome pour gagner du temps ?

Oubliez la symbolique du bouton Actualiser, ce petit cercle fléché qui semble n'attendre que votre clic