Le moyen le plus simple de supprimer les données en double dans Excel

--

Share post:

La duplication de vos données peut entraîner des erreurs de calcul, de statistiques ou de visualisation des données. La suppression des doublons est la première étape pour garantir l'intégrité de vos données.

est l'une des applications de tableur les plus populaires et les plus polyvalentes au monde. Excel peut être utilisé à diverses fins, de l'analyse de données et de la génération de rapports à la gestion de l'information. Cependant, un problème souvent rencontré par les utilisateurs d'Excel est la duplication de leurs données.

Un doublon est une donnée identique ou similaire qui apparaît plusieurs fois dans une ou plusieurs ou lignes. Les doublons peuvent entraîner des erreurs de calcul, des incohérences de données ou une diminution des performances d'Excel.

Pour éviter ces problèmes, vous devez savoir comment supprimer les doublons dans Excel facilement et rapidement. Il existe plusieurs façons de supprimer les doublons dans Excel, en fonction de vos besoins et de vos préférences. Dans cet article, nous discuterons de trois façons principales de supprimer les doublons dans Excel, à savoir :

remove duplicate
remove duplicate
  • Utiliser les fonctionnalités “Remove Duplicates” disponibles dans Excel
  • Use “COUNTIF” or “COUNTIFS” formulas to mark duplicates
  • Use “Pivot Table” to filter out duplicates

Examinons chacun d'entre eux plus en détail.

Utilisation de la fonction Supprimer les doublons

Le moyen le plus simple et le plus rapide de supprimer les doublons dans Excel est d'utiliser la fonctionnalité “Remove Duplicates” disponible dans Excel. Cette fonctionnalité vous permet de sélectionner les colonnes ou les lignes que vous souhaitez supprimer des doublons, puis de supprimer toutes les données identiques ou similaires dans ces colonnes ou lignes. Voici les étapes à suivre pour utiliser la fonctionnalité “Remove Duplicates” :

  1. Sélectionnez toutes les données que vous souhaitez dédupliquer. Vous pouvez utiliser le raccourci “Ctrl + A” pour sélectionner toutes les données d'une feuille de calcul, ou cliquer et faire glisser la souris pour sélectionner une plage de données spécifique.
  2. Cliquez sur l' onglet “Data” du ruban, puis cliquez sur le bouton “Remove Duplicates” dans le groupe “Data Tools”.
  3. Dans la boîte de dialogue “Remove Duplicates”, sélectionnez la colonne ou la ligne que vous souhaitez supprimer des doublons. Vous pouvez sélectionner plusieurs colonnes ou lignes en appuyant sur la touche “Ctrl” lorsque vous cliquez sur le nom de la colonne ou de la ligne. Si vous souhaitez supprimer les doublons en fonction de toutes les colonnes ou lignes, cochez la case “Select All”.
  4. Cliquez sur le bouton “OK” pour supprimer les doublons. Excel affichera un message vous indiquant combien de doublons ont été supprimés et combien de données uniques il reste.
  5. Cliquez à nouveau sur le bouton “OK” pour fermer la boîte de dialogue.

Par exemple, supposons que vous disposiez des données suivantes :

NomÂgeVille
Budi25Jakarta
Andi30Surabaya
Budi25Jakarta
Cici28Bandung
Dedi32Semarang
Andi30Surabaya

Si vous souhaitez supprimer les doublons en fonction de la colonne Nom, procédez comme suit :

  1. Sélectionnez toutes les données, puis cliquez sur le bouton “Remove Duplicates” dans l' onglet “Data”.
  2. In the “Remove Duplicates” dialog box, check the Name column, then click the “OK” button.
  3. Excel affichera une boîte de dialogue indiquant qu'il y a 2 doublons supprimés et 4 données uniques restantes.
  4. Click the “OK” button to close the dialog box.

Notez qu'Excel supprime uniquement les lignes qui ont la même valeur dans la colonne Nom, quelle que soit la valeur dans les autres colonnes. Si vous souhaitez supprimer les doublons basés sur plusieurs colonnes, par exemple, les colonnes Nom et Âge, vous pouvez cocher les deux colonnes dans la boîte de dialogue “Remove Duplicates”.

Cette fonctionnalité est “Remove Duplicates” très utile si vous souhaitez supprimer définitivement les doublons de vos données. Cependant, il y a quelques points auxquels vous devez faire attention lorsque vous utilisez cette fonctionnalité, à savoir :

  • Cette fonctionnalité supprimera les doublons directement de vos données d'origine, sans avoir à faire de copies ou de sauvegardes au préalable. Par conséquent, nous vous recommandons de faire une de vos données avant d'utiliser cette fonctionnalité, ou d'utiliser la fonction “Undo (Ctrl + Z)” si vous souhaitez annuler la suppression des doublons.
  • Cette fonctionnalité ne peut supprimer que les doublons identiques, à l'exclusion des doublons qui présentent des différences dans les lettres majuscules ou minuscules, les espaces ou la ponctuation. Par exemple, “Budi” et “budi” ne seront pas considérés comme des doublons par cette fonctionnalité. Si vous souhaitez supprimer les doublons qui présentent ces différences, vous devez effectuer quelques étapes supplémentaires, telles que l'utilisation de “UPPER”, “LOWER” ou “TRIM” pour égaliser le de vos données avant d'utiliser “Remove Duplicates” fonctionnalité.
  • Cette fonctionnalité ne peut supprimer les doublons que dans une feuille de calcul, à l'exclusion des doublons existants dans d'autres feuilles de calcul du même classeur ou de classeurs différents. Si vous souhaitez supprimer les doublons existants dans d'autres feuilles de calcul, vous devez d'abord copier ou déplacer ces données vers la même feuille de calcul ou utiliser d'autres méthodes dont nous parlerons ci-dessous.

Utilisation de la formule COUNTIF ou COUNTIFS

La deuxième façon de supprimer les doublons dans Excel consiste à utiliser la formule “COUNTIF” ou “COUNTIFS”. Cette formule peut être utilisée pour compter le nombre de fois qu'une valeur apparaît dans une ou plusieurs colonnes ou lignes. À l'aide de cette formule, vous pouvez marquer les doublons en fournissant des valeurs spécifiques, telles que 1 pour les données uniques et 0 pour les données dupliquées. Ensuite, vous pouvez filtrer ou supprimer les données marquées comme doublons en fonction de vos besoins. Voici les étapes à suivre pour utiliser la formule “COUNTIF” ou “COUNTIFS” :

  1. Sélectionnez toutes les données que vous souhaitez dédupliquer. Vous pouvez utiliser le raccourci “Ctrl + A” pour sélectionner toutes les données d'une feuille de calcul, ou cliquer et faire glisser la souris pour sélectionner une plage de données spécifique.
  2. Sélectionnez une cellule vide à droite ou en bas de vos données, selon que vous souhaitez marquer les doublons en fonction des colonnes ou des lignes.
  3. Tapez la formule “COUNTIF” ou “COUNTIFS” selon les critères souhaités. “COUNTIF” formules sont utilisées pour marquer les doublons en fonction d'une seule colonne ou ligne uniquement, tandis que les formules “COUNTIFS” sont utilisées pour marquer les doublons en fonction de plusieurs colonnes ou lignes. Le format général de cette formule est le suivant :

=COUNTIF(plage,critère)

=COUNTIFS(criteria_range1,criteria1,criteria_range2,criteria2,…)

Où:

  1. range est la plage de cellules que vous souhaitez compter le nombre de fois qu'une valeur y apparaît.
  2. criteria est la valeur que vous souhaitez rechercher dans cette plage de cellules. Vous pouvez utiliser des valeurs directes, des références de cellule ou des expressions logiques pour définir des critères. Par exemple, “Budi”, A2 ou “>25”.
  3. criteria_range1, criteria_range2,… correspond à la plage de cellules que vous souhaitez utiliser comme critère pour marquer les doublons. Vous pouvez utiliser plusieurs plages de cellules en les séparant par des virgules.
  4. Critères1, Critères2,… est la valeur que vous souhaitez rechercher dans cette plage de cellules de critères. Vous pouvez utiliser des valeurs directes, des références de cellule ou des expressions logiques pour définir des critères.
  1. Appuyez sur le bouton “Enter” pour afficher le résultat de la formule. Si le résultat est supérieur à 1, il y a des doublons dans vos données. Si le résultat est 1, l'enregistrement est unique. Si le résultat est 0, les données n'existent pas dans la plage de cellules que vous avez spécifiée.
  2. Répétez les étapes 3 et 4 pour tous les enregistrements que vous souhaitez marquer comme doublons. Vous pouvez utiliser la fonction “Fill (Ctrl + R)” ou “(Ctrl + D” ) pour remplir automatiquement des formules dans d'autres cellules.
  3. Une fois que toutes les données sont marquées avec des formules, vous pouvez filtrer ou supprimer les données dont la valeur est 0 ou supérieure à 1 en fonction de vos besoins. Vous pouvez utiliser la fonction “Filter” de l'onglet “Data” pour filtrer les données en fonction d'une valeur spécifique ou utiliser la fonction “Sort” de l'onglet “Home” pour trier les données en fonction d'une valeur spécifique. Ensuite, vous pouvez supprimer les données indésirables en appuyant sur le bouton “Delete”.

Par exemple, supposons que vous disposiez des données comme dans le tableau précédent.

Si vous souhaitez marquer les doublons en fonction de la colonne Nom, procédez comme suit :

  1. Sélectionnez l'intégralité des données, puis sélectionnez la cellule vide à droite de vos données.
  2. Tapez la formule =COUNTIF($A$2 :$A$7,A2) dans la cellule vide. Cette formule compte le nombre de fois que la valeur de la cellule A2 apparaît dans la plage A2 :A7. Si la valeur apparaît plus d'une fois, il s'agit d'un doublon. Si la valeur n'apparaît qu'une seule fois, il s'agit de données uniques.
  3. Appuyez sur le bouton “Enter” pour afficher le résultat de la formule. Ici, le résultat est 2, car il y a deux “Budi” dans la colonne Nom.
  4. Répétez les étapes 2 et 3 pour tous les enregistrements que vous souhaitez marquer comme doublons. Vous pouvez utiliser la fonction “Fill” pour remplir automatiquement des formules dans d'autres cellules.
  5. Après tout, les données sont marquées par des formules, vous pouvez filtrer ou supprimer les données qui ont des valeurs supérieures à 1 en fonction de vos besoins. Par exemple, si vous souhaitez filtrer des données uniques, vous pouvez utiliser la fonction “Filter” pour sélectionner 1 seule valeur dans le de formule.

Par conséquent, vos données ressembleront à ceci :

NomÂgeVilleFormule
Budi25Jakarta2
Andi30Surabaya2
Budi25Jakarta2
Cici28Bandung1
Dedi32Semarang1
Andi30Surabaya2

Utiliser des tableaux croisés dynamiques

La troisième façon de supprimer les doublons dans Excel est d'utiliser “Pivot Table”. Le tableau croisé dynamique est une fonctionnalité qui peut être utilisée pour résumer, analyser et présenter des données sous forme de tableaux dynamiques. En utilisant les tableaux croisés dynamiques, vous pouvez facilement filtrer les données en fonction de critères spécifiques, y compris la suppression des doublons. Voici les étapes à suivre pour utiliser un tableau croisé dynamique :

  1. Sélectionnez toutes les données que vous souhaitez dédupliquer. Vous pouvez utiliser le raccourci “Ctrl + A” pour sélectionner toutes les données d'une feuille de calcul, ou cliquer et faire glisser la souris pour sélectionner une plage de données spécifique.
  2. Click the “Insert” tab on the ribbon, then click the “PivotTable” button in the “Tables” group.
  3. Dans la boîte de dialogue “Create PivotTable”, sélectionnez l'emplacement où vous souhaitez placer le tableau croisé dynamique. Vous pouvez sélectionner un emplacement dans la même feuille de calcul, une nouvelle feuille de calcul ou un nouveau classeur.
  4. Click the “OK” button to create a Pivot Table.
  5. Dans le volet “PivotTable Fields”, sélectionnez la colonne ou la ligne que vous souhaitez utiliser comme critère pour supprimer les doublons. Vous pouvez sélectionner plusieurs colonnes ou lignes en appuyant sur la touche “Ctrl” lorsque vous cliquez sur le nom de la colonne ou de la ligne. Ensuite, faites glisser le nom de la colonne ou de la ligne vers la zone “Rows” ou “Columns” du volet “PivotTable Fields”.
  6. Dans le volet “PivotTable Fields”, sélectionnez la colonne ou l'autre ligne que vous souhaitez afficher dans le tableau croisé dynamique. Ensuite, faites glisser le nom de la colonne ou de la ligne vers la zone “Values” du volet “PivotTable Fields”.
  7. Dans le volet “PivotTable Fields”, sélectionnez les autres colonnes ou lignes que vous souhaitez filtrer pour filtrer les données en fonction de valeurs spécifiques. Ensuite, faites glisser le nom de la colonne ou de la ligne vers la zone “Filters” du volet “PivotTable Fields”.
  1. Dans le tableau croisé dynamique créé, vous pouvez afficher les données filtrées en fonction des critères que vous avez sélectionnés. Les données qui ont des valeurs identiques ou similaires dans une colonne ou une ligne de critères sont fusionnées en une seule ligne ou colonne uniquement, de sorte qu'il n'y a pas de doublons dans les données.
  2. Si vous souhaitez les critères ou les filtres utilisés pour filtrer les données, vous pouvez cliquer sur le petit bouton fléché en regard du nom de la colonne ou de la ligne dans le tableau croisé dynamique, puis choisir l'option souhaitée dans le menu qui s'affiche.
  3. If you want to delete the Pivot Table and return to your original data, you can click the “Analyze” tab on the ribbon, then click the “Clear” button on the “Actions” group, and choose the “Clear All” option.

Par exemple, supposons que vous disposiez des données comme dans le tableau précédent :

Si vous souhaitez supprimer les doublons en fonction des colonnes Nom et Âge, procédez comme suit :

  1. Select all the data, and then click the “PivotTable” button on the “Insert” tab.
  2. Dans la boîte de dialogue “Create PivotTable”, sélectionnez l'emplacement où vous souhaitez placer le tableau croisé dynamique. Par exemple, sélectionnez une nouvelle feuille de calcul.
  3. Click the “OK” button to create a Pivot Table.
  4. In the “PivotTable Fields” pane, select the Name and Age columns, and then drag the column names to the “Rows” area of the “PivotTable Fields” pane.
  5. Dans le volet “PivotTable Fields”, sélectionnez la colonne Ville, puis faites glisser le nom de la colonne vers la zone “Values” du volet “PivotTable Fields”.
  6. Dans le tableau croisé dynamique créé, vous pouvez voir les données filtrées par colonnes Nom et Âge. Les données qui ont des valeurs identiques ou similaires dans cette colonne sont combinées en une seule ligne, de sorte qu'il n'y a pas de doublons dans les données.

Autres façons de supprimer les doublons dans Excel

En plus des trois méthodes dont nous avons discuté ci-dessus, il existe plusieurs autres moyens que vous pouvez utiliser pour supprimer les doublons dans Excel, à savoir :

  • Utilisez “Conditional Formatting” pour mettre en surbrillance les doublons d'une couleur spécifique, puis filtrez ou supprimez les données en surbrillance.
  • Utilisez “Advanced Filter” pour filtrer les données uniques, puis copiez ou déplacez ces données vers un autre emplacement.
  • Utilisez “VBA” (Visual Basic pour Applications) pour créer une macro capable de supprimer automatiquement les doublons à l'aide d'un code spécifique.

Ces méthodes peuvent nécessiter des étapes supplémentaires ou des connaissances particulières pour ce faire, mais peuvent fournir des résultats plus flexibles ou répondre à vos besoins. Vous pouvez trouver plus d'informations sur ces méthodes sur Internet ou dans les guides Excel.

D'où l'article que nous avons fait sur la façon de supprimer les doublons dans Excel. Nous espérons que cet article vous a aidé à mieux gérer vos données. Merci d'avoir lu cet article.

ARTICLES CONNEXES

Comment créer un texte attrayant avec une décoration de texte dans MS Word

Voulez-vous créer un texte qui attire l'attention du lecteur en utilisant divers effets tels que des soulignements, des...

Comment calculer le décalage journalier entre deux dates dans Excel

Avez-vous déjà voulu savoir combien de jours il vous reste avant vos vacances ? Ou combien de jours...

Comment comparer facilement et rapidement deux documents dans Microsoft Word

Avez-vous déjà voulu comparer deux documents dans Microsoft Word pour voir les différences ou les similitudes entre eux...

Comment effectuer un zoom avant ou arrière sur des documents Microsoft Word facilement et rapidement

Avez-vous déjà eu du mal à lire ou à modifier un document Microsoft Word parce que la taille...