Excel er en allsidig applikasjon som har vokst langt utover sine tidlige versjoner som bare en regnearkløsning. Ansatt som rekord keeper, adressebok, prognose verktøy, og mye mer, mange bruker selv Excel på måter det aldri var ment for.
Hvis du bruker Excel mye hjemme eller på kontoret, vet du at noen ganger kan Excel-filene raskt bli uhåndterlige på grunn av det store antallet poster du jobber med.
Heldigvis har Excel innebygde funksjoner som hjelper deg med å finne og fjerne dupliserte poster. Dessverre er det noen advarsler å bruke disse funksjonene, så vær forsiktig, eller du kan ubevisst slette poster du ikke har tenkt å fjerne. Også begge metodene nedenfor fjerner umiddelbart duplikater uten at du får se hva som ble fjernet.
Jeg nevner også en måte å markere radene som er duplikat først, slik at du kan se hvilke som vil bli fjernet av funksjonene før du kjører dem. Du må bruke en egendefinert betingelsesformateringregel for å markere en rad som er helt duplisert.
Fjern duplikatfunksjonen
Anta at du bruker Excel for å holde oversikt over adresser, og du mistenker at du har dupliserte poster. Se på Excel-regnearket nedenfor:
Legg merke til at "Jones" -oppføringen vises to ganger. Hvis du vil fjerne slike dupliserte poster, klikker du på fanen Data på båndet og finner funksjonen Fjern duplikater under Dataverktøy- delen. Klikk på Fjern duplikater og et nytt vindu åpnes.
Her må du ta en avgjørelse basert på om du bruker overskriften etiketter øverst i kolonnene dine. Hvis du gjør det, velg alternativet merket Mine data har overskrifter . Hvis du ikke bruker overskriftsetiketter, bruker du Excels standard kolonnebetegnelser, for eksempel kolonne A, kolonne B osv.
For dette eksempelet velger vi bare kolonne A og klikker OK- knappen. Alternativvinduet lukkes og Excel fjerner den andre "Jones" -rekordet.
Selvfølgelig var dette bare et enkelt eksempel. Eventuell adresseoppføringer du fortsetter å bruke Excel, er sannsynligvis mye mer komplisert. Anta at du for eksempel har en adressefil som ser slik ut.
Legg merke til at selv om det er tre "Jones" -poster, er bare to identiske. Hvis vi brukte prosedyrene ovenfor for å fjerne dupliserte poster, vil bare én "Jones" -oppføring forbli. I dette tilfellet må vi utvide våre beslutningskriterier for å inkludere både for- og etternavn som finnes i kolonne A og B.
For å gjøre dette, klikk igjen på fanen Data på båndet og klikk deretter på Fjern duplikater . Denne gangen, når opsjonsvinduet dukker opp, velger du kolonner A og B. Klikk på OK- knappen og legg merke til at denne gangen Excel bare fjernet en av "Mary Jones" -postene.
Dette skyldes at vi fortalte Excel for å fjerne duplikater ved å sammenligne poster basert på kolonnene A og B i stedet for bare kolonne A. Jo flere kolonner du velger, desto flere kriterier må oppfylles før Excel vil vurdere en plate som en duplikat. Velg alle kolonnene hvis du vil fjerne rader som er helt dupliserte.
Excel vil gi deg en melding som forteller deg hvor mange duplikater ble fjernet. Det vil imidlertid ikke vise deg hvilke rader som ble slettet! Rull ned til siste avsnitt for å se hvordan du merker de dupliserte radene først før du kjører denne funksjonen.
Avansert filtermetode
Den andre måten å fjerne duplikater er å bruke det avanserte filteralternativet. Velg først alle dataene i arket. Deretter klikker du på Avansert i Sorter og filter- delen på fanen Data i båndet.
I dialogboksen som dukker opp, må du merke av i boksen Kun unike poster .
Du kan enten filtrere listen i stedet eller du kan kopiere de ikke-dupliserte elementene til en annen del av det samme regnearket. For en eller annen merkelig grunn kan du ikke kopiere dataene til et annet ark. Hvis du vil ha det på et annet ark, må du først velge et sted på det aktuelle arket og deretter kutte og lime inn dataene i et nytt ark.
Med denne metoden får du ikke engang en melding om hvor mange rader som ble fjernet. Rynene er fjernet, og det er det.
Fremhev dupliserte linjer i Excel
Hvis du vil se hvilke poster som er dupliserte før du fjerner dem, må du gjøre litt manuelt arbeid. Dessverre har Excel ikke mulighet til å markere rader som er helt dupliserte. Den har en funksjon under betinget formatering som fremhever dupliserte celler, men denne artikkelen handler om dupliserte rader.
Det første du må gjøre er å legge til en formel i en kolonne til høyre for datasettet. Formelen er enkel: bare sammenkoble alle kolonnene for den raden sammen.
= A1 & B1 & C1 & D1 & E1
I mitt eksempel nedenfor har jeg data i kolonne A til F. Men den første kolonnen er et ID-nummer, så jeg ekskluderer det fra min formel nedenfor. Pass på å inkludere alle kolonnene som har data du vil sjekke om duplikater på.
Jeg satte denne formelen i kolonne H og trakk den ned for alle mine rader. Denne formelen kombinerer bare alle dataene i hver kolonne som ett stort stykke tekst. Nå, hopp over et par flere kolonner og skriv inn følgende formel:
= COUNTIF ($ H $ 1: $ H $ 34, $ H1)> 1
Her bruker vi COUNTIF-funksjonen og den første parameteren er datasettet vi ønsker å se på. For meg var dette kolonne H (som har kombinasjonsdataformelen) fra rad 1 til 34. Det er også en god ide å bli kvitt topplinjen før du gjør dette.
Du vil også forsikre deg om at du bruker dollartegnet ($) foran brevet og nummeret. Hvis du har 1000 rader med data, og din kombinert radformel er i kolonne F, vil for eksempel din formel se slik ut i stedet:
= COUNTIF ($ F $ 1: $ F $ 1000, $ F1)> 1
Den andre parameteren har bare dollarskiltet foran kolonnebrevet, slik at det er låst, men vi vil ikke låse radnummeret. Igjen, drar du dette ned for alle dine rader med data. Det skal se slik ut og de dupliserte radene skal ha SANT i dem.
La oss nå fremheve radene som har SANT i dem, da de er de dupliserte radene. Først velg hele regnearket av data ved å klikke på den lille trekant øverst til venstre krysset mellom rader og kolonner. Gå nå til fanen Hjem, klikk deretter på Betinget formatering og klikk på Ny regel .
I dialogboksen klikker du på Bruk en formel for å bestemme hvilke celler som skal formateres .
I boksen under Format verdier hvor denne formelen er sant: skriv inn følgende formel, erstatt P med kolonnen din som har SANT eller FALSE verdiene. Sørg for å inkludere dollarskiltet foran kolonnebrevet.
= $ P1 = TRUE
Når du har gjort det, klikker du på Format og klikker på Fyll-fanen. Velg en farge, og den vil bli brukt til å markere hele duplikatraden. Klikk på OK, og du bør nå se de dupliserte radene er uthevet.
Hvis dette ikke fungerte for deg, begynner du og gjør det igjen sakte. Det må gjøres helt riktig for at alt dette skal fungere. Hvis du savner et enkelt $ symbol underveis, fungerer det ikke riktig.
Advarsler med fjerning av duplikater
Det er selvsagt noen problemer med å la Excel automatisk fjerne dupliserte poster for deg. Først må du være forsiktig med å velge for få eller for mange kolonner for Excel å bruke som kriteriene for å identifisere dupliserte poster.
For få, og du kan utilsiktet slette poster du trenger. For mange eller inkludert en identifikasjonskolonne ved et uhell og ingen duplikater blir funnet.
For det andre antar Excel alltid at den første unike posten som kommer over er hovedoppføringen. Eventuelle etterfølgende poster antas å være duplikater. Dette er et problem hvis du for eksempel ikke klarte å endre en adresse til en av personene i filen, men i stedet opprettet en ny post.
Hvis den nye (riktige) adresseposten vises etter den gamle (utdaterte) posten, antar Excel at den første (utdaterte) posten er master og slette eventuelle etterfølgende poster den finner. Dette er grunnen til at du må være forsiktig med hvordan liberalt eller konservativt du lar Excel bestemme hva som er eller ikke er en duplikatoppføring.
For de tilfellene, bør du bruke den fremhevede duplikatemetoden jeg skrev om, og manuelt slette den aktuelle duplikatoppføringen.
Endelig spør Excel ikke deg om å verifisere om du virkelig vil slette en post. Ved hjelp av parametrene du velger (kolonner), er prosessen fullstendig automatisert. Dette kan være en farlig ting når du har et stort antall poster, og du stoler på at de avgjørelsene du gjorde var korrekte og tillater Excel automatisk å fjerne de dupliserte postene for deg.
Sørg også for å sjekke ut vår forrige artikkel om å slette tomme linjer i Excel. Nyt!