Hi,
ich habe die Woche ein Programm geschrieben, das in einer XLSX Datei (38.000 Zeilen) nach Dubletten gesucht und in einer eigenen Spalte diese markiert hat.
Bedingung:
Sortiert nach Geburtsdatum, Name und Sachkonto ... wobei nicht alle Einträge von Sachkonto relevant sind (also ein Teil ausgefiltert werden muss)
War das doch schon etwas kniffelig, ich habe mich gewundert warum Excel das nicht per Funktion anbietet (Dubletten anzeigen) ...
Im nachhinein wäre es schneller und für mich einfacher gewesen die Basis CSV-Dateien in eine DBF einzulesen, aber nun frage ich mich, ob es in SQL dafür einen eleganteren Weg gäbe ?
Geht Dubletten Suche mit SQL einfacher ?
Moderator: Moderatoren
-
- Der Entwickler von "Deep Thought"
- Beiträge: 2829
- Registriert: Fr, 08. Feb 2008 21:29
- Hat sich bedankt: 97 Mal
- Danksagung erhalten: 13 Mal
Re: Geht Dubletten Suche mit SQL einfacher ?
Hallo, Hubert -
das geht z.B. so:
Ich brauche das sehr selten, daher vergesse ich immer wieder, wie es gemacht wird, aber eine einfache Suche
bei Google bringt genügend Tipps, wie man das machen kann.
Das Beispiel stammt von https://stackoverflow.com/questions/259 ... -sql-table
das geht z.B. so:
Code: Alles auswählen
SELECT
name, email, COUNT(*)
FROM
users
GROUP BY
name, email
HAVING
COUNT(*) > 1
Code: Alles auswählen
sql find duplicates
Das Beispiel stammt von https://stackoverflow.com/questions/259 ... -sql-table
Liebe Grüsse aus der Eifel,
Georg S. Lorrig
Redakteur der Wiki des Deutschprachigen Xbase-Entwickler e.V.
Georg S. Lorrig
Redakteur der Wiki des Deutschprachigen Xbase-Entwickler e.V.
- brandelh
- Foren-Moderator
- Beiträge: 15699
- Registriert: Mo, 23. Jan 2006 20:54
- Wohnort: Germersheim
- Hat sich bedankt: 68 Mal
- Danksagung erhalten: 34 Mal
- Kontaktdaten:
Re: Geht Dubletten Suche mit SQL einfacher ?
Hallo Georg,
danke für den Hinweis, im Internet sind tatsächlich viele Beiträge dazu zu finden (hätte ich gleich drauf kommen können) und eine Zählung auf mehr als 1 ... eigentlich offensichtlich
danke für den Hinweis, im Internet sind tatsächlich viele Beiträge dazu zu finden (hätte ich gleich drauf kommen können) und eine Zählung auf mehr als 1 ... eigentlich offensichtlich
Gruß
Hubert
Hubert
- nightcrawler
- 1000 working lines a day
- Beiträge: 653
- Registriert: Di, 24. Apr 2012 16:33
- Wohnort: 72184 Weitingen
- Hat sich bedankt: 3 Mal
- Danksagung erhalten: 96 Mal
- Kontaktdaten:
Re: Geht Dubletten Suche mit SQL einfacher ?
Hallo Hubert,
bei Dubletten ist oft die Ähnlichkeit wichtiger als die exakte Gleichheit. Hier wird in SQL gerne die Funktion SoundEx verwendet, welche aber für Englisch optimiert ist. Für Deutschland besser ist die Kölner Phonetik, welche ich auch mal für ADS umgesetzt habe: https://www.jd-engineering.de/german-so ... mentation/
bei Dubletten ist oft die Ähnlichkeit wichtiger als die exakte Gleichheit. Hier wird in SQL gerne die Funktion SoundEx verwendet, welche aber für Englisch optimiert ist. Für Deutschland besser ist die Kölner Phonetik, welche ich auch mal für ADS umgesetzt habe: https://www.jd-engineering.de/german-so ... mentation/