In der Welt der Daten ist SQL (Structured Query Language) die universelle Sprache für die Kommunikation mit Datenbanken. Für jeden angehenden Datenanalysten ist die Beherrschung von SQL nicht nur eine Option, sondern eine Grundvoraussetzung. Doch bei Dutzenden von Befehlen und Funktionen – wo fängt man da überhaupt an? Dieser Leitfaden hilft Ihnen, den Überblick zu behalten und konzentriert sich auf die wichtigsten SQL-Befehle, die Sie täglich verwenden werden. Deren Verständnis ist eine der wichtigsten Kompetenzen, die in unserem Leitfaden „Der ultimative Leitfaden für autodidaktische Datenanalysten (2025)“ ausführlich beschrieben werden. Wir behandeln alles von der Datenabfrage bis hin zu komplexen Aggregationen und geben Ihnen so ein praktisches Werkzeug für Ihren Erfolg an die Hand.
Die Grundlage: Kernbefehle zum Datenabruf
Jede SQL-Abfrage beginnt hier. Diese Befehle sind die Bausteine, um die benötigten Daten aus einer Datenbank abzurufen.
SELECT und FROM
Mit der SELECT-Anweisung wählen Sie die anzuzeigenden Spalten aus, und FROM gibt die Tabelle an, in der sich diese Spalten befinden. Um alle Spalten auszuwählen, verwenden Sie ein Sternchen (*).
-
SELECT Spalte1, Spalte2 FROM Tabellenname;- Ruft bestimmte Spalten ab. -
SELECT * FROM Tabellenname;- Ruft alle Spalten der Tabelle ab.
WHERE
Die WHERE-Klausel dient zum Filtern von Datensätzen und zum Extrahieren nur derjenigen, die eine bestimmte Bedingung erfüllen. Sie können Vergleichsoperatoren wie =, >, <, >=, <= und logische Operatoren wie AND, OR und NOT verwenden.
-
SELECT * FROM customers WHERE country = 'USA'; -
SELECT product_name, price FROM products WHERE price > 50 AND category = 'Electronics';
Organisieren Sie Ihre Ausgabe: Sortieren und Begrenzen
Nachdem Sie Ihre Daten abgerufen haben, geht es im nächsten Schritt darum, sie sinnvoll zu organisieren. Rohdaten sind selten hilfreich; strukturierte Ergebnisse sind entscheidend.
ORDER BY
Das Schlüsselwort ORDER BY sortiert die Ergebnisse aufsteigend oder absteigend. Standardmäßig wird aufsteigend sortiert (ASC). Für absteigende Sortierung verwenden Sie das Schlüsselwort DESC.
SELECT customer_name, signup_date FROM customers ORDER BY signup_date DESC;
LIMIT
Bei großen Tabellen ist es oft nicht notwendig, alle Millionen Zeilen auf einmal anzuzeigen. Die LIMIT-Klausel legt die maximale Anzahl der zurückzugebenden Datensätze fest. Dies ist ideal, um Daten in der Vorschau anzuzeigen oder die meistverkauften Produkte zu finden.
SELECT product_name, sales FROM products ORDER BY sales DESC LIMIT 10;– Diese Abfrage findet die 10 meistverkauften Produkte.
Datenaggregation: Die Superkraft des Analysten
Aggregation ist das Herzstück der Datenanalyse. Diese Funktionen führen Berechnungen an einer Reihe von Werten durch und geben einen einzelnen, zusammenfassenden Wert zurück. So verwandeln Sie Rohdaten in wertvolle Erkenntnisse.
Häufige Aggregatfunktionen
-
COUNT(): Zählt die Anzahl der Zeilen.
-
SUM(): Berechnet die Summe einer numerischen Spalte.
-
AVG(): Berechnet den Mittelwert einer numerischen Spalte.
-
MIN() / MAX(): Gibt den Minimal- bzw. Maximalwert einer Spalte zurück.
GROUP BY
Die Anweisung GROUP BY gruppiert Zeilen mit gleichen Werten in bestimmten Spalten zu zusammengefassten Zeilen. Sie wird fast immer zusammen mit Aggregatfunktionen verwendet, um Berechnungen für jede Gruppe durchzuführen.
SELECT category, COUNT(*) FROM products GROUP BY category;– Dies zählt die Anzahl der Produkte in jeder Kategorie.
HAVING
Die HAVING-Klausel wurde in SQL eingeführt, da das Schlüsselwort WHERE nicht mit Aggregatfunktionen verwendet werden kann. HAVING filtert die Ergebnisse einer GROUP BY-Abfrage.
SELECT country, AVG(order_value) FROM orders GROUP BY country HAVING AVG(order_value) > 1000;
Die Punkte verbinden: Mehrere Tabellen verknüpfen
Daten werden selten in einer einzigen, riesigen Tabelle gespeichert. Sie sind üblicherweise auf mehrere verknüpfte Tabellen verteilt. Mit JOINs werden Zeilen aus zwei oder mehr Tabellen anhand einer gemeinsamen Spalte kombiniert.
INNER JOIN
Gibt Datensätze zurück, die in beiden Tabellen übereinstimmende Werte aufweisen. Dies ist die gebräuchlichste Join-Art.
SELECT orders.order_id, customers.customer_name FROM orders INNER JOIN customers ON orders.customer_id = customers.customer_id;
LEFT JOIN
Gibt alle Datensätze der linken Tabelle (der zuerst genannten) und die übereinstimmenden Datensätze der rechten Tabelle zurück. Gibt es keine Übereinstimmung, ist das Ergebnis auf der rechten Seite NULL.
SELECT customers.customer_name, orders.order_id FROM customers LEFT JOIN orders ON customers.customer_id = orders.customer_id;- Dies zeigt alle Kunden an, auch diejenigen, die keine Bestellung aufgegeben haben.
Das Verständnis von JOINs ist entscheidend für die Erstellung umfassender Datensätze zur Analyse.
Erweiterte Werkzeuge: Unterabfragen und CASE-Anweisungen
Sobald Sie mit den Grundlagen vertraut sind, erweitern diese Befehle Ihre Abfragen um eine weitere Ebene der Komplexität.
Unterabfragen (Verschachtelte Abfragen)
Eine Unterabfrage ist eine SQL-Abfrage, die in einer größeren Abfrage verschachtelt ist. Sie ermöglicht es Ihnen, mehrstufige Operationen in einem einzigen Befehl auszuführen.
SELECT customer_name FROM customers WHERE customer_id IN (SELECT customer_id FROM orders WHERE order_date = '2024-10-26');
CASE-Anweisung
Die CASE-Anweisung prüft Bedingungen und gibt einen Wert zurück, wenn die erste Bedingung erfüllt ist (ähnlich einer if-then-else-Anweisung). Sie ist äußerst nützlich, um dynamisch neue Kategorien oder Bezeichnungen in Ihren Daten zu erstellen.
SELECT order_id, quantity, CASE WHEN quantity > 10 THEN 'Große Bestellung' WHEN quantity > 5 THEN 'Mittlere Bestellung' ELSE 'Kleine Bestellung' END AS order_size FROM order_details;
Die Beherrschung dieser grundlegenden SQL-Befehle – SELECT, WHERE, ORDER BY, Aggregatfunktionen mit GROUP BY und JOINs – ermöglicht es Ihnen, die meisten Datenanalyseaufgaben zu bewältigen. Üben Sie regelmäßig, verstehen Sie ihre Zusammenhänge und Sie legen damit ein solides Fundament für eine erfolgreiche Karriere. Nachdem Sie nun die grundlegenden SQL-Befehle beherrschen, integrieren Sie sie mithilfe unseres umfassenden Ultimativen Leitfadens für selbstlernende Datenanalysten (2025) in Ihren Lernprozess.
