Datenqualität // Grundlagen der Typ-Konvertierung mit T-SQL

Dieser Artikel gehört zu der Artikelserie Datenqualität in einem ETL-Prozess, in der ein Design Pattern vorgestellt wird, das die extrahierte Daten prüft, behandelt und schlechte Daten von der weiteren Verarbeitung ausschließt. SQL Server stellt mit den T-SQL Funktionen CAST, CONVERT beziehungsweise TRY_CONVERT und TRY_CAST Funktionen für die Typ-Konvertierung zur Verfügung. Die Syntax der Funktionen CONVERT … Weiterlesen

Design Pattern // Sichere Typ-Konvertierung mit T-SQL

Sind in einem ETL-Prozess Daten aus Text-Dateien zu extrahieren, ist grundsätzlich Vorsicht geboten. Text-Dateien definieren an sich bereits eine Schnittstelle zu einem Vorsystem. Zwischen der die Daten liefernden Stelle und dem ETL-Prozess muss es daher eine Vereinbarung geben, welche Daten in welchem Format geliefert werden, in welchem Format sie bereitgestellt werden und welche Wertebereiche zulässig … Weiterlesen

Design Pattern // Protokollierung eines ETL-Prozesses — wie sich Lauf, Komponente und Aktion auswertbar protokollieren lassen

Ein ETL-Prozess endet ohne Exception — aber wurde wirklich alles geladen, was hätte geladen werden müssen? Allein der Umstand, dass ein Prozess nicht abgebrochen ist, sagt noch nichts darüber, ob er auch das getan hat, was von ihm erwartet wurde. Ein les- und auswertbares Protokoll macht den Unterschied zwischen Bauchgefühl und belastbarer Aussage. Dieses Design … Weiterlesen

SSIS vs. SQL — wann SSIS, wann reines T-SQL, wann beides kombinieren?

SSIS, T-SQL oder eine Kombination beider? Den einen richtigen Weg gibt es nicht. Was es gibt, ist eine Handvoll Entscheidungs-Kriterien, an denen jede konkrete Wahl — Technologie wie Einsatz-Umfang — gemessen werden sollte: Lesbarkeit, Quellcodeverwaltung, Identitätswechsel. Diese Artikel-Serie nimmt sich diese drei Achsen vor und liefert pro Achse ein konkretes Argument. Wer bei der ETL-Tool-Wahl ohne diese Kriterien argumentiert, landet … Weiterlesen

Komplexe SQL-Statements kommentieren — parallele Inline-Dokumentation, die die Lesbarkeit nicht zerstört

Wer ein 200-Zeilen-SELECT mit rekursiver CTE schreibt, versteht es beim Schreiben vollständig — und drei Wochen später kein Wort mehr davon. Inline-Kommentare sind das Sicherheitsnetz dagegen. Das Problem: schlecht gesetzt, zerstören sie genau die Lesbarkeit, die sie retten sollen. Was dieser Artikel zeigt: Voraussetzung: Die Beispiele laufen gegen AdventureWorksDW2017 (Tabelle [dbo].[DimEmployee], rekursive CTE über ParentEmployeeKey). SSMS dient als Beispiel-Editor — die … Weiterlesen

Formatierung von SQL Statements (Teil 2) — Statement-Aufbau: SELECT, WHERE, FROM, JOIN

Wer in einem 200-Zeilen-SELECT-Statement nicht erkennen kann, wo die WHERE-Klausel anfängt und wo sie aufhört, hat ein Strukturproblem — kein Inhaltsproblem. Dieser Artikel zeigt das Layout, das auch lange Statements navigierbar hält. → Teil einer Reihe. Dieser Artikel ist Teil 2 und behandelt den Statement-Aufbau (SELECT, WHERE, FROM, JOIN). Die Bezeichner-, Delimiter-, Komma- und Alias-Grundlagen stehen in Teil 1 — Bezeichner, Delimiter, Kommata, … Weiterlesen

Formatierung von SQL Statements (Teil 1) — Bezeichner, Delimiter, Kommata, Aliase

Wer ein schlecht oder gar nicht formatiertes SELECT mit 30 Spalten und einem halben Dutzend Joins einmal hat debuggen müssen, weiß: nicht das SQL kostet den Tag, sondern die Suche danach, was es eigentlich tut. Formatierung von SQL ist keine Geschmacksfrage, sondern ein Wartungs-Werkzeug — und sie beginnt bei einer Namenskonvention. → Teil einer Reihe. Dieser … Weiterlesen

Editor-Optionen in SSMS — damit SQL-Code im Team überall gleich aussieht

 Ein SQL-Statement, das beim einen Entwickler sauber eingerückt aussieht, zerfällt beim Kollegen in ein Treppenmuster — obwohl niemand etwas am Code geändert hat. Schuld sind fast immer unterschiedliche Editor-Einstellungen: eine andere Tab-Weite, Tabulatoren statt Leerzeichen, eine nicht-monospaced Schriftart. Lesbarer SQL-Code im Team beginnt deshalb nicht beim Tippen, sondern bei den Editor-Optionen. Das Wichtigste vorab: Voraussetzung: ein … Weiterlesen

Strukturierung und Formatierung von SQL Statements — der Cluster-Pfad

Ein komplexes SQL-Statement ist schon schwer genug zu lesen — wechselnde Coding-Styles im selben File machen jede Zeile zur zusätzlichen Re-Orientierungs-Übung. SQL-Formatierung ist deshalb Team-Verantwortung, kein persönliches Geschmacksthema. Kurzüberblick: Voraussetzung: SQL Server 2017+ oder Postgres 12+ — SSMS bleibt 2018er Referenz-Editor, die Prinzipien gelten für jeden SQL-Editor mit Block-Selection. Inhalt Vorgeschichte: 2.000 Zeilen, drei Stile Vor einiger … Weiterlesen

Die funktionale Ästhetik von SQL — warum strukturierter Code schneller wird

Wer einmal ein 200-Zeilen-SELECT ohne Einrückung debuggen musste, weiß: Formatierung von SQL ist mehr als Geschmacksfrage. Lesbarer Code lässt sich nicht nur besser verstehen — er lässt sich mit den richtigen Editor-Werkzeugen auch deutlich schneller bearbeiten. In diesem Artikel: Voraussetzung: SSMS dient als Beispiel-Editor; die Prinzipien gelten für jeden Editor mit Blockauswahl (Azure Data Studio, VS … Weiterlesen