Neu in GAUSS 17

Neue Funktionen in GAUSS 17

GAUSS 17 legt den Fokus auf eine vereinfachte Nutzung und einen erweiterten Datenzugriff. Neben der jetzt nativen Verwendung von bereits unterstützten Datenformaten kommt HDF5 für eine unbegrenzte Datensatzgröße hinzu. Einfachere Befehle für Standardaufgaben, wie deskriptive Statistiken und Parameterschätzung, erschließen auch weniger erfahrenen Anwendern den schnellen Zugriff auf Ergebnisse. Die Unterstützung von LaTeX-Satz in Graphen/Plots macht das Erstellen von professionellen Grafiken nun ganz einfach.

Vereinfachte Handhabung von Daten und Modellen

Objektverwaltung

Optionen zum Festlegen von Modellen und Daten hinsichtlich Modellvariablen
//Load specified variables in a GAUSS matrix: X = loadd("wine_quality.dat", "rating + citric acid + sulphates");

Modelle zur Parameterschätzung können jetzt durch die Namen der Datenspalten ausgedrückt werden. Das ermöglicht die klare Formulierung von Modellen und erhöht die Lesbarkeit für weniger erfahrene Anwender.

//Estimate parameters of model:
//weight = α + β1*height + β2*age
call ols("students.dat", "weight ~ height + age");

Analog können die Namen der Datensätze auch zur Spezifikation von Statistikfunktionen eingesetzt werden.

//Calculate descriptive statistics on all
//variables in dataset except for lot_size and num_baths
call dstatmt("housing.dat", ". -lot_size -num_baths");

Die Vorteile sind:

  • Einfachere Nutzung
  • Konsistenz mit anderer Statistiksoftware
  • Klare Dokumentation der ausgeführten Berechnungen
  • Vollständige Rückwärtskompatibilität

Unterstützung des Datenformats HDF5

Unterstützung des Datenformats HDF5 ermöglicht dem Anwender:

  • Unbegrenzte Datensatzgröße
  • Sehr schnelles Lesen/Schreiben der Daten
  • Einbindung in GAUSS als natives Dateiformat (kein Ex-/Import)
  • Übertragbarkeit auf alle Betriebssysteme und viele Softwarepakete

Nutzung von CSV, XLSX und HDF5 als native GAUSS-Datensätze

Das neue intelligente Dateihandling erlaubt die Nutzung diverser Standarddateiformate als native GAUSS-Datensätze, ohne dass man sich um den Import der Daten kümmern muss. Die Vorverarbeitung der Daten wird noch einmal entscheidend vereinfacht. Die Daten können direkt über die Namen der Spalten/Daten angesprochen werden.

//Load specified variables from a CSV file to a GAUSS matrix:
X = loadd("wine_quality.csv", "rating + citric acid + sulphates");

//Estimate parameters of model: //rating = α + β1*citric acid + β2*sulphates, //using data from an Excel file call ols("wine_quality.xlsx", "rating ~ citric acid + sulphates");

//Calculate descriptive statistics on all variables //in an Excel file except for 'fixed acidity' and 'chlorides' call dstatmt("wine_quality.xlsx", ". -fixed acidity -chlorides");

Neue Funktion der Grafikbibliotheken

Objektverwaltung Objektverwaltung Objektverwaltung

Die Erstellung professioneller Grafiken erfordert nicht nur die schnelle und ansprechende Umsetzung von Daten in deren grafische Repräsentation, sondern auch eine adäquate Beschriftung.

Das ist jetzt noch einfacher, da LaTeX direkt in den Beschriftungen verwendet werden kann:
//Add LaTeX formula to title
plotSetTitle(&myPlot, "\\Delta y = y_t - y_{t-1}");

Objektverwaltung Objektverwaltung Objektverwaltung Objektverwaltung

Außerdem bietet GAUSS 17 weitere Plot-Befehle:

  • plotAddErrorBar: Erstellt XY-Plots mit benutzerspezifischen, symmetrischen oder asymmetrischen Fehlerbalken
  • plotAddSurface: Fügt eine Oberfläche oder Ebene zu einem vorhandenen Oberflächenplot hinzu
  • plotSetLegendFont: Steuert die Schriftart, Größe und Farbe des Legendentexts
  • plotCDFEmpirical: Zeichnet die empirische Verteilungsfunktion eines Eingabevektors bzw. von Eingabevektoren

Der Grafik-Editor kann nun auch den Blickwinkel, die Beleuchtung und das Gitter in Oberflächengraphen steuern. Außerdem ist es möglich, die X/Y-Bereiche anzupassen.

Weitere Funktionsverbesserungen:

  • Neue Farbpaletten für Oberflächen- und Konturdiagramme sorgen für das einfache Erstellen von professionellen und ausdruckstarken 3D-Grafiken
  • Neue Option zum Hinzufügen von Höhe zu Konturlinien in plotContour und zum Positionieren von Farben bei spezifischen Höhen, anstatt der genauen Aufteilung der Farben für Oberflächen- und Konturdiagramme
  • Die Terminal-Version von GAUSS, ‘tgauss’, und die GAUSS Engine können Grafiken jetzt auf Headless Servern erstellen und speichern

Objektverwaltung Objektverwaltung Objektverwaltung Objektverwaltung

GAUSS HPCC

GAUSS HPCC (High Performance Cluster Computing) erschließt die Kapazitäten von Hochgeschwindigkeits-Clustercomputern für GAUSS und ermöglicht auf diese Weise neue Dimensionen in Leistung und Geschwindigkeit.

GAUSS HPCC erlaubt effizientes Cluster-Computing mit GAUSS-Bordmitteln:

Es können High-Level-GAUSS-Programme, welche die schnellen Low-Level-Routinen der MPI-Bibliothek nutzen, erstellt werden.

  • Kompatibel mit Hadoop:
    Einfache Erstellung von GAUSS MapReduce Functionen
  • Verbindungen zu NoSQL und Big Data Datenbanken wie z.B.:
    MongoDB, Hbase, Hive, Pig und andere
  • Unterstützung von Streaming oder Online Algorithmen für Datenbestände, die nicht vollständig in den Systemspeicher geladen werden können.

Die hohe Leistung im Cluster wird durch kurze Startzeiten und geringen Speicherverbrauch erreicht.

GAUSS HPCC steht allen universitären Nutzern zur Verfügung, die eine aktuelle Netzwerklizenz mit Platinum Premier Support & Maintenance haben.

Neue mathematische und statistische Funktionen

Neue Funktionen:

  • cdfEmpirical: Berechnet die empirische kumulative Verteilungsfunktion
  • ldl: Berechnet die ‘L’- und ‘D’-Faktoren einer symmetrischen Matrix
  • powerm: Berechnet die Potenz einer Matrix
  • sylvester: Berechnet die Lösung der Sylvester-Matrix-Gleichung
  • sylvester: Berechnet Zufallszahlen nach der Inverse-Wishart-Verteilung
  • pdfWishartInv: Berechnet die Wahrscheinlichkeitsdichtefunktion der Inverse-Wishart-Verteilung
  • dot: Berechnet das Punktprodukt für einen Vektor oder eine Gruppe von Vektoren

Funktionserweiterungen

  • quantile/quantiled: Eine Option wurde hinzugefügt, um die Berechnungsmethode zu wählen
  • glm: Die Funktion glm unterstützt Funktionen und Modelle aus der Inverse-Gauss-Familie ohne Konstanten für die Parameterschätzung des allgemeinen linearen Modells
  • schur: Diese Funktion unterstützt die direkte Berechnung der komplexen Form der Matrix

Geschwindigkeitsverbesserungen

  • X ’X ist für große Matrizen fast doppelt so schnell
  • sortc ist jetzt wesentlich schneller, besonders für Spaltenvektoren
  • Außerordentliche Steigerung der Geschwindigkeit für die unique und uniquesa, besonders für Stringfelder
  • Bei Linear solve, durch die Verwendung des Slash-Operators ‘/’ für kleine Matrizen
  • Das Kronecker Product ‘.*.’ ist schneller, wenn einer der Faktoren ein Spaltenvektor ist
  • crossprd ist schneller, für den Fall, das der Faktor kleiner als 500 Vektoren hat
  • dffc ist 10-1000x schneller, wenn der Parameter ‘d1’ gleich Eins ist
  • reclassify ist wesentlich schneller und benötigt deutlich weniger Speicher
ID=3659