Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Übung - Schätzen der Henry-Konstanten aus der chemischen Struktur

Author: Hans Lohninger

Der Datensatz HENRYSEM beinhaltet verschiedene Deskriptoren und Eigenschaften von 157 Substanzen, darunter den Logarithmus des Henry-Koeffizienten, den Siedepunkt und den Gefrierpunkt. Die folgenden Variablen sind verfügbar:

ln(H)       Logarithmus der Henry-Konstante
melt.p. Gefrierpunkt (Grad Celsius)
boil.p. Siedepunkt (Grad Celsius)
DENS20 Dichte bei 20 Grad Celsius
nD20 Brechungsindex bei 20 Grad Celsius
Hv(LB) Verdampfungsenthalpie
compact Topologischer Index, der die Kompaktheit eines Moleküls angibt
rad Topologischer Radius
dia Topologischer Durchmesser
nvz Zahl der Verzweigungen im Molekül
Randic Randic-Index
RdOz modifizierter Randic-Index
NMethyl Anzahl der Methylgruppen im Molekül
TJ Topologischer Index J (definiert von Balaban)
C Anzahl der Kohlenstoffatome
H Anzahl der Wasserstoffatome
O Anzahl der Sauerstoffatome
N Anzahl der Stickstoffatome
SumH Anzahl der Heteroatome (nicht-H, nicht-C) im Molekül
MWgt Molekulargewicht
LOIX topologischer Index, der die Elektronegativität widerspiegelt

Verwenden sie diese Daten und gehen Sie zum  DataLab , um die Henry-Konstante mittels der molekularen Deskriptoren zu modellieren. Versuchen Sie einige Methoden zu vergleichen, z.B. MLR (in Kombination mit der Vorwärtsselektion), PCR und ANN (RBF-Netzwerke). Welches dieser Modelle ist Ihrer Meinung nach das beste?

Was ist mit der Modellierung der Siede- und Gefrierpunkte, wenn man diesen Datensatz benutzt?

Haben Sie eine Erklärung für den Unterschied zwischen den Siede- und Gefrierpunkten?

 


Last Update: 2012-10-08