Galabau 2009 - Assoziationsanalyse von Bilanzen

Anhand eines realen Datensatzes von 100 Bilanzen operativ tätiger GmbH's im Garten- und Landschaftsbau aus den Jahren 2008 und 2009 in Deutschland wurde  eine Assoziationsanalyse durchgeführt.

Seit dem Jahr 2000 liegen Beschäftigtenzahl und Branchenumsatz im Garten- und Landschaftsbau in Deutschland kontinuierlich bei rund 90T Personen und 5 Mrd. €. Im gleichen Zeitraum ist die Zahl der Betriebe um 25% gestiegen. Eine Brachenstatistik dazu liefert die "GaLaBau-Statistik 2009" der GaLaBau-Service GmbH. Der hier betrachtete Datensatz besteht aus einer Stichprobe von 100 Bilanzen aus dem 5%-Anteil der Kapitalgesellschaften in diesem Wirtschaftsbereich. Als zentraler Maßstab für die Größe der Firmen wird die Bilanzsummen zugrunde gelegt und weitere Größen, wie Umlauf-/Anlagevermögen sowie Forderungen und Verbindlichkeiten relativ als Prozentsatz auf die jeweilige Bilanzsumme bezogen. Hier ein kleiner Auszug mit den Variablen: Bilanzsumme, Gewinn pro Bilanzsumme in Prozent und ebenso als Anteil an der Bilanzsumme der Kassenbestand, die Forderungen, die Verbindlichkeiten, das Anlagevermögen sowie das Verhältnis der Forderungen zu den Verbindlichkeiten, jeweils die Daten aus 2009.

 

 

 


Betrachtet man die Werte aufsteigend sortiert nach der Bilanzsumme, so erkennt man nur bei dem Viertel mit den kleinsten Bilanzsummen (kleiner 124T€) eine Abweichung in der Gewinnverteilung zu den 3 oberen Quartilen (2.Quartil 124T€ 635T€).





Bei der Verteilung des Mittelwertes und der Standardabweichung der Gewinne der Firmen mit einer Bilanzsumme größer q0.25 kann wegen der Stichprobengröße von 75 asymptotisch eine Normalverteilung unterstellt werden, obwohl für die eigentliche Verteilung der Gewinne keine Normalverteilung angenommen werden kann. Danach liegt der Mittelwert des Gewinns der 3/4 größeren Gesellschaften bei einer Vertrauenswahrscheinlichkeit von 95% in dem Konfidenzintervall zwischen 4,25% und 6,63% der Bilanzsumme. Die Standardabweichung liegt entsprechend zwischen 9,24 und 12,75.

Zur Suche von Zusammenhängen zwischen den einzelnen Bilanzbestandteilen mittels einer Assoziationsanalyse werden den einzelnen Variablen jeweils zwei oder drei Merkmalsausprägungen wie folgt zugeodnet:

Der Bilanzsummen wird das Attribut BilSum mit den Merkmalen {BK,BG} für klein bzw. groß zugeordnet, je nachdem ob die Bilanzsumme kleiner oder größer als der Median ist.
Dem Gewinn pro Bilanzsumme wird das Attribut Gew_pro_BS mit den Merkmalen {GwN,GwK,GwG} für Verlust, bzw. kleiner/großer Gewinn (Grenze Median) zugeordnet.
Entsprechend dem Anteil des Kassenbestandes an der Bilanzsumme Ka_pro_Bs->{KaK,KaG} jenach Lage in der unteren oder oberen Hälfte.
Weiter Merkmale sind der Anteil der Forderungen Fo_pro_BS ->{FoK,FoG}, der Verbindlichkeiten Vb_pro_BS->{VbK,VbG}, des Anlagevermögens Av_pro_BS->{AvK,AvG} sowie des Verhältnisses von Forderungen zu Verbindlichkeiten Fo_pro_Vb->{FpVK,FpVG}

Damit ergibt sich z.B. mit der Stichprobe der Bilanzen,
dass diejenigen GmbH's im GalaBau, die das Geschäftsjahr 2009 mit hohem Kassen- und Anlagebestand und hohen Forderungen gegenüber den Verbindlichkeiten abgeschlossen haben, mehr als doppelt so häufig einen Verlust erwirtschafteten als der Durchschnitt der Firmen!

Die Merkmalskombination {Ka_pro_BS=KaG,Av_pro_BS=AvG,Fo_proVb=FpVG} kommen zusammen mit Gw_pro_BS=GwN in 6% aller Bilanzen vor (Support 6%). In 40% aller Fälle in denen {KaG,AvG,FpVG} vorkommen kommt auch GwN vor ( Konfidenz 40%), d.h. es gilt die Assoziationsregel:

{Ka_pro_BS=KaG,Av_pro_BS=AvG,Fo_proVb=FpVG} => GwN

Verglichen mit allen Datensätzen kommt GwN in Kombination mit der linken Seite dieser "Assoziationsregel" rund 2,22 mal häufiger vor.(lift = 2,22) Die folgende Abbildung zeigt graphisch ein Ergebnis der Assoziationsanalyse mit dem Paket arules zur Statistiksoftware R. Die eingezeichnete Kurve zeigt die jeweiligen Anteile der Merkmale in der Stichprobe.Die Balken zeigen die Anteile in diesem einen von 7 mit Hilfe des Pakets cluster gefunden Cluster. Die Anteile der Firmen mit großer bzw. kleiner Bilanzsumme entspricht hier dem durchschnittlichen Vorkommen im gesamten Datensatz.

GwN

Einen Auszug derjenigen Assoziationsregeln, die auf der Rechten Seite "GwN" ergeben, sortiert nach dem "lift" zeigt die nachfolgende Abbildung:

> rules<-apriori(gala, parameter = list( support = 0.05, confidence = 0.2), control = list(verbose = FALSE))
> verluste<-subset(rules, rhs %in% "Gw_pro_BS=GwN")
> inspect(SORT(verluste, by = "lift")[1:10])

lhs rhs support confidence lift
1 {Ka_pro_BS=KaG,
Av_pro_BS=AvG,
Fo_pro_Vb=FpVG} => {Gw_pro_BS=GwN} 0.06 0.4000000 2.222222
2 {Ka_pro_BS=KaG,
Vb_pro_BS=VbK,
Av_pro_BS=AvG,
Fo_pro_Vb=FpVG} => {Gw_pro_BS=GwN} 0.05 0.3846154 2.136752
3 {BilSum=BG,
Ka_pro_BS=KaG,
Av_pro_BS=AvG,
Fo_pro_Vb=FpVG} => {Gw_pro_BS=GwN} 0.05 0.3846154 2.136752
4 {Vb_pro_BS=VbK,
Av_pro_BS=AvG,
Fo_pro_Vb=FpVG} => {Gw_pro_BS=GwN} 0.05 0.2941176 1.633987
5 {Av_pro_BS=AvG,
Fo_pro_Vb=FpVG} => {Gw_pro_BS=GwN} 0.06 0.2857143 1.587302
6 {Av_pro_BS=AvK,
Fo_pro_Vb=FpVK} => {Gw_pro_BS=GwN} 0.05 0.2777778 1.543210
7 {BilSum=BG,
Av_pro_BS=AvG,
Fo_pro_Vb=FpVG} => {Gw_pro_BS=GwN} 0.05 0.2777778 1.543210
8 {Vb_pro_BS=VbG,
Av_pro_BS=AvK} => {Gw_pro_BS=GwN} 0.06 0.2608696 1.449275
9 {Ka_pro_BS=KaK,
Av_pro_BS=AvK} => {Gw_pro_BS=GwN} 0.05 0.2500000 1.388889
10 {Fo_pro_BS=FoG,
Av_pro_BS=AvG} => {Gw_pro_BS=GwN} 0.05 0.2500000 1.388889

Die folgende Abbildung zeigt die Regeln, die um die rund 3 mal häufiger mit kleineren Firmen verbunden sind (BilSum=BK)

inspect(SORT(rules, by = "lift")[1:10])

lhs rhs support confidence lift
1 {Ka_pro_BS=KaG,
Av_pro_BS=AvK,
Fo_pro_Vb=FpVK} => {BilSum=BK} 0.05 0.8333333 3.333333
2 {Ka_pro_BS=KaG,
Fo_pro_BS=FoK,
Av_pro_BS=AvK} => {BilSum=BK} 0.06 0.7500000 3.000000
3 {Fo_pro_BS=FoK,
Vb_pro_BS=VbK,
Av_pro_BS=AvK} => {BilSum=BK} 0.05 0.7142857 2.857143
4 {Gw_pro_BS=GwG,
Ka_pro_BS=KaG,
Fo_pro_BS=FoK,
Av_pro_BS=AvK} => {BilSum=BK} 0.05 0.7142857 2.857143
5 {Ka_pro_BS=KaG,
Fo_pro_BS=FoK,
Vb_pro_BS=VbK,
Av_pro_BS=AvK} => {BilSum=BK} 0.05 0.7142857 2.857143

Abschließend noch einige Assoziationsregel, die mit einem größen Gewinnanteil in der Bilanz verbunden sind:

lhs rhs support confidence lift
1 {Ka_pro_BS=KaG,
Fo_pro_BS=FoK,
Av_pro_BS=AvK} => {Gw_pro_BS=GwG} 0.07 0.8750000 2.134146
2 {Fo_pro_BS=FoK,
Vb_pro_BS=VbK,
Av_pro_BS=AvK} => {Gw_pro_BS=GwG} 0.06 0.8571429 2.090592
3 {Ka_pro_BS=KaG,
Fo_pro_BS=FoK,
Vb_pro_BS=VbK,
Av_pro_BS=AvK} => {Gw_pro_BS=GwG} 0.06 0.8571429 2.090592
4 {BilSum=BK,
Ka_pro_BS=KaG,
Fo_pro_BS=FoK,
Av_pro_BS=AvK} => {Gw_pro_BS=GwG} 0.05 0.8333333 2.032520
5 {BilSum=BK,
Fo_pro_BS=FoK,
Av_pro_BS=AvK} => {Gw_pro_BS=GwG} 0.06 0.7500000 1.829268
6 {BilSum=BK,
Fo_pro_BS=FoK,
Vb_pro_BS=VbK} => {Gw_pro_BS=GwG} 0.05 0.7142857 1.742160
7 {BilSum=BK,
Ka_pro_BS=KaG,
Fo_pro_BS=FoK,
Vb_pro_BS=VbK} => {Gw_pro_BS=GwG} 0.05 0.7142857 1.742160
8 {BilSum=BK,
Ka_pro_BS=KaG,
Fo_pro_BS=FoK} => {Gw_pro_BS=GwG} 0.06 0.6666667 1.626016
9 {BilSum=BG,
Ka_pro_BS=KaG,
Fo_pro_Vb=FpVK} => {Gw_pro_BS=GwG} 0.06 0.6666667 1.626016
10 {BilSum=BG,
Ka_pro_BS=KaG,
Vb_pro_BS=VbK,
Av_pro_BS=AvK} => {Gw_pro_BS=GwG} 0.06 0.6666667 1.626016
>
Aufgrund vorgegebener Support- und Konfidenzwerte filtert arules aus der Menge aller möglichen Assoziationsregeln mit Hilfe einer Variante des APRIORI-Algorithmus formal diejenigen Regeln heraus, welche die Vorgaben erfüllen. Eine Interpretation bezüglich der Bedeutung der Ergebnisse ist damit nicht verbunden!

Folgende Auffälligkeiten sind somit rein zufällig :-))

1. Relativ hohe Forderungen und Kassenbestände und verhältnismäßig kleine Verbindlichkeiten sind fast 2 x häufiger mit Verlust verbunden als im Durchschnitt.

2. kleinere Firmen sind häufiger mit höheren Kassenbeständen und geringerem Anlagevermögen verbunden.

3. kleinerer Forderungsbestand ist mit höheren Gewinnen verbunden.