Wat is een beslisboomdiagram?


Wilt u een complexe beslissing analyseren? Probeer het met een beslisboom. Lees verder voor meer informatie over beslisbomen, hoe u ze gebruikt en hoe u ze maakt.

Wilt u een eigen diagram maken? Probeer Lucidchart. Het is snel, eenvoudig en volledig gratis.

Wat is een beslisboom?

Een beslisboom is een overzicht van de mogelijke uitkomsten van een reeks gerelateerde keuzes. Hiermee kan een individu of organisatie bepaalde opties tegen elkaar afwegen op basis van kosten, kansen en voordelen. Beslisbomen kunnen gebruikt worden voor een informele discussie of om een algoritme te ontwerpen dat op een wiskundige manier de beste keuze voorspelt.

Een beslisboom begint meestal met een enkel knooppunt dat vertakt in mogelijke uitkomsten. Ieder van deze uitkomsten leidt tot extra knooppunten die weer vertakken in andere mogelijkheden. Zo krijgt het de vorm van een boom.

Er zijn drie verschillende soorten knooppunten: kansknooppunten, beslissingsknooppunten en eindknooppunten. Een kansknooppunt wordt weergegeven met een cirkel en laat de waarschijnlijkheid van bepaalde resultaten zien. Een beslissingsknooppunt wordt weergegeven met een vierkant en laat de beslissing zien die gemaakt moet worden. Een eindknooppunt laat de uiteindelijk uitkomst van een beslissingspad zien.

beslisboom

Beslisbomen kunnen ook getekend worden met symbolen voor stroomdiagrammen, wat sommige mensen gemakkelijker vinden om te lezen en te begrijpen.

Beslisboomsymbolen

Vorm Naam Betekenis
beslissingsknooppunt Beslissingsknooppunt Geeft een te maken beslissing aan
kansknooppunt beslisboom Kansknooppunt Laat meerdere onzekere uitkomsten zien
Alternatieve vertakkingen Iedere tak geeft een mogelijke uitkomst of actie aan
Verworpen alternatief Geeft een keuze aan die niet werd geselecteerd
eindknooppunt beslisboom Eindknooppunt Geeft een uiteindelijke uitkomst aan

Een beslisboom tekenen

Om een beslisboom te tekenen kiest u eerst een medium. U kunt met de hand tekenen op papier of op een whiteboard, of u kunt speciale beslisboomsoftware gebruiken. In beide gevallen volgt u de onderstaande stappen:

1. Begin met de hoofdbeslissing. Teken hiervoor een klein vak en teken dan een lijn vanaf dit vak naar rechts voor iedere mogelijke oplossing of actie. Zet de beschrijvingen erbij.

een beslisboom tekenen

2. Voeg de kans- en beslissingsknooppunten toe om de boom uit te breiden:

  • Als er nog een beslissing genomen moet worden, tekent u nog een vak.
  • Als de uitkomst onzeker is, tekent u een cirkel (cirkels zijn kansknooppunten).
  • Als het probleem is opgelost, laat u de ruimte (voorlopig) leeg.

beslisboom

Teken mogelijke oplossingen vanaf ieder beslissingsknooppunt. Teken lijnen voor de mogelijke uitkomsten vanaf ieder kansknooppunt. Als u de opties numeriek wilt analyseren, voegt u de waarschijnlijkheid van iedere uitkomst en de kosten voor iedere actie toe.

3. Breid de boom verder uit totdat elke lijn een eindpunt bereikt. Dit betekent dat er geen keuzes meer gemaakt of uitkomsten overwogen moeten worden. Wijs iedere mogelijke uitkomst vervolgens een waarde toe. Dit kan een abstracte score of een financiële waarde zijn. Voeg driehoeken toe om de eindpunten weer te geven.

een beslisboom tekenen

Met een complete beslisboom kunt u aan de slag om alle mogelijke beslissingen te analyseren.

Voorbeeld beslisboomanalyse

Door het verwachte nut of de verwachte waarde van iedere keuze in de boom te berekenen, kunt u de risico's minimaliseren en de kans op een goede uitkomst maximaliseren.

Om het verwachte nut van een keuze te berekenen, trekt u de kosten van die beslissing af van de verwachte voordelen. De verwachte voordelen zijn gelijk aan de totale waarde van alle uitkomsten die uit die keuze kunnen voortkomen, waarbij iedere waarde vermenigvuldigd wordt met de kans dat het gebeurt. Zo berekenen we deze waarden voor de voorbeelden van hierboven:

beslisboomanalyse

Bij het bepalen van de meest gunstige uitkomst is het belangrijk om rekening te houden met de voorkeuren van de beslisser. Sommige beslissers hebben bijvoorbeeld liever een optie met een laag risico terwijl anderen juist risico's durven nemen voor een groter voordeel.

Als u uw beslisboom gebruikt met een bijbehorend kansmodel kunt u het gebruiken om de voorwaardelijke kans van een gebeurtenis te berekenen, of de kans dat dit gebeurt als een andere gebeurtenis zich voordoet. Hiervoor begint u gewoon bij de oorspronkelijke gebeurtenis en volgt u het pad van die gebeurtenis naar de uiteindelijke gebeurtenis. Onderweg vermenigvuldigt u de waarschijnlijkheid van ieder van deze gebeurtenissen met elkaar.

Op deze manier kan een beslisboom gebruikt worden als een traditioneel boomdiagram, dat de waarschijnlijkheid van bepaalde gebeurtenissen in kaart brengt, zoals het tweemaal opgooien van een munt.

boomdiagram

Voor- en nadelen

Beslisbomen blijven om verschillende redenen populair:

  • Ze zijn gemakkelijk te begrijpen
  • Ze kunnen nuttig zijn met of zonder concrete gegevens en de gegevens hoeven niet uitgebreid voorbereid te worden
  • Er kunnen nieuwe opties aan bestaande bomen worden toegevoegd
  • Ze helpen bij het kiezen van de beste optie
  • Ze zijn gemakkelijk te combineren met andere beslissingstools

Beslisbomen kunnen echter overdreven complex worden. In deze gevallen kan een compacter invloeddiagram een goed alternatief zijn. Met invloeddiagrammen richt u zich op de belangrijke beslissingen, inputs en doelen.

invloeddiagram

Beslisbomen voor automatisch leren en datamining

Een beslisboom kan ook gebruikt worden bij het bouwen van geautomatiseerde voorspelmodellen, die  gebruikt worden bij automatisch leren, datamining en statistiek. Deze methode staat bekend als leren door beslisbomen. Er wordt rekening gehouden met observaties over een item om de waarde ervan te voorspellen.

In deze beslisbomen staan knooppunten voor gegevens in plaats van voor beslissingen. Dit type boom staat ook bekend als een classificatieboom. Iedere tak bevat een serie kenmerken, of classificatieregels, die gekoppeld worden aan een bepaald klasselabel, dat aan het einde van de tak staat.

Deze regels, ook wel de beslisregels genoemd, kunnen worden uitgedrukt in een als-dan-bepaling, waarbij iedere beslissing of ieder gegeven een bepaling vormt. Bijvoorbeeld: 'als aan voorwaarden 1, 2 en 3 wordt voldaan, dan zal x met een zekerheid van y de uitkomst zijn'.

Ieder extra beetje gegevens helpt het model om nauwkeuriger te voorspellen bij welke eindige serie waardes het onderwerp hoort. Die informatie kan dan gebruikt worden als input in grotere modellen voor besluitvorming.

Soms is de voorspelde variabele een cijfer, zoals een prijs. Beslisbomen met continue, oneindige mogelijke uitkomsten worden regressiebomen genoemd.

Voor een nauwkeuriger resultaat worden soms meerdere bomen samen gebruikt in verzamelmethodes:

  • Bagging betekent dat er meerdere bomen worden gemaakt van de brongegevens. Deze bomen stemmen dan vervolgens tot er een overeenkomst is.
  • Een Random Forest-classificering bestaat uit verschillende bomen die ontworpen zijn om het classificatietempo te verhogen.
  • Boosting kan worden gebruikt voor regressie- en classificatiebomen.
  • De bomen in een Rotation Forest zijn allemaal getraind door een PCA (principale-componentenanalyse) op een willekeurig gedeelte van de gegevens

Een beslisboom wordt als optimaal gezien als deze zoveel mogelijk gegevens weergeeft in zo weinig mogelijk niveaus of vragen. Algoritmes ontworpen om geoptimaliseerde beslisbomen te maken zijn CART, ASSISTANT, CLS en ID3/4/5. Een beslisboom kan ook gemaakt worden door het opstellen van associatieregels waarbij het variabele doel aan de rechterkant geplaatst wordt.

Voor iedere methode moet worden vastgesteld wat de beste manier is om de gegevens op ieder niveau op te splitsen. Een aantal veelgebruikte methodes hiervoor zijn Gini-impurity, Kullback-Leibler-divergentie en afwijkingsvermindering.

Het gebruik van beslisbomen bij automatisch leren heeft verschillende voordelen:

  • De kosten van het gebruik van de boom om gegevens te voorspellen nemen af met ieder extra gegevenspunt
  • Ze werken zowel voor categorische als voor numerieke gegevens
  • Ze kunnen problemen weergeven met verschillende uitkomsten
  • Ze gebruiken een whitebox-model (waarmee de resultaten gemakkelijk uit te leggen zijn)
  • De betrouwbaarheid van een boom kan getest en gemeten worden
  • Ze zijn nauwkeurig ongeacht of de veronderstellingen van de brongegevens geschonden worden

Maar ze hebben ook een aantal nadelen:

  • Bij het verwerken van categorische gegevens met verschillende niveaus is de informatiewinst in het voordeel van de kenmerken met de meeste niveaus.
  • Berekeningen kunnen erg complex worden als er onzekerheden en veel gekoppelde uitkomsten bij betrokken zijn.
  • Verbindingen tussen knooppunten zijn beperkt tot EN, terwijl beslisdiagrammen ook OF-verbindingen tussen knooppunten toestaan.