Wil je een complexe beslissing analyseren? Probeer het met een beslisboom. Lees verder voor meer informatie over beslisbomen, hoe je ze gebruikt en hoe je ze maakt.
Dit artikel leest u in 7 minuten
Wil jij je eigen beslisboom maken? Probeer Lucidchart. Het is snel, simpel en compleet gratis!
Wat is een beslisboom?
Een beslisboom is een overzicht van de mogelijke uitkomsten van een reeks gerelateerde keuzes. Hiermee kan een individu of organisatie bepaalde opties tegen elkaar afwegen op basis van kosten, kansen en voordelen. Beslisbomen kunnen gebruikt worden voor een informele discussie of om een algoritme te ontwerpen dat op een wiskundige manier de beste keuze voorspelt.
Een beslisboom begint meestal met een enkel knooppunt dat vertakt in mogelijke uitkomsten. Ieder van deze uitkomsten leidt tot extra knooppunten die weer vertakken in andere mogelijkheden. Zo krijgt het de vorm van een boom.
Er zijn drie verschillende soorten knooppunten: kansknooppunten, beslissingsknooppunten en eindknooppunten. Een kansknooppunt wordt weergegeven met een cirkel en laat de waarschijnlijkheid van bepaalde resultaten zien. Een beslissingsknooppunt wordt weergegeven met een vierkant en laat de beslissing zien die gemaakt moet worden. Een eindknooppunt laat de uiteindelijk uitkomst van een beslissingspad zien.
Beslisbomen kunnen ook getekend worden met symbolen voor stroomdiagrammen, wat sommige mensen gemakkelijker vinden om te lezen en te begrijpen.
Beslisboomsymbolen
Vorm | Naam | Betekenis |
---|---|---|
Beslissingsknooppunt | Geeft een te maken beslissing aan | |
Kansknooppunt | Laat meerdere onzekere uitkomsten zien | |
Alternatieve vertakkingen | Iedere tak geeft een mogelijke uitkomst of actie aan | |
Verworpen alternatief | Geeft een keuze aan die niet werd geselecteerd | |
Eindknooppunt | Geeft een uiteindelijke uitkomst aan |
Een beslisboom tekenen
Om een beslisboom te tekenen kies je eerst een medium. Je kunt met de hand tekenen op papier of op een whiteboard, of je kunt speciale software voor het maken van beslisbomen gebruiken. In beide gevallen volg je de onderstaande stappen:
1.
Begin met de hoofdbeslissing
. Teken hiervoor een klein vak en teken dan een lijn vanaf dit vak naar rechts voor iedere mogelijke oplossing of actie. Zet de beschrijvingen erbij.
2.
Voeg de kans- en beslissingsknooppunten toe om de boom uit te breiden
:- Als er nog een beslissing genomen moet worden, teken je nog een vak.
- Als de uitkomst onzeker is, teken je een cirkel (cirkels zijn kansknooppunten).
- Als het probleem is opgelost, laat je de ruimte (voorlopig) leeg.
Teken mogelijke oplossingen vanaf ieder beslissingsknooppunt. Teken lijnen voor de mogelijke uitkomsten vanaf ieder kansknooppunt. Als je de opties numeriek wilt analyseren, voeg je de waarschijnlijkheid van iedere uitkomst en de kosten voor iedere actie toe.
3.
Breid de boom verder uit totdat elke lijn een eindpunt bereikt
. Dit betekent dat er geen keuzes meer gemaakt of uitkomsten overwogen moeten worden. Wijs iedere mogelijke uitkomst vervolgens een waarde toe. Dit kan een abstracte score of een financiële waarde zijn. Voeg driehoeken toe om de eindpunten weer te geven.Met een complete beslisboom kun je aan de slag om alle mogelijke beslissingen te analyseren.
Wil jij je eigen beslisboom maken? Probeer Lucidchart. Het is snel, simpel en compleet gratis!
Een beslisboom makenVoorbeeld beslisboom analyse
Door het verwachte nut of de verwachte waarde van iedere keuze in de boom te berekenen, kun je de risico's minimaliseren en de kans op een goede uitkomst maximaliseren.
Om het verwachte nut van een keuze te berekenen, trek je de kosten van die beslissing af van de verwachte voordelen. De verwachte voordelen zijn gelijk aan de totale waarde van alle uitkomsten die uit die keuze kunnen voortkomen, waarbij iedere waarde vermenigvuldigd wordt met de kans dat het gebeurt. Zo berekenen we deze waarden voor de voorbeelden van hierboven:
Bij het bepalen van de meest gunstige uitkomst is het belangrijk om rekening te houden met de voorkeuren van de beslisser. Sommige beslissers hebben bijvoorbeeld liever een optie met een laag risico terwijl anderen juist risico's durven nemen voor een groter voordeel.
Als jij je beslisboom gebruikt met een bijbehorend kansmodel kun je het gebruiken om de voorwaardelijke kans van een gebeurtenis te berekenen, of de kans dat dit gebeurt als een andere gebeurtenis zich voordoet. Hiervoor begin je gewoon bij de oorspronkelijke gebeurtenis en volg je het pad van die gebeurtenis naar de uiteindelijke gebeurtenis. Onderweg vermenigvuldig je de waarschijnlijkheid van ieder van deze gebeurtenissen met elkaar.
Op deze manier kan een beslisboom gebruikt worden als een traditioneel boomdiagram, dat de waarschijnlijkheid van bepaalde gebeurtenissen in kaart brengt, zoals het tweemaal opgooien van een munt.
Voor- en nadelen
Beslisbomen blijven om verschillende redenen populair:
- Ze zijn gemakkelijk te begrijpen
- Ze kunnen nuttig zijn met of zonder concrete gegevens en de gegevens hoeven niet uitgebreid voorbereid te worden
- Er kunnen nieuwe opties aan bestaande bomen worden toegevoegd
- Ze helpen bij het kiezen van de beste optie
- Ze zijn gemakkelijk te combineren met andere beslissingstools
Beslisbomen kunnen echter overdreven complex worden. In deze gevallen kan een compacter invloeddiagram een goed alternatief zijn. Met invloeddiagrammen richt u zich op de belangrijke beslissingen, inputs en doelen.
Beslisbomen voor automatisch leren en datamining
Een beslisboom kan ook gebruikt worden bij het bouwen van geautomatiseerde voorspelmodellen, die gebruikt worden bij automatisch leren, datamining en statistiek. Deze methode staat bekend als leren door beslisbomen. Er wordt rekening gehouden met observaties over een item om de waarde ervan te voorspellen.
In deze beslisbomen staan knooppunten voor gegevens in plaats van voor beslissingen. Dit type boom staat ook bekend als een classificatieboom. Iedere tak bevat een serie kenmerken, of classificatieregels, die gekoppeld worden aan een bepaald klasselabel, dat aan het einde van de tak staat.
Deze regels, ook wel de beslisregels genoemd, kunnen worden uitgedrukt in een als-dan-bepaling, waarbij iedere beslissing of ieder gegeven een bepaling vormt. Bijvoorbeeld: 'als aan voorwaarden 1, 2 en 3 wordt voldaan, dan zal x met een zekerheid van y de uitkomst zijn'.
Ieder extra beetje gegevens helpt het model om nauwkeuriger te voorspellen bij welke eindige serie waardes het onderwerp hoort. Die informatie kan dan gebruikt worden als input in grotere modellen voor besluitvorming.
Soms is de voorspelde variabele een cijfer, zoals een prijs. Beslisbomen met continue, oneindige mogelijke uitkomsten worden regressiebomen genoemd.
Voor een nauwkeuriger resultaat worden soms meerdere bomen samen gebruikt in verzamelmethodes:
Bagging
betekent dat er meerdere bomen worden gemaakt van de brongegevens. Deze bomen stemmen dan vervolgens tot er een overeenkomst is.- Een
Random Forest-classificering
bestaat uit verschillende bomen die ontworpen zijn om het classificatietempo te verhogen. Boosting
kan worden gebruikt voor regressie- en classificatiebomen.- De bomen in een
Rotation Forest
zijn allemaal getraind door een PCA (principale-componentenanalyse) op een willekeurig gedeelte van de gegevens
Een beslisboom wordt als optimaal gezien als deze zoveel mogelijk gegevens weergeeft in zo weinig mogelijk niveaus of vragen. Algoritmes ontworpen om geoptimaliseerde beslisbomen te maken zijn CART, ASSISTANT, CLS en ID3/4/5. Een beslisboom kan ook gemaakt worden door het opstellen van associatieregels waarbij het variabele doel aan de rechterkant geplaatst wordt.
Voor iedere methode moet worden vastgesteld wat de beste manier is om de gegevens op ieder niveau op te splitsen. Een aantal veelgebruikte methodes hiervoor zijn Gini-impurity, Kullback-Leibler-divergentie en afwijkingsvermindering.
Het gebruik van beslisbomen bij automatisch leren heeft verschillende voordelen:
- De kosten van het gebruik van de boom om gegevens te voorspellen nemen af met ieder extra gegevenspunt
- Ze werken zowel voor categorische als voor numerieke gegevens
- Ze kunnen problemen weergeven met verschillende uitkomsten
- Ze gebruiken een whitebox-model (waarmee de resultaten gemakkelijk uit te leggen zijn)
- De betrouwbaarheid van een boom kan getest en gemeten worden
- Ze zijn nauwkeurig ongeacht of de veronderstellingen van de brongegevens geschonden worden
Maar ze hebben ook een aantal nadelen:
- Bij het verwerken van categorische gegevens met verschillende niveaus is de informatiewinst in het voordeel van de kenmerken met de meeste niveaus.
- Berekeningen kunnen erg complex worden als er onzekerheden en veel gekoppelde uitkomsten bij betrokken zijn.
- Verbindingen tussen knooppunten zijn beperkt tot EN, terwijl beslisdiagrammen ook OF-verbindingen tussen knooppunten toestaan.