In de volgende blogposts zal ik af en toe een voorbeeld tonen van veel gebruikte grafieken. Ik zal hiervoor een data set gebruiken die ik zelf tijdens mijn opleidingen ‘process improvement’ heb opgebouwd. Deze data kan als ‘makkelijk te begrijpen’ voorbeeld dienen om mijn trainees de leerstof aan te leren die ik in deze reeks bespreek. De dataset bevat ruim 2.500 lichaamslengtes, het geslacht van de deelnemer, zijn of haar nationaliteit en geboortejaar. Na al die jaren van verzamelen heb ik van één ding spijt: ik had ook moeten vragen of de deelnemers links- of rechtshandig zijn. Om echt wetenschappelijk onderzoek te doen is deze file zeker niet geschikt, maar als voorbeeld heeft hij al honderden mensen geïnspireerd om met data aan de slag te gaan.
De "Pie Chart", de favoriet van velen, maar wel de éénvoudigste van allemaal
De eerste grafiek, de “Pie Chart”, is de éénvoudigste van allemaal. Dit voorbeeld toont de verhouding vrouwen versus mannen in mijn dataset. Het toont onmiddellijk de sterkte van de “Pie Chart”: hij is in staat een beperkt aantal categorieën perfect weer te geven. Van zodra het aantal categorieën echter stijgt boven de 3 à 4, schakel je beter over naar de ‘Pareto Chart’.
Met de juiste software kan je wel heel mooie stratificatie plaatjes maken. De stratificatie parameter is hier het decennium waarin mensen geboren zijn. Zo zie je dat het aandeel vrouwen in een ‘process improvement’ training alsmaar groter wordt. De categorie van mensen geboren in de jaren 40 mag je trouwens negeren, daar is de steekproef te klein voor om tot correcte conclusies te komen.
De "Pareto Chart, bruikbaar in alle situaties
Dit is wat mij betreft de meest universele grafiek van allemaal. Deze kan in zowat elk bedrijf en in zowat elke bedrijfscontext ingezet worden. Deze grafiek is een gestructureerde versie van een staafdiagram. Hij toont het aantal keren dat een bepaalde categorie voorkomt in de dataset en sorteert deze resultaten van groot naar klein.
Sommigen zullen ongetwijfeld al gehoord hebben van de 80/20 regel. Deze grafiek visualiseert deze regel perfect. Zo kan je in het voorbeeld zien dat 80% van de mensen in de dataset uit een zeer beperkt aantal landen komen. 4 nationaliteiten zijn verantwoordelijk voor 80% + van de deelnemers aan mijn opleidingen. Wetende dat er 74 nationaliteiten in de file zitten, gaat de 80/20 regel hier zeker op.
De “Pareto chart” kan je dus best gebruiken als je meer dan een handvol categorieën wil visualiseren en als je heel duidelijk de verhouding in aantallen en percentages van deze categorieën wil tonen. Het is ook een ideale grafiek om te gebruiken in een ‘tiered accountability’ proces. Je kan met deze grafiek immers zowat alle KPI’s van een bedrijf visualiseren, of toch de redenen waarom de KPI niet de volle 100% scoort.
Om af te sluiten nog een kleine een anekdote. Het is ruim 10 jaar geleden dat ik van een trainee volgende uitdaging voorgeschoteld kreeg. Hij had de opdracht gekregen om voor de resterende uitval in een hoogtechnologisch proces de grondoorzaak te achterhalen. Het ging op dag-basis over een klein aantal falende devices en het duurde dus enkele weken voor hij er een 150-tal verzameld had die bruikbaar waren voor zijn onderzoek. Het onderzoek zelf was niet makkelijk en pas na een maand waren alle resultaten binnen. Deze 150 defects splitsten zich op in ruim 20 categorieën die allemaal ongeveer even frequent voorkwamen. “Hoe krijg ik het verkocht aan mijn management dat we eigenlijk niets kunnen doen aan deze falers?” Ik stelde voor om bij elke balk in de pareto chart de vermoedelijke kostprijs van de structurele oplossing te schrijven. De goedkoopste oplossing kostte k€ 150. Op basis van deze grondige documentatie heeft het bedrijf leren leven met deze beperkte uitval en zal niemand nog terugkomen op dit probleem!
Volgende keer behandel ik enkele grafieken die de frequentie van voorkomen tonen, deze keer niet van categorieën, maar van tellingen en metingen.