Data science (veel) populairder dan Big Data in Google Trends
Dat data science als term steeds meer ingeburgerd raakt, zal vast geen verrassing voor je zijn. Maar wist je dat data science op dit moment een veel grotere interesse kent dan bijvoorbeeld big data, data analytics of data analyse? Bovenstaande figuur toont dat de wereldwijde interesse in de Google zoekterm "data science", inmiddels meer dan twee maal zo hoog is als de zoektermen "big data", "data analyse", en "data analytics". De punten op de trendlijnen, zijn allemaal relatief ten opzicht van de zoekterm met de grootste interesse op enig moment in de tijd (in dit geval "data science", enkele maanden geleden, dat per definitie de waarde 100 heeft). Dit, omdat Google alleen relatieve en geen absolute cijfers publiceert over het aantal malen dat een bepaalde zoekterm wordt gebruikt.
"data science" groeide 55% per jaar
De "data science" curve laat ook zien hoe enorm snel de interesse in data science de afgelopen jaren is gegroeid. In de afgelopen tien jaar groeide het aantal zoekopdrachten naar "data science" wereldwijd met gemiddeld bijna 55 procent per jaar. (In de afgelopen vijf jaar nam dit percentage iets af, tot circa 35 procent per jaar). Ook bij "data analytics" en "data analysis" zien we een stijgende trend, hoewel minder steil dan bij "data science". "Big data" groeide hard in de periode voor 2015, consolideerde daarna, en sinds 2020 zien we een dalende trend.
De populariteit van data science blijkt ook als je de termen invoert als zoekopdracht in Google, hoewel "data analysis" dan wel hoger scoort:
- "data analysis": 512 mln. hits
- "data science": 453 mln. hits
- "big data": 333 mln. hits
- "data analytics": 204 mln. hits
- "advanced analytics": 20 mln. hits
Wie had dat zes jaar geleden gedacht?
Een zelfde soort figuur als hierboven werd door Prof. Cao vijf jaar geleden gepubliceerd in een artikel in ACM Computing Surveys1. Destijds (eind 2016) was de term "big data" nog populairder dan "data science", hoewel ook toen al zichtbaar was dat de interesse in data science snel aan het toenemen was, en in het jaar 2016 al sneller groeide dan de interesse in "big data". Het wordt interessant om te volgen hoe de populariteit van data science zich de komende jaren verder gaat ontwikkelen. Wellicht gaat ook, net als acht jaar geleden bij "big data", een consolidatie plaatsvinden. Misschien zal data science haar leidende positie dan moeten afstaan aan termen als "deep learning", "gpt", "stable diffusion" enzovoort. Maar dat is iets voor een toekomstige blog.
Hoe maak je zo'n grafiek eigenlijk?
Mocht je je afvragen hoe de grafiek is gemaakt: Ook dat is wellicht iets voor een toekomstige blog. Heel in het kort: De ruwe data zijn afkomstig van Google Trends (zichtbaar als de dunne lijnen), met R verwerkt tot een grafiek (inclusief "smoothing" en labelling in ggplot2 en verwante packages), met output in SVG (Scalable Vector Graphics) formaat, en tenslotte bewerkt met CSS voor de animatie.
1 Longbing Cao. 2017. Data Science: A Comprehensive Overview. ACM Comput. Surv. 50, 3, Article 43 (May 2018).