Landschap van vogels en licht
Dit is een vervolg op deze post
Elk jaar neemt het aantal wetenschappelijke publicaties toe. de wetenschap ontwikkeld zich en nieuwe onderzoekslijnen ontstaan. Om inzicht te krijgen van het wetenschappelijke landschap kan je een netwerk van woord associaties bouwen. Hieronder is een voorbeeld van hoe zo’n netwerk eruit kan zien.
Het model visualiseert trefwoorden uit wetenschappelijke publicaties en verbind deze op basis van de sterkte van hun associatie. Woorden die relatief vaak samen voorkomen hebben een sterke connectie en staan dichter bij elkaar. Deze woordclusteres kunnen helpen om onderzoekslijnen te identificeren.
Hoe lees je het netwerk?
Elk punt staat voor een woord dat minstens vijftien keer voorkomt. Je kan er voor kiezen om dit lager of hoger te maken, dan wordt het netwerk meer of minder complex. Wanneer het lager wordt vergroot je vaak het aantal ‘lege’ woorden. Het aantal trefwoorden (items) is in dit geval 56.
Een woord dat vaker voorkomt, heeft een grotere circel omtrek. Lichtvervuiling en vogel staan centraal omdat dit de woorden zijn waarop is gezocht in de database. Maar ook de koolmees (great tit), slaap en gedrag zijn veelvoorkomende onderzoeksrichtingen.
Elke lijn geeft aan dat er een associatie is tussen de woorden. Dat wil zeggen dat de woorden vaak samen gebruikt worden. De dikte van de lijn geeft de sterkte van de associatie weer.
Binnen het netwerk zijn ook clusters aan te wijzen. Een cluster in dit geval bestaat uit minaal tien woorden. Uiteraard is dit ook een keuze. Wanneer je dit aantal verlaagt, ontstaan er meer clusters. De keuze hangt af van de data en waar je naar op zoek bent.
In het voorbeeld zijn drie clusters te zien. Clusters die dicht bij elkaar staan zijn verwante of zelfs overlappende onderzoekslijnen. Er wordt vooral onderzoek gedaan naar het effect van lichtvervuiling in stedelijk gebied van de koolmees en pimpelmees (rood), maar ook effect op biologische klok (groen). Koolmezen en migratie staan zoals verwacht ver van elkaar verwijderd in het netwerk.
Waar komt de data vandaan?
De data van dit model komt van de zoekmachine Web of Science (WoS). Er is gezocht naar artikelen met de zoektermen “bird*” AND “light pollution” die zijn verschenen tussen 2016-2020. In totaal waren er meer dan 400 publicaties die hieraan voldeden en gebruikt in de analyse.
Het model gebruikt keywords die voorkomen in bijvoorbeeld de titel of de samenvatting van een artikel, maar ook keywords die de autheurs zelf aan de publicatie hebben toegevoegd. Woorden zijn dus indicatief voor het type onderzoek van de specifieke publicatie. Sommige veelvoorkomende woorden hebben weinig betekenis over het type onderzoek dat gedaan is. Hier zijn bijvoorbeeld een aantal typisch academische woorden zoals “responses”, “intensity”, “performance” en “patterns” weggelaten.