OpenStreetMapin ja Maanmittauslaitoksen nimistöjen vertailu

Monet Lajitietokeskuksen lajihavainnoista ovat kansalaistiedettä ja vieläpä usein ei-teknisten ihmisten syöttämiä. Luontoharrastajien keski-ikäkin melko korkea. Tämä johtaa väistämättä vahinkoihin lajihavaintoja syöttäessä. Koordinaatit ovat asiantuntijoillekin monimutkaisia, ja saattavat helposti mennä väärin. Yksi keino havaintojen laadunvarmistamiseen on verrata koordinaatteja havaintoa tehdessä sanallisesti ilmoitettuun paikkaan. Jos luontoharrastaja on kertonut havaintonsa löytyneen Suomenlinnasta, mutta koordinaatit osoittavat Keravalle, jokin saattaa olla pielessä. Datan laadun kannalta se ei ole hyvä asia. Tätä ongelmaa lähdin ratkomaan vertaamalla sanallisesti ilmoitettuja sijainteja Maanmittauslaitoksen nimistöaineistoon ja Nominatim-geokoodauspalveluun , joka perustuu OpenStreetMapin paikannimiin. Nominatim-tietokannan asensin paikallisesti Dockeriin ( ohje ) ja vertailun tein Pythonin Geopandas ja Pandas -kirjastoilla. Ennen itse vertailua siivosin ilmoitetut paikan...