Tekstit

Koneoppiminen ja väärien lajitunnistuksien löytäminen

Kuva
Laji.fi sisältää yli 50 miljoonaa lajihavaintoa, joista useat ovat aktiivisten harrastelijoiden ja kansalaisten keräämiä. Tämä suuri datamassa sisältää lähes varmasti joitain virheellisesti tunnistettuja lajeja, sillä usein lajien tarkka määritys on vielä aika hankalaa, eikä siihen tarvittavaa osaamista tai välineistöä ole jokaisella harrastelijalla. Myöskään ammattilaiset eivät pysty jokaista havaintoa tarkastamaan.  Siispä laadunparantamisen nimissä annotoijien eli havaintojen (usein vapaaehtoisten) tarkastajien työmäärää pitäisi jotenkin helpottaa joko tarkastamalla havainnot automaattisesti tai vähintäänkin rajaamalla tarkistettavien havaintojen määrä pienemmäksi.  Täysin vedenpitävä havaintojen luokittelu oikeaksi/vääräksi on hankalaa jo pelkästään biologian monimutkaisen luonteen vuoksi, mutta jonkinlaista vihiä voi päätellä havainnon sijainnin, päivämäärän ja lajimäärityksen perusteella. Esimerkiksi metsätähti tuskin kukkii tammikuussa Pohjois-Lapissa.  Yksinkertai...

Paikkatietotekoäly olisi hieno

Kuva
GeoAI:n tilanne Suomessa nyt Lähes jokaisella työpaikalla on viime vuosina puhuttu paljon tekoälyn mahdollisuuksista ja hyödyistä, mutta toki myös uhkista. Luontaisesti sama puheenaihe on toistunut vahvana myös paljon erilaista dataa hyödyntävällä paikkatietoalallä. Erilaiset tutkijat ja yritykset ovat lähes jokainen kehitelleet jos jonkinlaisia tekoälymenetelmiä, milloin satelliittikuvien analysointiin ja milloin liikennesuunnittelun optimointiin. Erilaisia ratkaisuja on huikea määrä, kuten myös erilaista paikkatietoa ja sen käyttökohteita. Esimerkiksi paikkatietokeskuksen tutkijat ovat kehitelleet syväoppimismenetelmiä tunnistamaan muutoksia ilmakuvista ja pistepilvistä, kirjanpainajakuoriaisten tuhoja metsistä ja GNSS-signaalin poikkeavuuksia isoista datamassoista. Yksityiseltä puolelta kehitteillä on ollut esimerkiksi kaavamääräysten digitalisointia ja indeksointia helpottavia tekoälymenetelmiä, maankäytön suunnittelun optimointimenetelmiä ja ylipäänsä erilaisten dataprosessien aut...

OGC API -paikkatietopalvelut

Monille avoimen paikkatiedon hyödyntäjille Web Feature Service (WFS), Web Map Service (WMS) ja muut vastaavat rajapintapalvelut ovat olleet päivittäisessä käytössä. Näiden jo 15 vuotta käytössä olleiden palveluiden kautta on haettu dataa milloin mihinkin tarkoitukseen. Palvelut ovat näppäriä, mutta internetin hektisessä maailmassa 15 vuotta vanha tekniikka alkaa olla jo vanhaa. Onneksi uusi vallankumouksellinen teknologia on kehitteillä - tai oikeastaan jo olemassa. Tällä hetkellä palvelut toimivat vielä usein rinnakkain, mutta muutaman vuoden päästä OGC API standardit korvaavat vanhemmat WFS ja WMS -rajapinnat. Vaikka muutos vaatii hieman uuden tekniikan opettelua, on siinä mielestäni pelkkää hyvää. Olen tässä muutaman kuukauden kirjoitellut aiheesta oppimateriaaleja ja uskallan sanoa, että tarvetta muutokseen on ollut. Käyttäjän kannalta useimmat standardit korvaavat lähes suoraan jonkun aikaisemman palvelun, kuten esimerkiksi: - WFS -> OGC API Features - WMS -> OGC API Maps - ...

Viime talven tuotos: Location Innovation Academy

Kuva
Alkuun varoitus, että tässä blogipostauksessa on hieman mainostekstin makua. Samaa tekstiä on julkaistu paikoitellen myös positio-lehdessä .  Oppimateriaaleja rakentamassa Kuten jotkut ehkä tietävät, olen Oulun yliopistolle tuottanut kurssimateriaaleja kolmelle eri GIS-kurssille. Nyt tämä homma on saanut jatkoa, mutta kansainvälisemmässä kontekstissa.  Viime syksynä aloitin työskentelemään GeoE3-projektissa  maiden rajoja ylittävien paikkatietoaineistojen ja -palveluiden, sekä aineistojen yhteentoimivuuden ja yhdistämise parissa. Yksi minun ja projektin oleellisimpia tuotoksia on ollut Location Innovation Academy -verkkokoulutusalusta. Syksyn ja talven aikana olemme tuottaneet Moodle-pohjaisen oppimisympäristön, jonka (toistaiseksi) viimeinen moduuli valmistui viime viikolla. Yhteensä tarjolla on jo kolme kokonaista ja kaikille avointa kurssia. 1. Ensimmäinen kurssi käsittelee datan hallintaa. Kurssilla opitaan esimerkiksi metatietojen merkityksestä ja paikkat...

Hackathonissa mentoroimassa

Kuva
Mun piti kirjoittaa tämä blogiteksti töissä englanniksi, mutta kirjoitinkin vahingossa suomeksi, joten tässä teillekin: Olin viime viikolla elämäni ensimmäisessä Hackathonissa mentorina. Tapahtuman haasteena oli kehitellä uusia innovaatioita ja ideoita älykaupunkeihin GeoE3-projektissa harmonisoitujen paikkatietoaineistojen avulla. Mentoreiden rooli oli tukea, tarjota näkökulmia ja boostata kilpailijoita kohti voittoa. Syötävien herkkujen lisäksi osallistujille oli tarjolla valmiiksi harmonisoitua ja yhteensopivaa dataa 3D rakennuksista, tiestöstä, ilmastosta, korkeusmalleista yms. Tällöin kilpailijoilla oli todella vapaat kädet ideointiin, ja yhteisenä rajoitteena oli lähinnä vain aika. Harvasta dataportaalista saa käsiinsä yhtä perusteellista dataa useammasta maasta yhtä aikaa. Hackathonin erityisyys oli nimenomaan paikkatietojen yhteentoimivuus eri valtioiden välillä. Osa tiimeistä tajusi tämän skaalautuvuuden ja hyödynsi sitä ideoissaan. Toisilta pointti taas meni hiema...

Onko avoin paikkatieto kansallinen turvallisuusuhka?

Kuva
Viimeisen vuoden aikana olemme ikävä kyllä päässeet todistamaan, kuinka suuressa osassa paikkatieto on nykyajan sodankäyntiä. Harva asia sodassa oikeastaan tapahtuu ilman mitään yhteyttä maantieteelliseen sijaintiin. Tuoreimpana esimerkkinä Ukrainan armeija löysi joukon venäläisiä sotilaita Makivijkasta heidän matkapuhelimien lähettämien sijaintitietojen perusteella. Tuloksena oli ohjuksia. Venäjän raaka hyökkäyssota ja infrastruktuurin loputon pommittaminen ovat saaneet Suomenkin viranomaiset miettimään, onko kaikenlaisen julkisen datan avoin julkaiseminen sittenkään se paras vaihtoehto. Avoimesta datasta on kieltämättä paljon hyötyä, mutta entä jos sitä käytetään väärin? Esimerkiksi tilastokeskus on julkaissut kaikkien tuotanto- ja teollisuuslaitosten sijainnit avoimesti saataville. Kuka tahansa pystyi ainakin aikaisemmin lataamaan netistä käsiinsä kaikki Suomen sähkö-, kaasu- ja lämpölaitokset. Eli juuri ne samat kohteet, joita Venäjä Ukrainassa pommittaa. Avointa dataa löytää myö...

Paikkatiedon laatu ei kiinnosta

Kuva
On kiehtova ajatus, että jokainen sana voi olla uusi sana, mikäli se laitetaan uuteen kontekstiin. Yleensä laadusta puhuttaessa ajatellaan jonkun asian tyyppiä, ominaisuutta tai erinomaisuuden tasoa. Kahvilaatuja on monia, mutta laatukahvi on mielipide, joka riippuu jokaisen mielenlaadun laatuvaatimuksista. Paikkatiedon yhteydessä laadusta tulee ensimmäisenä mieleen aineiston virheettömyys tai yksityiskohtaisuus. Data on siis laadukasta, mikäli se on riittävän tarkkaa, eikä sisällä ongelmia. Laatukirjallisuudessa (:D) paikkatiedon laatu usein määritellään datan käyttötarkoituksen mukaan. Paikkatieto on laadukasta, mikäli se sopii sen käyttäjälle. Fitness-for-use , sanovat monet. Tämä määritelmä kuulostaa pätevältä, erityisesti datan hyödyntäjän osalta. Monet standardit ja tutkimukset lisäävät tuohon määritelmään vielä mittarin mittaamaan aineiston ja tosielämän välistä suhdetta. Sen mukaan aineiston laatu on korkeaa, mikäli aineisto on täydellisesti datan määrittelyjen ( data model/sch...