Paikkatietotekoäly olisi hieno

GeoAI:n tilanne Suomessa nyt

Lähes jokaisella työpaikalla on viime vuosina puhuttu paljon tekoälyn mahdollisuuksista ja hyödyistä, mutta toki myös uhkista. Luontaisesti sama puheenaihe on toistunut vahvana myös paljon erilaista dataa hyödyntävällä paikkatietoalallä. Erilaiset tutkijat ja yritykset ovat lähes jokainen kehitelleet jos jonkinlaisia tekoälymenetelmiä, milloin satelliittikuvien analysointiin ja milloin liikennesuunnittelun optimointiin. Erilaisia ratkaisuja on huikea määrä, kuten myös erilaista paikkatietoa ja sen käyttökohteita.

Esimerkiksi paikkatietokeskuksen tutkijat ovat kehitelleet syväoppimismenetelmiä tunnistamaan muutoksia ilmakuvista ja pistepilvistä, kirjanpainajakuoriaisten tuhoja metsistä ja GNSS-signaalin poikkeavuuksia isoista datamassoista. Yksityiseltä puolelta kehitteillä on ollut esimerkiksi kaavamääräysten digitalisointia ja indeksointia helpottavia tekoälymenetelmiä, maankäytön suunnittelun optimointimenetelmiä ja ylipäänsä erilaisten dataprosessien automatisointeja. Ja lisää GeoAI-menetelmiä on tulossa koko ajan.

Mitä tulevaisuudessa?

Vaikka monet suomalaiset GeoAI-ratkaisut ovatkin erinomaisia ja vastaavat paikkatietoalan keskeisiin haasteisiin, kokonaisuutena niiden kehitys jää valitettavasti vielä jälkeen erityisesti Yhdysvaltojen ja Kiinan vastaavista innovaatioista.

Suomessa suurin osa suomalaisista menetelmistä keskittyy vielä varsin rajattuihin ongelmiin, käsitellen yhtä mallia ja yhtä harjoitusdataa kerrallaan. Hitauden taustalla on monia syitä, kuten asiantuntijoiden vähäinen määrä, riittävän laadukkaan opetusdatan puute tai vain yksinkertaisesti resurssit.

Seuraava selvä askel GeoAI-maailmassa voisi olla spatiaalisen autokorrelaation laajempi ja syvempi hyödyntäminen, jota muualla maailmassa jo pohditaan. Tällöin opetusaineistona voitaisiin käyttää monipuolisesti erilaisia paikkatietoaineistoja, aivan kuten ChatGPT käyttää monipuolisesti dataa internetistä riippumatta sen muodosta tai formaatista. Spatiaalisen autokorrelaation avulla GeoAI-mallit voisivat ymmärtää paitsi datan sisältöä, myös sen spatiaalisia suhteita ja riippuvuuksia, mikä avaisi uusia mahdollisuuksia, joita ei välttämättä ole suoraan määritelty tekoälyn kouluttamisvaiheessa.

Kuva 1. Multimodaalisen geofoundation mallin mahdollista aineistoa (lähde: GeoFM: Foundation Models for Geospatial Artificial Intelligence)

Esimerkkinä tällainen ”multimodal geofoundation model” saattaisi analysoida satelliittikuvista rakenteita ja muotoja, poimia tietoa tekstiraporteista tai tapahtumista alueella ja yhdistää niitä sensoridataan. Tällöin mallit voisivat ottaa yhä useampia asioita huomioon ja toimia tavallaan generatiivisina yleismalleina maantieteellisille alueille. Malli voisi tuottaa entistä tarkempia ennusteita, arvioita ja skenaarioita niin nykytilasta, kuin tulevaisuudestakin.

Monille voi tulla aiemmasta kuvauksesta mieleen muut paikkatietoalan hypesanat, kuten metaverse, digitaaliset kaksoset tai data-avaruudet. Tällöin herää kysymys, mikä on tekoälyn rooli digitaalisissa kaksosissa tai data-avaruuksissa, vai voiko systeemejä edes rakentaa ilman pohjalla toimivaa tekoälyrakennetta? Kuinka paljon turhaa työtä me ihmiset teemme, jonka voisi myös sysätä tekoälylle?

Toistaiseksi meillä on vasta ChatGPT

Parhaimmassa tapauksessa tekoäly hakisi datoja eri rajapinnoista, integroisi niitä valmiksi halutulle alueelle ja palauttaisi käyttäjälle ainoastaan vastauksen haluttuun ongelmaan. Ihan vielä tällainen ei ole todellisuutta. Ehkä parhaan, mutta valheellisen illuusion tällaisesta toiminnasta antaa meidän vanha tuttu, eli ChatGPT.

Kuva 2. ChatGPT:n vastaus vaikeaan kysymykseen.

Käyttäjä voi kysyä ChatGPT:ltä esimerkiksi, ”How many churches there are in Helsinki?”, ja tekoäly vastaa parhaan kykynsä mukaan. Tällöin vastaukseksi tarjotaan 80, joka ei ole laisinkaan huono arvio. Todellinen luku on noin 66 kirkkoa tai muuta uskonnollista tilaa Helsingin palvelukartan mukaan vuonna 2024. Lisäksi kirkkojen määrä on vähentynyt viime vuosina, joten arvio on ainakin parempi kuin useilla ihmisillä.

Kyselyä voi jatkaa pyytämällä kirkoista koordinaatteja GeoJSON-tiedostona, jonka syntaksia ChatGPT ymmärtää virheettä. Tuloksia voi siis suoraan katsella vaikka QGIS:sä, joskin pienet koordinaattimuunnokset saattavat olla tarpeen.

Kuva 3. ChatGPT:n vastaus GeoJSON formaatissa.

Kuva 4. Sinisellä palluralla oikea Uspenskin katedraali, punaisella ChatGPT:n antamat koordinaatit

Koordinaattien osalta heittoa on jokaisen kirkon kohdalla muutama sata metriä, mutta kaupunginosa osuu yllättävän hyvin oikeaan. Yllä olevassa kuvassa sininen pallura on kirkon oikea sijainti ja punainen ChatGPT:n arpoma. Olisi mielenkiintoista tietää, miten tällaisiin tuloksiin on päädytty.

Tietenkään ChatGPT ei oikeasti ymmärrä koordinaatteja puhumattakaan koordinaattijärjestelmistä, mutta joihinkin käyttötapauksiin likimääräisyys voi olla riittävä. Yhtenä merkittävämpänä etuna tulee mieleen kielimallin riippumattomuus lähdemateriaalin kielestä. Jos tarkkuus- ja laatuvirheet annetaan anteeksi, kirkkojen sijaintia voi kysyä vaikka kiinaksi.

Mielenkiintoista lisälukemista

Joka tapauksessa matkaa oikeasti toimiviin ja helposti käytettäviin GeoAI-ratkaisuihin on vielä kuljettavana. Allekirjoittanut ei ole mikään tekoälyasiantuntija, joten uusia ajatuksia aiheesta saa lähettää vaikka linkkarissa. Tekoälyn maailmanvalloitusta odotellessa aiheesta voi lukea mm. seuraavista artikkeleista:

Keler, A., & Krisp, J. M. (2023). Geodata Generation and Enrichment via ChatGPT for Location Based Services (LBS).

Xie, Yiqun, et al. "Geo-Foundation Models: Reality, Gaps and Opportunities." Proceedings of the 31st ACM International Conference on Advances in Geographic Information Systems. 2023.

Tämä blogipostaus on myös julkaistu englanninkielisenä artikkelina Positio-lehdessä hieman erilaisena 27.3.2024.

Hae tästä blogista

Alpon paikkatietoblogi