Tietämyksen ja Internetin uusi oliomalli

Internetissä, asiantuntijatiedoissa on paljon saman toistoa eri lähteissä. Olisi koottava yhteinen tietämys, poistettava saman tiedon toisto, virheellinen ja epävarma tieto, selkeytettävä ilmaisuja. Kun saataisiin samojen faktojen kokoelma, sinne eri toimijat voisivat linkata tehdessään kotisivuja. Ja myös sieltä ylätasolta voitaisiin mennä alatasoille syvällisempiin ja eri toimijoilta saataviin tietoihin ja heidän tarjoamia hyödykkeitä katsomaan. Myös peruskuvamateriaali voisi olla yhteistä. Kukin toimija tuottaisi tiedoista ja kuvista vain sen osuuden, missä heidän tietonsa eroavat perustiedoista. Eri toimialoillakin on yhteisiä perustietoja ja hekin voisivat käyttää samoja tiedonpalasia. Jos tiedot jaetaan osatietojen palasiin, niistä voisi koota erilaisia yhdistelmiä.

Tietämyksen ja Internetin uusi oliomalli. Klikkaa suurennos!

Esimerkiksi suomenkielinen lääketieteellinen ja ympäristöllinen tieto voitaisiin yhdistää yhteen tietovarantoon, johon voitaisiin vielä täydentää ulkomaisista lähteistä saatavilla ja suomeksi käännetyillä tiedoilla. Siinä yhteydessä voisi tarkistaa tiedon, mitkä ovat faktoja. Eri tilanteissa ja tapauksessa voi olla eri fakta. Tietorakenne pitäisi rakentaa tekoälyohjelmat ja looginen päättely huomioiden: Jos on näin, niin on niin. Tämän todennäköisyys on esim. 50% jne. Kun tieto olisi tiivistetty, sitä olisi nopeampi  hakea, lukea ja ymmärtää. Tietoja pitäisi koko ajan päivittää, tällöin tarvitsisi tehdä se vain yhteen paikkaan. Julkisen talouden laitokset ainakin voisivat yhdistää yhteiset samat tiedot. Samoin saman alan yksityiset toimijat voisivat yhdistää yhteisen perustietämyksensä, mutta kilpailun säilyttäminen voi estää, tulisi monopoleja. Kuitenkin yhteiskunnan kannalta olisi hyvä, ettei tuhlattaisi voimavaroja moninkertaiseen samaan työhön tietovarantojen tekemisessä, vaan niistä säästyvät resurssit voisi käyttää johonkin muuhun.

Samoin yrityksistä, toimijoista, tahoista, voisi olla vain yksi hakemisto ylä- ja  alaportaaleissa. Tätä eivät kuitenkaan eri kilpailijat hyväksyne, jokainen haluaa tuottaa omanlaisensa ja hakemistopalvelujen tuottajiakin on useita kilpailijoita. Vaikka he menettäisivät tulojansa tältä alueelta, he voisivat keskittyä johonkin muuhun. Tietojen hyödyntämiseen ja hakemiseen tarvitaan paljon tekoälysovellusten kehittämistä ja sitä helpottaisi, kun olisi koottu yhteinen tietovaranto, jota tekoäly hyödyntää. Yhteisen  perustietovarannon luontiin tarvittaisiin useiden toimijoiden yhteistyötä. Idea olisi, ettei samaa työtä tarvitsisi kenenkään tehdä moneen kertaan.

Tarvittaisiin kokonaan uusi Internet, jossa kaikki tiedot olisivat vain yhteen kertaan. Tietenkin pitäisi olla moninkertaiset varmistukset ja kopioinnit, ettei tietoja pääsisi onnettomuustilanteissa katoamaan. Ongelmana tietojen kokoamisessa ja yhdistämisessä on se, etteivät kaikki ole yhtä mieltä tietojen totuusarvoista eikä kaikkia toimijoita saada yhteistyöhön. On paljon epävarmaa ja kokemusperäistä tietoa, mikä on joissakin tapaukissa totta toisissa ei. Tietojen kokoaminen, muokkaus, tarkastaminen ja jäsentely vaatii aikaa, rahaa, puolueettomia asiantuntijoita tarkistamaan tietojen pätevyyttä. Ainakin pienimuotoisesti voitaisiin tämä idea toteuttaa esim. käyttäjäystävällisyyttä ajatellen. Jos rajataan tieto, johon vain keskitytään. Ongelmien ratkaisussa ja kehittämisessä tarvitaan vain siihen liittyvä tieto: Syyt, ongelmat, kehitystarpeet, ratkaisut ja niiden riskit, hyvät ja huonot puolet. Mutta kuitenkin sekin tieto paisuu suureksi, koska ongelmat liittyvät suoraan tai välillisesti kaikkeen muuhunkin. Tavalliselle käyttäjille pitäisi olla yksinkertaistettu ja suppeampi tieto, asiantuntijoille tulisi olla yhteinen syvällisempi ja laajempi tieto saatavilla. Ongelmana voi olla myös tekijänoikeuskysymykset, on paljon koottua tietoa tekijänoikeuden alaisena, joista runsas ottaminen vaatii lupaa ja tekijänoikeusmaksuja. On myös ammattisalaisuuksia ja salaista tietoa, jota ei voi antaa ja vielä ilmaiseksi kaikelle yleisölle. On määriteltävä tiedot, mikä on tekijänoikeuden alaista ja kenelle kuuluu tekijänoikeudet silloinkin, kun tiedot yhdistetään ja muokataan. Jos toimijat linkkaavat yhteisiin tietoihin, heidän pitäisi maksaa siitä tahoille jotka ovat koonneet tiedot ja ylläpitävät tietoja. Hyvin tiivistetty, yksinkertainen, monista eri lähteistä koottu perustieto, kun lähdetiedot on merkitty on mahdollista ja kokoojille kuuluu koosteesta tekijänoikeus. Siis tällaisen tietämyksen oliorakenteen tekemiseen tarvitaan eri tahojen yhteistyötä ja sopimuksia kustannusten, tulojen jaosta ja tekijänoikeuksista.

Itse tietämykseen, kielen ilmaisuihin perehtyminen, miten tietoa jäsennellään ja laitetaan olioiksi vaatii paljon tutkimista, aikaa ja kehittelyä, lauseiden standardointia, koska sama asia voidaan ilmaista monenlaisilla lauseilla. Myös kun sama lause laitetaan eri yhteyteen,  se voi olla jo eri tieto. Lauseet ovat siis sidottu asiayhteyteen samoin kuin sanatkin ja niiden merkitys voi olla toinen eri yhteyksissä. Tieto täytyy myös arvioida merkitsevyyden, tärkeyden, painoarvon suhteen, mitä otetaan mikä voidaan jättää pois. Varsinkin vapaamuotoisessa tiedossa voi olla paljon täytesanoja ja -ilmaisuja, mikä tekee luettavasta luontevamman ja miellyttävämmän. Faktoina niiden tietosisältö voitaisiin esittää lyhyemmin, mutta se voi olla luettelomaista ja töksähtävää. Sama tieto voi toisille olla merkitsevämpää kuin toisille. Tässä tulee myös ihmisten eri asioiden ja tyylien arvostus, millaista tekstiä he mieluiten lukevat, mikä on kullekin selkeimmin sanottu. Asiantuntija voi ymmärtää puutteellisestakin alansa tekstistä, mutta henkilölle, joka ei tiedä asiasta vielä mitään, joutuu selittämään juurta jaksain, koska perustietämys ja käsitteiden ymmärrys alalta puuttuu.

Kun yläportaaliin ei koota kuin vain hyvin lyhyet tiivistelmät vakiintuneista perustiedoista, niihin ei ole enää tekijänoikeutta muilla kuin tiivistelmän tekijällä. Ja kun tiivistelmistä saadaan linkit eri toimijoiden ja tiedon antajien kotisivuille, niin näistä linkeistä avautuvien sivujen omistajat ovat vastuussa syvällisemmästä tiedostaan sekä tekijänoikeuksien kuin luotettavuuden suhteen. Kuitenkaan näin ei ihanteellinen tietämyksen ja internetin oliomalli toteudu.

Tekoäly kehittyy, tarvittaisiin hyviä tietovarantoja niille. Sopivien, laajojen tietovarantojen luominen vaatii useita tahoja, aikaa, rahaa, osaamista. Hyvät tietovarastot ja hyvin kehitetty tekoäly yhdessä mahdollistaisivat nopeampia ja parempia palveluita. Mutta niissäkin on vaara vääristää päätöksentekoa, koska tiedot ja ohjelmat eivät koskaan ole täydellisiä ja ihmisen on lopulta kuitenkin arvioitava päättelyn ja automaattisten valintojen tuloksia. On tiedettävä mihin tietoihin tulos perustuu, onko tulos tullut puolueellisten tai epävarmojen tietojen pohjalta ainakin osittain.

Veikko J. Pyhtilä, 6.9.2017