Bruker Big Data for å analysere bilder og video bedre enn menneskehjernen

Sikrere veier, rasovervåkning, miljøgevinster, bedre helsetjenester. Eksperter på Big Data ser en rekke nye muligheter innen avansert bildeanalyse og gjenkjenningsteknologi.


Av Andreas R. Graven

Maskinlæring Deteksjon av kanter på bilene, et ledd i å lære datamaskiner å skille dem fra andre objekter i et miljø. Her fra det sterkt trafikkerte veikrysset Danmarksplass i Bergen, der E39 går i nord-sør-retningen. (Foto fra Webkamera, Uni Research Computing)


– For at en datamaskin skal kunne drive avansert bildegjenkjenning, ligger et svært krevende arbeid bak. Du må etterligne menneskehjernens måte å skille vesentlig fra uviktig informasjon, sier Eirik Thorsnes i Uni Research.

Thorsnes leder en gruppe i selskapets satsing Centre for Big Data Analysis. Her utvikles strategier for bruk av big data innen både forskning og næringsliv. Og her utvikles avansert datakraft som kan jobbe på samme komplekse måte som menneskets hjerne.
 

Eirik Thorsnes
Gruppeleder Eirik Thorsnes, Uni Research Computing.

På mange områder vil  menneskehjernens fantastiske kapasitet og arbeidsmetoder fortsette å være datamaskinen overlegen. Men på noen områder vil datamaskinene gjøre ting bedre.

– De siste årene har det skjedd en enorm utvikling. Vi kan faktisk komme forbi det menneskelige nivået innen bildegjenkjenning og analyse. Datamaskiner blir jo aldri trøtte av å se nesten samme bilder, og kan være i stand til å fange opp selv de minste nyanser vi mennesker ikke ser. Å analysere store mengder bilder og video blir ikke bare lettere – mange prosesser i samfunnet kan forbedres og optimaliseres, sier Thorsnes.

Skille ut viktig informasjon i bildet

Sammen med kollegene i Centre for Big Data Analysis  ser Thorsnes for seg at bildegjenkjenning og -analyse vil bli viktig innen områder som for eksempel helse, miljøovervåking, havbunn-undersøkelser og satellittbilder.

Å bruke Big Data i bildeanalyse og -gjenkjenning krever en kombinasjon av god maskinvare, algoritmer (formler) og programvare, samt personer som klarer å se de riktige tilnærmingsmåtene.

– Behovet for denne typen teknologi vil bare bli større i årene som kommer, men dette er ikke «plug and play». Våre forskere har utviklet spesialkunnskap om hvordan enorme mengder data bør håndteres, og dermed hvordan kritisk viktig kunnskap kan avdekkes, sier Thorsnes.

Alla Sapronova
Forsker Alla Sapronova, Uni Research Computing.

Forskere på avdelingen Uni Research Computing utvikler datasystemer som lærer seg å gjenkjenne objekter, og hvilke objekter som er viktige å skille ut i bildet.

Alla Sapronova er ekspert på både kunstig intelligens, bildegjenkjenning og nettopp maskinlæring:

– Jeg lærer opp en datamaskinen slik man lærer et lite barn ting. Jeg viser maskinen mønstre av inn-signaler og forteller hva jeg forventer at ut-signalet vil være. Så gjentar jeg dette til systemet begynner å kjenne igjen mønstrene. Så viser jeg fram et inn-signal, for eksempel et bilde, som systemet ikke har sett før, og tester om systemet forstår hva det er, sier Sapronova.

På et relativt enkelt nivå har slik maskinlæring for eksempel resultert i teknologi som smil-gjenkjenning for mobilkameraer.

Autistiske barn i musikkterapi

Mer avanserte anvendelsesområder vil blant annet være innen medisin, med analyse av ytre kroppslige sykdomstegn, eller påvisning av positive/negative situasjoner i konsultasjoner med terapeut.

– Vi har hatt et pilotprosjekt med GAMUT, der det er gjort videoopptak av autistiske barn i musikkterapi. Vanligvis vil terapeuten bruke mange timer på å gjennomgå opptakene, for å identifisere akkurat det ene minuttet som best viser status eller framgang hos pasienten.

–  Men ved å lære maskinen hva som er et interessant øyeblikk, vil den finne og velge ut slike, uten at maskinen så langt i utviklingen kan gradere dem. Det finnes potensial for videreutvikling i et senere prosjekt, sier Thorsnes.

I et annet prosjekt har forskerne brukt et offentlig tilgjengelig webkamera på Danmarksplass, Bergens mest trafikkerte veikryss, som utgangspunkt for å lære datamaskiner å registrere hvor mange, og hvilke typer, kjæretøyer som passerer i løpet av døgnet.

Det offentlig tilgjengelige webkameraet ved Danmarksplass (fra BTs samleside) som forskerne har benyttet seg av: 


Slik er det mulig å se trafikkmønstre, som kan brukes i planlegging og beslutningsstøtte. På Danmarksplass er luftkvaliteten også tidvis veldig dårlig i vinterhalvåret, og Thorsnes utelukker ikke at bedre kartlegging av trafikken også gir et utgangspunkt for miljømessige forbedringer.

Men han mener at foreløpig ligger det største potensialet innen bildeanalyse i trafikken i sikkerhetsaspektet. For eksempel handler dette om å overvåke utvalgte veistrekninger eller tuneller,  Blant flere muligheter vil da være å kunne påvise biler i feil kjøreretning, branntilløp, forlatte biler, eller personer inni tuneller.

– Det vil dessuten være mulig å få datamaskiner til å overvåke rasutsatte fjellsider på viktige veistrekninger, og lære maskinene opp til hvilke endringer i landskapet kan tilsi økt rasfare, sier Thorsnes.

Overvåke forekomster av rømt oppdrettsfisk

Uni Research Computing og Centre for Big Data Analysis, som har forskningsdirektør Klaus Johannsen i sjefsstolen, har også hatt et prosjekt der de har kartlagt bevegelser til laks og ørret ved en elvemunning. Dette arbeidet har skjedd i samarbeid med en annen avdeling i selskapet, Uni Research Miljø.
 

Forskningsdirektør Klaus Johannsen, Uni Research Computing (Foto: Marit Hommedal) 



– Et kamera har vært plassert ut ved munningen, og datamaskinen har blitt opplært til å registrere hva slags fisk som passerer, og om det er snakk om villfisk eller oppdrettsfisk. Slik kan man blant annet overvåke forekomster av rømt fisk fra oppdrettsanlegg, sier Thorsnes. 

I tillegg til de nevnte involverte i Uni Research Computing, har også forskningsassistent Miles Granger (nå i Webstep AS) hatt viktige bidrag til prosjektene.  

Noe av grunnen til at gjenkjenningsteknologien har vært på full fart fremover de siste årene, er det Thorsnes kaller en gjenoppdagelse av algoritmer for kunstig intelligens: At industriens behov og noen gode, gamle ideer innen kunstig intelligens fant hverandre samtidig som massiv datakraft og grafiske prosessorer fra spillindustrien ble tilgjengelig til bruk i analysene.

–Tradisjonelt har slike analyser blitt utført av personer som ser timevis med video, for eksempel medisinske analyser eller trafikken i tuneller, sier Thorsnes.

Algoritmene som fikk en ny vår befant seg innen det som i dag kalles «deep learning», fordi man nå har nok datakraft gjennom prosessoren og tilgjengelighet på interessant materiale til å kunne lære opp mer avanserte og ”dypere” algoritmer.


28. mars 2017 12:27

Personer involvert

cp: 2017-10-22 20:15:42