Velg en side

Status AI og maskinlæring i den norske labbransjen

17. jun. 2020 | Blogg

Min personlige mening: Status AI og maskinlæring i den norske labbransjen, og SINTEF Norlabs veikart (pluss hvordan komme i gang med AI på privaten)

 

Jeg har ansvar for utrulling av digitale produkter og tjenester i SINTEF Norlab, inkludert AI-baserte produkter og tjenester.  Jeg har gjort opp status, etter ni måneder i jobben, og jeg kan med en viss skuffelse i stemmen si at AI/maskinlæring i den norske labbransjen er stusselige greier, på vegne av SINTEF Norlab og på vegne av hele bransjen.

I denne bloggen skal jeg oppsummere noen observasjoner jeg har gjort i denne tidsperioden om bruk av maskinlæring i labbransjen i Norge, si litt om SINTEF Norlabs veikart og aspirasjoner innen dette området, og gi noen praktisk tips om hvordan komme i gang med AI på liten eller stor skala.  (Jeg vil i det følgende bruke AI og maskinlæring om hverandre, selv om maskinlæring bare er en del av AI som fagfelt.)

Først litt status om AI-bransjen i Norge: Det er ca. 5 300 mennesker som fanges opp i søket ‘machine learning’ + lokasjon: Norway i LinkedIn.  Av disse er 1 200 i vertikalen ‘IT & services’, 946 i ‘computer software’, 548 i ‘research’, 393 i ‘oil & energy’, 388 i ‘higher education’, og 34 i ‘hospital & health care’.  Det er nøyaktig 0 i den norske labbransjen; jeg har kun sjekket ALS, Eurofins, Intertek West Lab, SINTEF Norlab, Synlab, og det tas forbehold om at kanskje noen som ikke er fanget opp (vår administrerende direktør hadde nok meningsfylt kunne oppdatert sin LinkedIn-profil slik at ville blitt fanget opp av søket).

Jeg har også gjort samme søket (altså ‘machine learning’ + utvalgte nåværende arbeidsgivere: de samme store labselskapene), men uten begrensning til Norge.  Det kommer opp 10-20 per av de store lab-selskapene, kanskje flest innen selskaper med stor virksomhet rettet mot farmasøytisk industri.  Ikke mange i selskaper som har 10 000-50 000 ansatte.  Jeg har også gjort søk i rekrutteringsannonser.  F.eks. Eurofins synes å rekruttere noe til direktør-nivå stillinger innen maskinlæring, se til venstre, men i lite omfang.

Oppsummert: Vi i labbransjen ser ikke ut til å ha tatt innover oss hva kunstig intelligens kommer til å gjøre med bransjen vår (se min referanse under til R. Susskinds «The Future of the Professions«).

Så kan man selvsagt innvende at ikke så rart, her er det ISO/IEC 17025:2017 som gjelder og spesielt seksjon 7.2–Selection, verification and validation of methods.  Utfordringen er selvsagt validering (adekvat for formålet; riktig kjemi) og verifikasjon (iht. spesifikasjoner; riktig resultat).  Maskinlæring er ikke-standard metode, så man må forvente betydelig innsats med V&V (Validation & Verification). Det sagt, man hadde samme diskusjonen i medtech om testing (in vivo eller in vitro) vs. modellering (in silico) ifm. FDA-godkjenning (Federal Drug Agency).  Trenden i dag er mot modellering.  Og før det har den globale bilindustrien og flyindustrien gått gjennom samme transisjonen, fra testing til modellering, fra rundt 1970-1980 til i dag.  Det sagt, FEA (Finite Element Modelling), CFD (Computational Fluid Dynamics) og FSI (Fluid Structure Interaction) er fysikkbaserte i utgangspunkt, som gjør validering enklere, mens maskinlæring er teorifri.  Så kan man selvsagt innvende at AI i labbransjen ikke handler om selve målingen, men om rådgivningsbiten eller tjenestebiten på toppen av selve målingene.

En annen hindring er knyttet til verdiskapingen i labbransjen.  Det kan argumenteres for at dels knyttet til selve målingene i felt (f.eks. en støvbøtte; SINTEF Norlab har en stab på 20 måleteknikere), dels knyttet til analysen av de samme målingene (f.eks. i form av et feltinstrument eller et labinstrument).  Den etterfølgende rådgivingen, som kanskje kan automatiseres med maskinlæring, utgjør i praksis en mindre del av verdiskapingen.

En tredje hindring for bruk av maskinlæring i labbransjen handler om eierskap til data.  I labbransjen har man aldri tenkt på måledata som noe verdifullt, det var noe labbransjen samlet inn på liten skala og prosesserte, og ble tenkt på som eid av klienten.  Man hadde på sett og vis ikke noen rett i labbransjen til å utnytte disse utover for rapportering til klient.  Problem #1 er at maskinlæringsbasert monetisering av data krever store datamengder, kanskje på tvers av klienter.  Problem #2 er at læring krever en eller annen form for rettigheter eller eierskap til dataene.  Problem #3 er at eierskap til dataene i hvert fall krever eierskap til sensorene, og det er problem når sensoren er en IIoT-basert sensorinfrastruktur permanent installert hos klient (og ikke et feltinstrument i hånden på SINTEF Norlabs måletekniker).

I SINTEF Norlab erkjenner vi at disse hindringene vil gjøre at labindustrien vil bruke tid på å få kunstig intelligens og maskinlæring inn som en del av den etablerte verktøykassa, men tror at det er snakk om når, ikke om.  Det er dog ikke åpenbart hvem som vil cashe ut verdien (= inntekter – kostnader) knyttet til AI-relatert verdiskapning i de verdikjeder labselskapene er en del av, hvorvidt sluttbrukere, labselskaper, AI tjenesteleverandører, eller AI teknologileverandører.

La oss starte med hva vi kan lære av andre industrier: Jeg har i et antall sammenhenger sammenlignet labindustrien med revisorbransjen (krav til sertifiseringer, krav til utdanning, standarder, etablert metodikk).  En slik sammenligning indikerer at labbransjen vil klare å beholde en stor del av verdien knyttet til den AI-relaterte verdiskapningen i de verdikjeder labindustrien er en del av (kilde: anekdotisk evidens på partnernivå).  En slik sammenligning indikerer også at taperne i labbransjen vil bli de selskapene og de ansatte som ikke klarer å utnytte ny teknologi.

La oss så bli konkrete: Det er opplysende å se på antall dataforskere i to store selskaper, det ene et stort energiselskap, det andre et stort labselskap og med all sannsynlighet betydelig leverandør til energiselskapet.  Energiselskapet har 115 dataforskere, av 29 500 ansatte, dvs. 39.0 dataforskere per 10 000 ansatte.  Labselskapet har 20 dataforskere, av 47 000 ansatte, dvs. 4.3 dataforsker per 10 000 ansatte.  Dvs. at labselskapets troverdighet, både i relative og absolutte termer, må sies å være forholdsvis begrenset i en diskusjon om hvem som kan bidra til AI-relatert verdiskapning i energiselskapets verdikjeder.

Vi i SINTEF Norlab tar disse utfordringene på alvor, for å forbli relevante, unngå helkommodifisering, og beholde våre marginer.  Nye anvendelsesområder inkluderer autonome droner som overflyr store områder på jakt etter utslippspunkter diffuse utslipp, maskinlæringsbasert tolkning av kamerabaserte data, automatisk rapportgenerering, og korrelasjon av utslippshendelser med driftshendelser.  På vårt veikart for 2020 står blant annet: i) dronebasert deployering sensorpakker; ii) kamerabasert deteksjon av diffuse utslipp metallurgisk industri vha. maskinlæring; og iii) standardisert IIoT-pakke for overvåkning av luftkvalitet.  Vi har også en bred FoU-portefølje, inkludert HMS-løsninger for gruvedrift og smart garments (Dig_IT H2020 prosjekt, se beskrivelse til høyre).  For mange av disse prosjektene er AI og maskinlæring en muliggjørende teknologi.

Det sagt, vi kommer aldri til å bli komplett AI-leverandør til våre tradisjonelle labklienter.  Det finnes et antall slike norske kompetansemiljøer, fra forskningsinstitutter som SINTEF Digital, til små kommersielle aktører som Intelecy, til store kommersielle aktører som Arundo, Cognite, DNV GL, og Kongsberg Digital.  Vi jobber gjerne med slike teknologipartnere for å bygge bro mellom sensorikk og automatisert tolkning, fordi domenekunnskap (ja, vi kan kjemi, sensorikk, og labindustriens metoder og standarder) er viktig for validerte og verifiserte anvendelser av kunstig intelligens iht. ISO/IEC 17025:2017 (TBC; jeg har ikke selv sett slike).  Jeg kan nås på epost grim.gjonnes@sintefnorlab.no for diskusjon om slike muligheter.

Hvis du som leser av denne bloggen har lyst til å begynne med maskinlæring på privaten, så vil jeg anbefale en av flere maskinlæringspakker skrevet i R fra R Foundation for Statistical Computing, si neuralnet fra CRAN, eller tilsvarende for Python.  Terskelen er forholdsvis lav.  Og det er fullt mulig å benytte slike R- og Python-pakker i produksjonsomgivelser.  Og så bør du/dere sørge for å rekruttere en eller flere dataforskere.  De aller fleste større organisasjoner vil i løpet av få år han en eller flere dataforskere i staben (som sagt, Equinor har 39).

Og til slutt, hvis du lurer på hvem R. Susskind er og hva AI/maskinlæring er i ferd med å gjøre med andre tunge profesjoner, så som revisjon, juss, og medisinske spesialiseringer, men også med labbransjen, så anbefaler jeg R. Susskind: «The Future of the Professions» med undertittel «How Technology Will Transform the Work of Human Experts» (til venstre).

Lykke til med ditt første AI-prosjekt!

P.S. Jeg startet skrivingen av denne bloggartikkelen med å lese Teknologirådets anbefalinger om en AI-strategi for Norge, se https://teknologiradet.no/wp-content/uploads/sites/105/2018/11/AI-and-machine-learning-1.pdf.  Ikke gjør det: 1) Ekspertutvalget som stod bak rapporten om AI, bestod av seks meritterte fagfolk fra ledende forskningsmiljøer i Norge, hvorav fem kom fra helseforskning, ikke en kom fra tunge industrimiljøer.  2) Personlig fikk jeg vel i denne rapporten bekreftet alle mine fordommer om intellektuell slapphet i myndighetsdrevet strategiutforming.  3) Å prøve AI på egenhånd og i praksis er en metodisk bedre tilnærming enn lesing av utdaterte rapporter.

Grim Gjønnes
Utviklingssjef, SINTEF Norlab