<img height="1" width="1" style="display:none;" alt="" src="https://px.ads.linkedin.com/collect/?pid=2085737&amp;fmt=gif">
Tema: BIGDATA

#0044: Big Data og geometrisk modellering

Gjest: Heidi Dahl

Seniorforsker of SINTEF Digital


Med Vert Inge Harkestad

I denne episoden av #LØRN møter Inge Harkestad seniorforsker Heidi Dahl, som forsker ved SINTEF Digitals avdeling for matematikk og kybernetikk. Heidi og Inge diskuterer blant annet faktorer vi bør være bevisste på og kritiske til, når det kommer til å gjøre beslutninger på grunnlag av algoritmer og Big Data. Som eksempler nevner Heidi potensielle situasjoner med beslutningstakere som mangler innsyn i algoritmer, utvikling av algoritmer uten innspill fra domene-eksperter og sluttbrukere, og faren for at vi kan komme til å ta avgjørelser med algoritmisk bias. I podcasten får vi også lære av Heidis ekspertise om Big Data og definisjonen av dette begrepet, eksempler på nærliggende teknologi den kan kombineres med som geometrisk modellering, samt Heidis refleksjoner rundt en etisk og positiv bruk av det verktøyet Big Data utgjør for samfunnet.
Full transcript (Available soon)

Hvem er du, og hvordan ble du interessert i big data?
Jeg jobber som forsker innen geometrisk modellering og dataanalyse, med fokus på big data eller stordata. Jeg begynte å jobbe med big data fordi en del big data-utfordringer har en underliggende geometrisk struktur, for eksempel nedbørsdata fordelt over et 3D-kart eller en MR-skann på sykehus. Geometriske metoder kan gjøre det enklere å trekke informasjon ut av dataene.

Hva gjør dere på jobben? 
En del av jobben er å samarbeide med industri-partnerne våre om å løse utfordringer de har og lede prosessen, slik at vi kan komme frem til hvilket spørsmål de ønsker svar på og hvilke data de har eller trenger for å finne løsningen. Den andre delen handler om å velge riktige teknikker for å løse oppgaven og utvikle nye algoritmer der det trengs.

Hva er egentlig big data?
På mange måter er komplekse data et riktigere uttrykk: Big data handler ikke bare om størrelse, men også om andre aspekter som fart og variasjon (på engelsk: «The 3 Vs»: volume, velocity, variety). 

Hvorfor er det så spennende?  
Fordi det er sterkt tverrfaglig. For vellykkede prosjekter trenger man å kombinere alt fra forretnings- og prosess-forståelse til domene-ekspertise og spisskompetanse på big data.

Hvorfor kan det være skummelt?
Mangel på innsyn i algoritmer, både for myndigheter og privatpersoner (Når algoritmer blir forretningshemmeligheter, hvordan kan man forsikre seg om at de fungerer slik de skal?). 

Ditt beste eksempel på big data? 
ANALYST. Der samarbeider vi med Rikshospitalet og Kartverket om å kombinere big data, kunstig intelligens og geometrisk modellering for å analysere og visualisere CT- og MR-data samt sonar-data fra havbunnen langs kysten av Norge.

Har du andre gode eksempler på big data, internasjonalt og nasjonalt?
Bekreftelsen på at Higgs-bosonet finnes – dataene som produseres ved CERN er virkelig big data, både i fart og størrelse. 

Hvordan funker det egentlig?
Big data-analyse er et verktøy. Men om det fungerer eller ikke, er ikke bare avhengig av at det tekniske fungerer – man må ha riktig verktøy for jobben som skal gjøres (se for eksempel bruk av big data / AI til straffeutmåling i rettssaker), og det må passe inn i helheten det blir brukt i (både når det gjelder prosesser og verdier).

Er det noe vi gjør her i Norge som er unikt?
I en Industri 4.0-sammenheng er det ekstra nyttig at vi (typisk) har en relativt flat organisasjonsstruktur med svært kompetente medarbeidere. Ved å bruke big data-metoder i produserende industri blir vi konkurransedyktige internasjonalt.

Refleksjonsspørsmål

Samle deg med en venn eller en kollega for å se om du klarer å svare på spørsmålet nedenfor.



Spørsmål:Algoritmer tar stor plass i dagens samfunn. Ofte kan man føle at datasystemer vet hvem vi er, og hva vi vil før oss selv. Mer vanlig blir det at algoritmer er med å ta avgjørelser mennesker har tatt fram til i dag. For eksempel vil algoritmer påvirke hvor lenge vi skal sitte i fengsel. Eller om vi skal få lån i banken, eller ikke. Med utgangspunkt i framtidens algoritmebruk, hvordan mener du samfunnet kan løse utfordringene knyttet til dette best mulig?   

!

Want to show off this case to your friends and coworkers?

Download summary (Available soon)
RESEARCH

This is what you will learn:

BigData AI 3 V´s Geometriske metoder
På mange måter er komplekse data et riktigere uttrykk. Big Data handler ikke bare om størrelse, det handler også om andre aspekter som fart og variasjon. På engelsk snakker man om, the 3 V´s – volume, velocity, variety. Komplekse datasett gir logistikk-utfordringer i databehandlingen, for eksempel om filene er så store at de må deles opp, eller at man vil trekke ut informasjon fra en kombinasjon av video og tekst. Ved å kombinere datakilder i analysen, finner man sammenhenger som ikke kommer frem om man ser på datakildene hver for seg.

- Heidi Dahl

This is SINTEF Digital

SINTEF er et av Europas største uavhengige forskningsinstitutter. SINTEF sine 2000 medarbeidere leverer anvendt forskning, teknologi, innovasjon, kunnskap og løsninger for store og små kunder over hele verden. SINTEF samarbeider med ledende universitet, bedrifter, institutter, industriklynger, oppstartsmiljøer og myndigheter, og utvikler prosjekter som kan utløse offentlig medfinansiering for deres kunder. SINTEF ble etablert i 1950 av Norges tekniske høgskole (NTH), som senere ble fusjonert inn i Norges teknisk-naturvitenskapelige universitet (NTNU).