«Big data» – 90% av alle data i verden har kommet de siste to årene


big-data

Stadig mer data blir tilgjengelig på nettet. Hver og en av oss produserer og gir fra oss data om oss selv hele tiden. Enten ved at vi beveger oss passivt rundt – og atferden vår registreres via kamera eller kortbruk. Eller at vi logger oss på en pc og surfer på nettet. Dette har gjort at mange nettselskaper, f.eks. Google og Facebook, vasser i data som de kan stille sammen og utnytte. Er det bra?

Hva er «big data»

Begrepet «big data» refererer til store mengder innsamlede brukerdata fra datakilder som f.eks. data om søk i Google, profildata fra Facebook, bompengeringens passeringer, bankkundenes bruk av kort o.l. datakilder. Enkelt fortalt er Big Data en datamengde så stor at den ikke lar seg behandle av tradisjonelle databaser eller prosessystemer.

Alle elektroniske spor vi legger igjen i løpet av en dag, via sosiale medier, SMS-er, telefonsamtaler, googling, nettkjøp og lignende er en slik datamengde. «Big data» refererer med andre ord til data om enkeltindivider, grupper og perioder, som er kombinert eller slått sammen til større grupper eller lengre tidsperioder. Når vi snakker om «big data» så snakker vi ikke om rådataene, men om sammenstilling av store mengder rådata for å se mønstre, andeler og resultater av ulike slag.

«Big data» eksplosjonen vil bare fortsette

I de siste 10 årene har vi sett flere oppfinnelser enn de foregående 10.000 årene, og 90% av alle data som finnes i verden er generert de siste 2 årene. En utvikling som har blitt drevet av spredningen av smarttelefoner og nettbrett de siste årene. Trenden går nå mot å knytte stadig flere digitale enheter til Internett. Det være alt fra kjøleskap, kameraer og alarmanlegg, til strømmålere og  dagens PCer, nettbrett og smarttelefoner.

Utviklingen går fort og det forventes en 3 dobling av datatrafikken på Internett de neste 5 årene. Og med den kommer stadig flere «big data» aktører, og nye muligheter til å samle inn, lagre, organisere, sammenstille og trekke konklusjoner ut fra disse datakildene.

«Big data» gir nettselskapene konkurransefortrinn

Store nettselskaper som Google og Facebook har for lengst bygd opp store forskningsavdelinger som analyserer og utnytter disse dataene på ulike måter. Facebook bruker f.eks. dataene til å gi deg «målrettet  reklame», «finne nye venner», «prioritering av nyhetsstrømmen» o.l. Yahoo Mail skanner all mail du sender og mottar, og bruker denne informasjonen til å avdekke spam, phirsing, maleware og til å gi deg målrettet reklame når du logger deg på. Det samme gjør Microsoft. Såvel Google som Facebook selger dessuten denne innsamlede informasjonen om sine brukere og deres surfevaner til sine annonsører for å få dem til å benytte sine markedsføringsbudsjetter hos dem.

Petter Bae Brandtzæg ved SINTEF IKT, sier disse «big dataene» gir disse nettselskapene flere store konkurransefortrin.

– Fortrinnet deres er at de sitter på enorme datamengdene som andre samfunnsforskere bare kan drømme om, sier han.

Men også SINTEF-forskerens hverdag har endret seg. Det finnes muligheter for å få tak i “big data” selv om man ikke jobber i et stort nettselskap. Et verktøy som Brandtzæg ved SINTEF har tatt i bruk er Wisdom fra det amerikansk baserte selskapet MicroStrategy.

–Her har jeg tilgang på data fra over 20 millioner mennesker – uten å ha gjort en eneste undersøkelse. Jeg kan analysere ulike preferanser på Facebook, og se på alders- og kjønnsforskjeller mellom ulike grupper og på tvers av land i hele verden. Til nå har jeg sammenlignet kjønnsforskjeller i samfunnsengasjement på Facebook mellom mennesker i Norge, Spania, England, USA, Russland, Egypt, India og Kina, sier han.

Personvern er ofte et problem man assosierer til Big Data, men data fra Wisdom er begrenset til større grupper og går ikke ned på “individ nivå”, i følge Brandtzæg. Derfor kan han sammenligne store grupper uten at personvern blir et problem.

Hva kan man lese ut av «big data»?

Teknologien som kobler mennesker sammen har gjort oss alle til storprodusenter av data. Gevinsten for de som klarer å utnytte dette, er åpenbar. Store selskaper som Telenor, Google og Facebook ser sjansen til å tjene milliarder på å analysere «big data», mens nasjonale myndigheter og helseorganisasjoner ser sjansen til å fange opp katastrofer allerede før de inntreffer. FN sier at de kan oppdage sykdomsutbrudd eller vaksinebehov, ut fra hva folk i utsatte områder twitrer eller googler, lenge før epidemien er bekreftet av legene.

Gjennom Big Data kan man oppnå forskningsresultater som spenner vidt og kan si mye om utviklingen i verden. Det er mulig å lage grundige analyser og sammenligninger mellom land, kjønn, alder, utdanning, yrke o.l. demografiske data.

Forskere ved Facebooks egen forskningsavdeling har for eksempel undersøkt hvordan folk i verden oppdaterer meldingene sine og hva de legger ut av informasjon om seg selv og livene sine.

– Undersøkelsene viste at meldingene som legges ut har blitt stadig kortere for hvert år, sier Brandtzæg, før han fortsetter: – De gjenspeiler økningen i hurtige kommunikasjonen ellers ute i samfunnet der for eksempel Twitter oppnår stor popularitet fordi det handler om å utrykke seg konsist og kjapt på max 140 tegn. En trend i samme retning er at ungdom viser sine historier gjennom bilder i stedet for en tekst. Instagram –feberen kan ha utspring i at man slipper å skrive.

Unytter ikke godt nok

Telenor jobber stadig med å bli bedre til se mønster i hvordan du og jeg, eller for den saks skyld en kunde i Pakistan, bruker telefonen.

– Det sendes 340 millioner twittermeldinger, spilles av 40 millioner You Tube-videoer og lastes opp 200 millioner bilder på Facebook hver eneste dag, fortalte sjef i Telenor-forskningsavdeling Bjørn Taale Sandberg.

– Også Telenor har Big data. I Thailand har vi 26 millioner kunder. De utfører 400 millioner oppringninger eller tekstmeldinger hver dag. Dessverre utnytter vi ikke mulighetene som ligger i alle disse dataene vi har tilgang til, i dag.

Han ramser opp at det tar for lang tid fra data blir generert til selskapet får brukt dem, og at man ikke har selskapskultur på plass til å utnytte det man sitter på. Tiden hvor administrerende direktørs magefølelse avgjorde er over. Nå må avgjørelsene tas basert på datafunn.

Et viktig mål med Big data er å kunne ta bedre beslutninger basert på informasjon som virksomheten allerede har tilgang til i egne datakilder. Datadrevne beslutninger og ikke synsing. Problemet stadig flere står overfor er at mengden data de har er stor og uhåndterlig og øker i voldsom takt.

Poenget er at vi kan få mye mer ut av det vi allerede har og de data som strømmer mot oss fra alle kanter, om vi kan få verktøy som kan omsette dette til utnyttbar informasjon i tilnærmet sanntid. Til syvende og sist er det analysen av informasjonen som gir verdi. Det er her regnbuen ender og det vet de som leverer slike verktøy.

Nye analyseverktøyer og kompliserte algoritmer er imidlertid i ferd med å endre hverdagen for stadig flere. De nye verktøyene som nå utvikles gir dagens beslutningstakere mulighet til å trekke ut stadig mer spesifikk informasjon, og sette dette sammen på en måte som gir stor kommersiell og vitenskaplig verdi.

– Om fem år har forhåpentligvis Big Data forandret Telenor, slik at man kan tilby de rette produktene til de rette kundene på de tidspunkt de ønsker seg produktet, sier Pål Sundsøy og Johannes Bjelland fra Telenors forskningsavdeling, Research and Future Studies.

– Men business er bare én del av det. Mulighetene til å bruke Big Data i et sosialøkonomisk og vitenskapelig perspektiv, og gjøre verden til et bedre sted, er jo minst like spennende, sier Sundsøy

Målrettet reklame og salg 

Den våte drømmen for Telenor, og andre kommersielle virksomheter, er å komme dit at man kan forutse valgene til kundene.

– Hvilke av kundene vil ha et spesielt program, hvem er ulojale, hvem vil holde seg som kunder, hvem kan tenkes å respondere om de tilbys en kampanje fra vår markedsavdeling, spurte Pål Sundsøy retorisk.

– Våre Big data-verktøy vil oppfatte mønster og bruksvaner blant kundene mye raskere enn markedsavdelingen, som kanskje må gjennom flere mislykkede kampanjer før man skjønner hva som funker eller ikke, sier hans kollega Bjelland.

– Det er tusen variabler per kunde, variabler som endres hver måned. Man kan ikke sitte med et Excel-ark og fange opp dette.

FN-organisasjonen Global Pulse, en forskningsenhet opprettet etter finanskrisen, ser store muligheter i å samarbeide med kommersielle bedrifter som Telenor, for å utnytte Big Datas muligheter til å brukes innen humanitært, sosialøkonomisk og samfunnsoppbyggende arbeid.

– Jeg gil oppfordre til data-filantropi, sier Robert Kirkpatrick i FN-eide organisasjonen.

 – Big Data er et råmateriale som offentligheten kan dra nytte av. Big Data, og selskapene lar oss få tilgang til dette, kan brukes til å se begynnende endringer i arbeidsledighet eller forutse en lav valgdeltagelse.

Han ser store muligheter i å analysere folks Twitter- og Facebook-meldinger, Google-søk og SMS-er til å fange opp hav de er opptatt av. For eksempel at mange i samme område er opptatt av at det går dårlig på jobben, at mange er syke eller at mange mangler mat.

– Slik kan kriser oppdages tidlig, og avverges tidlig, sier han, og viser til at befolkningen i Indonesia begynte å diskutere mangel på ris i sosiale medier og seg imellom på SMS-er, lenge før myndighetene fattet omfanget av sviktende avlinger.

David Lazer, professor ved Northeastern University i Boston sier det samme. Det som kan være big business for selskapene, kan også være en gullgruve for sosiologien og andre vitenskaper.

Sammenstilling av data og personvern

Datamengdene kan altså gi oss nyttig informasjon. Samtidig kan Big data bli et problem når ulike datakilder sammenstilles for å brukes kommersielt og drive målrettet reklame.

I stadig større grad kan data om hvor du befinner deg, kobles mot kjøpereferanser vi har, hva vil liker og ikke liker. Dette har Facebook kommet langt med.

Sårbarhet og personvern er skyggesider i den nye situasjonen der folk begynner å komme inn i store datasett og registre.

– Hvem vet – om to år kan kanskje skatteregisteret kobles til helse og forsikringsregisteret? sier Petter Bae Brandtzæg. – Det har jo vist seg før at skattedata har kommet på avveie.

Å la myndigheter, og ikke minst selskaper, utnytte dine og mine bruksmønstre og personlige digitale spor reiser naturlig nok en personverndebatt.

– Big Data er i seg selv moralsk nøytrale. Men hvordan vi bruker dem trenger ikke være det, sier Lazer.

– Spørsmålene rundt hva som skal arkiveres, hvem som skal kunne bruke det, og hvilken sikkerhetsnivå det som lagres skal underlegges er åpenbare.

Big Data kan øke datasikkerheten

Det er ikke bare Amazon, Google, Facebook og andre kommersielle store nettsteder som i dag prøver å utnytte «Big Data» i utviklingen av sine produkter og tjenester. Sikkerhetsbransjen har også begynt med dette.

Sikkerhetsselskapet RSA har nå lansert en løsning de har utviklet på basis av Net Witness som de kjøpte opp for to år siden.

– Det er veldig mange kilder til informasjon vi kan utnytte for å analysere mistenkelig oppførsel på nettet. Problemet er å få alt til å gå fort nok, slik at analysene kan presenteres i sanntid. Med den nye teknologien kan vi normalisere alle datakildene gjennom et datavarehus. Så kan vi bruke big data-teknologi, slik som Hadoop, og få alt presentert i det samme konsollet. Her kan vi se hva som skjer i sanntid, eller vi kan kjøre langtidsanalyser og bore mye dypere ned for å avsløre mistenkelig aktivitet som utvikler seg over tid. Skurkene bruker ofte lang tid på å sette opp feller for folk og bedrifter, sier IT-direktøren i RSA, Eddie Schwarz.

Hvilke meninger formidles?

Med den overveldende mengden av data som produseres, kommer også spørsmålet om innhold i all denne informasjonen. Hva er det som formidles?

Forskningsavdelingen Nettbaserte systemer og tjeneste ved SINTEF, som  Petter Bae Brandtzæg er tilknyttet, har fått tilslag på et nytt EU-prosjekt som bærer navnet REVEAL (avsløre). Her skal forskerne se på kombinasjoner av ulike datakilder og finne ut uttrykksevne, kvalitet og graden av sannhetsgehalt i data fra sosiale medier. Hva inneholder mediene? Hvem er avsendere? Hvem andre har sagt det som sies?

– Vi skal sette ulike kilder i sammenheng, og for eksempel finne ut hvor troverdig Twitter-meldingene er, sier Brandtzæg. Han trekker også fram trenden med hvordan vi fragmenterer informasjonen vår i mange kanaler – som Facebook, sms, mail, blogger, Twitter og Instagram.

Hvor troverdig er mediene?

Muligheten til å spre informasjon til store grupper i sanntid, har gjort Twitter og Facebook til viktige formidlingsverktøy ved store nyhetshendelser.

I jakten på Boston-terroristene brukte også politi, myndigheter og tradisjonelle medier sosiale medier som Twitter, Instragram, Reddit og Facebook til aktivt å hente inn og dele ut informasjon om hendelsen. Flere frivillige grupper ble også satt opp i sosiale medier for å forsøke å hjelpe politiet. Men, det viste seg at sosiale medier som kommunikasjonskanal ikke bare er til stor hjelp, men også en stor kilde til forvirring og feilinformasjon.

Kan Big Data utnyttes som en ressurs for journalister, og hvor troverdige er informasjonen på sosiale medier? Også dette emnet skal SINTEF-forskerne undersøke i EU-prosjektet REVEAL.

Kilde: Gemini.no, E24, Teknisk Ukeblad

Kort om IKTnytt.noTips ossSøk i offentlige registre

Kort om IKTnytt.no

IKTnytt.no

Ansvarlig redaktør:
Kjetil Sander

E-post:
redaksjonen@iktnytt.no

Facebook:
http://facebook.com/iktnytt/

IKTnytt.no er en nettavis for utviklere, markedsførere og ledere som ønsker å holde seg oppdatert om hva som skjer i IKT-verden - innenlands og utenlands.

Målgruppen er ikke privatpersoner som er interessert i forbruker-elektronikk, men profesjonelle brukere som er involvert i utviklingen, drift og markedsføringen av eget nettsted og mobile applikasjoner.

IKTnytt.no er utviklet og drives på hobbybasis av ansvarlig redaktør Kjetil Sander, som også står bak våre søsterportaler:

Kunnskapssenteret.com Aksjemarkedet.com

IKTnytt.no er også kundeavis for webbyrådet og hosting-selskapet OnNet AS som Kjetil er daglig leder i.

Tips oss om en nyhet!

For å sørge for at vi har de nyeste og beste IKT nyhetene trenger vi hjelp fra våre lesere.
Vi inviterer derfor nå alle våre lesere til å tipse oss om nyheter - små og store - fra nært og fjernt. Fortell oss gjerne om hva som skjer i din bedrift, hvilke problemer og utfordringer dere møter, og hvordan dere tenker å løse dem.
Fyll ut skjemaet under for å tipse oss om en nyhet.

Ditt navn (obligatorisk)

E-post (obligatorisk)

Skriv tipset ditt under i form av en overskrift ("emne"), med nærmere informasjon ("melding").

Emne

Melding

Vedlegg
Last opp vedlegg i form av bilde, logo e.l.

Svar på spørsmålet under for å bekrefte at du er et menneske og ikke en spam-robot.

Søk offentlige registre

Søk i lover, forskrifter og dommer:

 

Søk i NAV.no:

 

Søk i Foretaksregisteret:

 

Søk etter heftelser på motorvogn:

 Søk etter reservasjon mot reklame:

 

Firmasøk i Proff.no:

 

Søk i Statistisk Sentralbyrå: