Skiller genfeil fra statistisk støy
Statistikk er avgjørende når gendata skal omdannes til biomedisinsk kunnskap. Ved hjelp av avanserte målemetoder og statistikk kan vi om ti år ha klart å utvikle metoder for å diagnostisere alvorlige sykdommer som skyldes genfeil.
Allerede om 20 år kan vi ha utviklet medisiner som kan reparere disse feilene. Det spår professor i biostatistikk ved Universitetet i Oslo,Arnoldo Frigessi.
Frigessi har i fem årledet en gruppe forskere ved Det medisinske fakultetet i jakten på gener og ”snipper”som kan være årsak til sykdom hos mennesker. Arbeidet har vært finansiert av Forskningsrådets frie prosjektstøtte (FRIPRO). Nå er han sikker på at de har funnet det de var på jakt etter. Og ikke bare en, men kanskje så mange som 25! ”Snipper” er i dette tilfellet forskernes kjelenavn for små genmutasjoner eller feil i arvestoffet. Ordet er utledet av forkortelsen SNP (Single Nucleotide Polymorphism), som er den faglige betegnelsen på slike fenomener.
Avansert statistikk omdanner gendata til biomedisinsk kunnskap. (Foto: Shutterstock)
Det er ikke hvilke som helst ”snipper” professor Frigessi og hans medhjelpere har lett etter. Av en million ”snipper” i det menneskelige genom, er det kun de ”snippene” som mistenkes å være årsak til alvorlige sykdommer hos mennesker, man jakter på. Målet er sjølsagt å kunne forutse risikoen for sykdom, deretter å reparere feilen, for dermed å forhindre sykdommen i å bryte ut. Og metoden Frigessi og hans folk har benyttet seg av er statistikk. Avansert statistikk.
En utfordring
- Vi er statistikere og kan ikke så mye om molekylærbiologi og medisin. Men ved hjelp av moderne teknologi er vi i stand til å hjelpe medisinerne med å analysere store mengder data de ikke selv får mye ut av. I vårt arbeid har vi vært på jakt etter gener eller ”snipper” som kan være årsak til sykdom. Dette er gener - og deler av gener - som er ”feil kodet”, eller mutert. For å få dette til har vi i flere forsøk sammenlignet alle genene - det vi si rundt 30.000 per person - hos friske og syke mennesker, for å se etter avvik. De genene som har stort avvik mellom de friske og de syke, er gode kandidater for å være ansvarlig for sykdom. Problemet er at ikke alle funnene er like relevante, forteller Frigessi.
Professor Arnoldo Frigessi (Foto: Norsk regnesentral)
- Å omdanne gendata til biomedisinsk kunnskap er en stor utfordring for oss statistikere. en stor utfordring for oss statistikere. Statistikk er aldri 100 prosent sikker. Ikke alle dataene er perfekte og det kan være feiltolkinger og tilfeldighetersom gjør utslag.
False discovery rate
Statistikere har funnet fram til en metode som de har kalt ”False discovery rate”. Denne metoden hjelper forskerne med å finne fram til hvilke gener med stort avvik som er relevante og hvilke som bare er ”tull”, som professoren uttrykker det. Denne metoden er blant annet brukt i en undersøkelse om brystkreft som en av hans studenter, Hayat Muhammed, har brukt som grunnlag for sin doktoravhandling, en avhandling hun skal forsvare nå i høst.
I sin undersøkelse har Muhammed prøvd å forutsi effekten av radioterapi i behandling av brystkreft ved hjelp av statistikk. Det er nemlig ikke sikkert at bruk av radioterapi alltid er like nyttig, eller nødvendig. Tvert i mot gir behandlingen ofte mange og store bivirkninger. Muhammed sin undersøkelse gir legene svar på når slik terapi kan være spesielt nyttig.
- Her har vi funnet enstatistisk metode som vi kaller ”to steg lasso”, for å fange syv gener som interagerer spesielt med suksess vedradioterapi, sier Frigessi.
Ansiktsgjenkjenning
En annen undersøkelse er ansiktsgjenkjenning, såkalt ”face recognition”. Spørsmålet man i denne undersøkelsen ønsket svar på var; hvilke ”snipper” er ansvarligefor å aktivere de delene av hjernen som vi bruker for å kjenne igjen et ansikt? Her har Frigessi og hans medarbeidere ved Ullevål universitetssykehusbrukt gendata fra pasienter og friske personer. I undersøkelsen har man delt hjernen i en million såkalte ”voksels” for å finne de delene som aktiveres av ansiktsgjenkjenning og som er regulert av ”snipper”. Dataene er satt sammen i en enorm database og resultatet er rimelig klart; de har funnet genene - eller SNPene- som er viktig for å kjenne igjen et ansikt og er arvelig regulert. Nærmere bestemt har de funnet 25 slike ”snipper”. Disse er validert mot nye data fra USA som bekrefter funnet.
Medisin mot genfeil?
Nå skal Frigessi og hans folk forske videre for å utvikle og styrke sine metoder for å finne små effekter i store datamengder.
- Dette er en lang prosess. Alle funn må testes ut nøye for å forstå alle bieffekter og konsekvenser, men jeg tror at vi allerede om ti år kan se resultater av denne forskningen i form av diagnostisering av alvorlige sykdommer som skyldes genfeil. Om ytterligere ti år ser jeg for meg at det kommer medisin på markedet - såkalt ”personalized medicine” - som kan reparere eller kompensere for individuelle genfeil. Det håper vi vil bli resultatet av vårt arbeid for å finne årsakssammenhenger ved hjelp av avansert statistikk, sier en spent professor Arnoldo Frigessi.
Han understreker at statistikk er en sentral del av moderne medisinsk forskning. I tillegg til store investeringer til datainnsamling, tror han det vil være nødvendig å forsterke finansieringen til statistisk analyse, som er påkrevet for å få kunnskap ut fra slike store datamengder.
- Publisert:
- 04.07.2011
- Sist oppdatert:
- 29.11.2012