Utposten Nr 8 1997

Previous Pagehttp://www.uib.no/isf/utposten/utposten.htmNext Page

Hvordan tenkte Thomas Bayes?

Tekst: Bent Natvig

natvig.jpg (2910 bytes)Bent Natvig ble professor i matematisk statistikk ved Universitetet i Oslo i 1986 med særlig ansvar for fagområdet pålitelighetsanalyse av teknologiske systemer. Han har sammen med dr.odont. Svein Eggen, Lillehammer publisert flere arbeider i internasjonale odontologiske tidsskrifter. Det siste året har han bl.a. sammen med førsteamanuensis Ivar Aursnes, Institutt for farmakoterapi, Universitetet i Oslo gjennomført en metaanalyse av virkningen av legemidlene Fosamax og Didronate på reduksjon av antall brudd hos kvinner med osteoporose. Studien er basert på Bayesiansk statistikk. Han var dekanus ved Det matematisk-naturvitenskapelige fakultet, Universitetet i Oslo 1990-93 og er leder av Den norske Pugwash komite.

FRYKT IKKE !  FORMLER ER BENIGNE
Utposten velger å trykke dette innlegget fra Nidaroskonferansen selv om mange umiddelbart vil finne det noe tungt på grunn av formelbruken. Men leseren kan finne trøst i at om man bare bruker 1 time i romjula for å sette seg inn i symbolbruken, vil man i denne artikkelen få det endelige beviset for at Utposten er et vitenskapelig tidsskrift! Selve matematikken er på gymnasnivå på de verste punktene.

 

Den engelske presten og sannsynlighetsteoretikeren Thomas Bayes ble født i 1702 og døde i 1761. Jeg skal ikke her gå inn i historiske kildematerialer for å belyse hvordan Bayes tenkte der og da. Snarere skal jeg forsøke å overbevise dere om at Bayesiansk statistikk er et viktig metodisk grunnlag for medisinske fag her og nå.

Hvordan tenker allmennmedisineren?
For at jeg skulle få et bedre inntrykk av hva som rører seg i miljøet, fikk jeg oversendt 6 utgaver av «UTPOSTEN - blad for allmenn- og samfunnsmedisin». La meg som en outsider med en gang si at jeg ble meget imponert over bredden og kvaliteten på artiklene i dette bladet. Selv om jeg ikke fant noen diskusjon eller referanse til Bayesiansk statistikk i de artiklene jeg leste, følte jeg ofte at jeg var blant åndsfrender. Jeg skal gi noen eksempler på det.

«I en skjønnsutøvelse vil flere vurderinger inngå:

La meg hoppe til en annen interessant artikkel (2) av Linn Getz om den allmennmedisinske vitenskapen:

«Det er en gyllen tid for såkalt Evidence-Based Medicine. Men hvis vi skal lite på de fakta som vi er så dristige at vi omtaler som bevis, må vi sikre oss at de framkommer i vår egen setting og har gyldighet for den.»

En anvendelse av Bayes teorem på oppdatering av sannsynligheter på grunnlag av ny informasjon
La meg starte med å sitere en siste meget relevant artikkel (3) av Steinar Hunskår og Eivind Meland som tar opp myten om det ufeilbarlige helsevesen.

«Ved undersøkelse av pasienter med mistenkt sykdom vil det alltid være usikkerhet: De fleste vet at sykdom kan foreligge selv med normale undersøkelser og testresultater (prøven var «normal», men pasienten viste seg å være syk). Mindre kjent er det kanskje at undersøkelse og test-resultater kan være positive uten at pasienten er syk (prøven viser «sykdom», men pasienten er frisk!). I det siste tilfellet snakker vi om «falsk positive». Den medisinske usikkerhet og sjanse for feil er et uttrykk for et allment fenomen: vitenskapen kan ikke bevise noe, den kan bare sannsynliggjøre standpunktet med en viss fare for feil.

Det sannsynlighetsteoretiske verktøy som passer som hånd i hanske til disse problemstillingene, er Bayes teorem. Dette er det alminnelig enighet om uansett synspunkt på Bayesiansk statistikk. La oss illustrere dette ved følgende konstruerte eksempel. Anta at vi tester en pasient utfra mistanke om at vedkommende har en blodsykdom. Innfør følgende notasjon:

S = {Pasienten er alvorlig syk}
L = {Pasienten er litt syk}
N = {Pasienten er helt frisk}
+ = {Testen gir positivt utslag}
- = {Testen gir negativt utslag}
(se figur).

Anta at vi utfra generell norsk helsestatistikk vet at 2% av befolkningen er alvorlig syke, 10% er litt syke mens altså da 88% er helt friske. La P(S) betegne sannsynligheten for at pasienten er alvorlig syk med tilsvarende definisjoner for P(L) og P(N). Utfra helsestatistikken over kan vi anta, hvis vi ikke utnytter mer subjektiv tilleggsinformasjon om pasienten, at

P(S) = 0.02  P(L)=0.10  P(N)=0.88

Anta på basis av et større datamateriale at vi har følgende kunnskap om testens egenskaper. I 90% av tilfellene gir testen korrekt positivt utslag når den anvendes på en alvorlig syk pasient. Tilsvarende gir testen positivt utslag i 60% av tilfellene når den anvendes på en litt syk pasient, mens den helt feilaktig gir positivt utslag i 10% av tilfellene når den anvendes på en helt frisk pasient. La P(+|S) betegne den betingete sannsynlighet for at testen gir positivt utslag gitt at pasienten er alvorlig syk med tilsvarende definisjoner for P(+|L) og P(+|N). Utfra informasjonen over kan vi anta at:

P(+|S)=0.90  P(+|L)=0.60  P(+|N)=0.10

Vi ønsker nå å beregne sannsynligheten for at pasienten vår virkelig er alvorlig syk gitt at testen har gitt positivt utslag, dvs. vi er på jakt etter P(S|+). Det er her Bayes teorem fra sannsynlighetsregningen er som skreddersydd. La P(S«+) betegne sannsynligheten for S «snitt» +, dvs. sannsynligheten for at både pasienten er alvorlig syk og at testingen av ham gir positivt utslag med tilsvarende definisjoner for P(L«+) og P(N«+). Utfra definisjonen på betinget sannsynlighet har vi at:

P(S|+)= P(S«+)
      P(+)
(se figur),
der P(+) er sannsynligheten for at testen gir positivt utslag på en uspesifisert pasient. Det burde være lett å overbevise seg om at:

P(+)=P(S«+)+P(L«+) +P(N«+)

(se figur),

siden en uspesifisert pasient kan tilhøre en av følgende gjensidig utelukkende grupperinger: de alvorlig syke, de litt syke eller de helt friske. Ved å bruke definisjonen på betinget sannsynlighet en gang til har vi at:

P(S«+)=P(+|S)P(S)
P(L«+)=P(+|L)P(L)
P(N«+)=P(+|N)P(N)
Samler vi dette, får vi at:

P(S|+) = P(+|S)P(S)
P(+|S)P(S)+P(+|L)P(L)+P(+|N)P(N)

Dette er nettopp Bayes teorem anvendt på vår problemstilling. Ved å sette inn de numeriske verdier for sannsynlighetene på høyre side av likhetstegnet får vi at:


Det er følgelig en sannsynlighet så lav som 0.11 for at pasienten vår virkelig er alvorlig syk gitt at testen har gitt positivt utslag. Dette er selvsagt betenkelig lavt noe allmennmedisineren må ta hensyn til i vurderingen av og kommunikasjonen med pasienten. Enkelte vil hevde at testen rett og slett er ubrukelig.

+1 = {Første test gir positivt utslag}
+2 = {Andre test gir positivt utslag}

Vi er følgelig på jakt etter P(S|+1«+2).

Uavhengigheten av testene kan fortolkes på følgende måte. Hvis vi skal beregne sannsynligheten for at andre test gir positivt utslag gitt at pasienten er alvorlig syk, avhenger ikke denne av resultatet av den første testen. Dermed har vi at:

P(+2|S«+1)=P(+2|S)=P(+|S)=0.90
P(+2|L«+1)=P(+2|L)=P(+|L)=0.60
P(+2|N«+1)=P(+2|N)=P(+|N)=0.10

som er de samme sannsynlighetene som inngikk i beregningen av P(S|+) over.

Dette er vesentlig bedre enn 0.11, men fortsatt altfor lavt.

En anvendelse av Bayesiansk beslutningsteori
La oss forfølge vår pasient et skritt videre etter at begge testene har gitt positivt utslag. Allmennmedisineren må nå fatte en beslutning på grunnlag av de oppdaterte sannsynligheter. Vi har at P(S|+1 «+2)=0.27. Tilsvarende finner en at:

natvig5.gif (409 bytes)

natvig6.gif (410 bytes)

På grunnlag av de to testene er det klart mest sannsynlig at pasienten bare er litt syk, hvilket ikke skulle tilsi nærmere og mer kostbar utredning i denne omgang. På den annen side er det en ikke ubetydelig sannsynlighet for at pasienten faktisk er alvorlig syk og dermed omgående bør innlegges på sykehus. Allmennmedisineren står overfor en beslutning under stor usikkerhet. Skal pasienten innlegges eller ei? Innfør følgende notasjon svarende til de to alternativene:

B1 = {pasienten hospitaliseres omgående}
B2 = {en ser det hele an inntil videre}

For å fatte en beslutning kommer en ikke utenom å subjektivt anslå tap av nytte ved å velge B1 eller B2 i forhold til pasientens faktiske tilstand S, L eller N. Hvis en f.eks. hospitaliserer en helt frisk pasient, representerer dette bortkastede ressurser for samfunnet, forlenget ventetid i sykehuskø for andre pasienter, tapt arbeidsinnsats for pasientens eventuelle arbeidsgiver og endelig i beste fall bortkastet tid og ressurser for pasienten. La meg igjen sitere den sistnevnte artikkel (3):
«Generelt kan personer som har fått påvist funn som ikke er uttrykk for sykdom, invalidiseres av angst og sosial forventning om sykerollen. Forskning har lært oss at den subjektive sykdomsopplevelse for slike pasienter kan være like sterk som blant dem med reell sykdom. Mange har fått uføretrygd på grunnlag av slik ikke-sykdom. Vi ser slike pasienter, men de er ikke egnet for sensasjonsoppslag i pressen.»

Hvis en på den annen side ser det hele an inntil videre, og pasienten er alvorlig syk, kan dette medføre invalidisering eller tidlig død med tilhørende omkostninger for familie og samfunn. Anta allmennmedisineren, som til syvende og sist skal fatte beslutningen, kommer frem til følgende tabell over tapt nytte målt i norske kroner.

 

Vi ser av tabellen at hvis pasienten er alvorlig syk og allmennmedisineren helt korrekt fatter beslutningen om omgående hospitalisering, er tapt nytte lik 0. Dersom allmennmedisineren i denne situasjonen velger å se det hele an, gjøres den alvorligste feilen med tapt nytte kr. 100 000. Hvis pasienten er litt syk, vurderes de to alternative beslutningene å ha det samme nyttetapet på kr. 25 000,-. For tilfellet at pasienten er helt frisk og allmennmedisineren helt korrekt fatter beslutningen om å se det hele an, er igjen tapt nytte lik 0. Dersom allmennmedisineren i denne situasjonen velger å hospitalisere pasienten omgående, gjøres den nest mest alvorlige feilen med tapt nytte kr. 50 000.

Risiko ved B1 =

0·P(S|+1«+2)+25000·P(L|+1 «+2)
+50000·P(N|+1 «+2)=

0·0.27+25000·0.59+50000·0.14=21750

Tilsvarende er risikoen ved å se det hele an inntil videre:

Risiko ved B2 =
100000·0.27+25000·0.59+0·0.14=41750

Følgelig ser vi at forventet tapt nytte eller risikoen ved å se det hele an inntil videre, er nær dobbelt så stor som ved at pasienten omgående hospitaliseres. Dermed er det opplagt at allmennmedisineren bør treffe den siste beslutningen selv om den best mulige estimerte sannsynlighet for at pasienten er alvorlig syk er så lav som 0.27. Det er også klart at vi kan gjøre relativt store endringer i tabellen over tapt nytte ved de to ulike beslutninger, og likevel ende opp med en beslutning om at pasienten hospitaliseres omgående.

Bayesiansk beslutningsteori generelt
Bayesiansk statistikk og beslutningsteori, samt andre former for beslutningsteori, er behandlet i (4). Vi skal belyse litt av denne Bayesianske teorien i det følgende. Nøkkelparameteren vi er interessert i, betegnes ofte med den greske bokstaven q. Den kan gjerne være en vektor av flere størrelser. Nøkkelparameteren er fast, men ukjent for beslutningstageren. Beslutningstageren formulerer sin usikkerhet om parameteren før data er samlet inn ved hjelp av en såkalt à priori sannsynlighetstetthet (punktsannsynlighet) betegnet med p(q).

q1 = S, q2 = L, q3 = N

Den tilhørende à priori punktsannsynlighet er gitt ved:

p(q1)=P(S)=0.02
p(q2)=P(L)=0.10
p(q3)=P(N)=0.88

En samler så inn data betegnet med D. Sannsynlighetstettheten (punktsannsynligheten) for disse dataene, gitt nøkkelparameteren q, betegnes f(D|q). Som funksjon av q betegnes denne med L(q), dvs.
L(q)=f(D|q).

L(q) kalles rimelighetsfunksjonen (engelsk likelihood function). I gjennomgangseksemplet vårt har vi at de første data er at testen gir positivt utslag, dvs.:

D = +

Rimelighetsfunksjonen er der gitt ved:

L(q1)=f(D|q1)=P(+|S)=0.90
L(q2)=f(D|q2)=P(+|L)=0.60
L(q3)=f(D|q3)=P(+|N)=0.10

Vi er nå på jakt etter usikkerheten i nøkkelparameteren etter at dataene D er samlet inn. Denne usikkerheten er gitt ved en såkalt à posteriori sannsynlighetstetthet (punktsannsynlighet) betegnet med p(q|D). Denne finnes ved Bayes teorem, og er rett og slett proporsjonal med produktet av rimelighetsfunksjonen, L(q), og à priori sannsynlighetstettheten (punktsannsynligheten), p(q). Følgelig har vi:

p(q|D)=L(q)p(q)/K

K er her en konstant som sikrer at p(q|D) virkelig er en sannsynlighetstetthet (punktsannsynlighet). Følgelig har vi hvis q kan anta verdier i Q={q1, q2,···} at:

K=L(q1)p(q1)+L(q2)p(q2)+ ···

Hvis q kan anta verdier i en mengde, Q, av reelle tall, må vi erstatte summasjon med integrasjon og får at:

K=_Q L(q)p(q)dq

I vårt gjennomgangseksempel får vi f.eks. at:


Får en nye data, gjentar en prosedyren over men med ny à priori sannsynlighetstetthet (punktsannsynlighet) gitt ved den gamle à posteriori sannsynlighetstettheten (punktsannsynligheten). Det var nettopp det vi gjorde i gjennomgangseksemplet der de nye data er at også den andre testen gir positivt utslag.

L(q1,Bi)p(q1|D)+L(q2,Bi)p(q2|D)+···

hvis q kan anta verdier i Q={q1, q2,···}. Hvis q kan anta verdier i en mengde, Q, av reelle tall, må vi erstatte summasjon med integrasjon og får i stedet

_qL(q,Bi)p(q|D)dq

Risikoen ved beslutning Bi er følgelig et veiet gjennomsnitt av tapt nytte for de ulike verdier av q, der vektene er gitt ved à posteriori sannsynlighetstettheten (punktsannsynligheten) p(q|D).

Bayesianske metoder i medisin
Jeg presenterte noen hovedidéer i Bayesiansk beslutningsteori på et seminar som Sosial- og helsedepartementet arrangerte 9.~desember i fjor «Klinisk forskning - er de statistiske arbeidsmåter gode nok?». La oss hente følgende utdrag fra innledningen til Statsråd Gudmund Hernes (5):

p1=Sannsynligheten for minst en fraktur i løpet av 3 år når placebo er brukt
p2=Sannsynligheten for minst en fraktur i løpet av 3 år når legemiddelet er brukt

og

l1=Intensitet av frakturer per år når placebo er brukt
l2=Intensitet av frakturer per år når legemiddelet er brukt.

Helt sentralt i den Bayesianske metodikk generelt er som vi har sett, å beskrive usikkerheten i slike nøkkelparametre ved hjelp av sannsynlighetsfordelinger. Denne usikkerhet blir beskrevet også etter at data er samlet inn, dvs. når beslutninger skal fattes, og ikke før som ved klassiske konfidensintervall.

a=(p1 - p2)/p1,   b=(l1- l2)/l1

som er felles for de underliggende studiene.

Professor Bent Natvig
Universitetet i Oslo
Matematisk institutt
Boks 1053 Blindern
0316 Oslo

Litteratur:
1. Øgar P. Skjønnsutøvelse i samfunnsmedisinen. Utposten 1996; 25:7-8: 268-272.
2. Getz, L. Den allmennmedisinske vitenskapen. Utposten. 1995; 24:7:326-330.
3. Hunskår, S., Meland E. Myten om det ufeilbarlige helsevesen (1). Utposten 1995; 24:1:4-6.
4. Berger, J.O. Statistical decision theory and Bayesian analysis. Second edition. Springer-Verlag, 1985.
5. Hernes, G. Innledning ved Sosial- og helsedepartementets departementsseminar 9.~desember: Klinisk forskning - er de statistiske arbeidsmåter gode nok?, 1996.
6. Freedman, L. Bayesian statistical methods, A natural way to assess clinical evidence. British Medical Journal 1996; 313: 569-70.
7. Berry, D.A. Statistics. A Bayesian perspective. Duxbury Press, 1996.
8. Storvik, G., Natvig, B., Gåsemyr, J., Aursnes, I. Vurdering basert på Bayesiansk statistikk av den vitenskapelige dokumentasjon av legemidlene etidronat (Didronate) og alendronat (Fosamax) for reduksjon av antall brudd hos kvinner med osteoporose. Rapport utarbeidet for Sosial- og helsedepartementet, 1997.

Previous Pagehttp://www.uib.no/isf/utposten/utposten.htmNext Page

Instituttets hovedside
UiBs Hovedside
Institutt for samfunnsmedisinske fag,
Oppdatert 16.. desember 1997
John Leer