Infrastruktur for bioinformatikkens data-analyse

Paweł Sztromwasser disputerer onsdag 19. februar 2014 for ph.d.-graden ved Universitetet i Bergen med avhandlingen: "Throughput and robustness of bioinformatics pipelines for genome-scale data analysis".

Hovedinnhold

Oppdatert: 07.05.2014 (Først publisert: 17.02.2014)

Det blir i dag rutinemessig generert store datasett fra biologiske prøver ved bruk av såkalte high-throughput screening metoder. Disse kan produsere millioner av målinger per prøve, for eksempel ved å lese milioner av gensekvensbiter eller måle aktivitetsnivå til tusener av gener på relativt kort tid. Målingene blir analysert med bioinformatiske metoder for å lære mer om problemstillingene i eksperimentet prøvene er en del av. Og mengden av data som kan genereres på kort tid utfordrer både analysemetodene som benyttes såvel som den underliggende IKT-infrastrukturen.

En del av analyseverktøyene og databaser med store mengder informasjon kan tilgjengeliggjøres på Internett via såkalte webtjeneste-grensesnitt. Et webtjeneste-grensesnitt er standardisert slik at andre programmer kan benytte dette til å utføre beregninger og få resultater tilbake, men teknologien har begrenset støtte for omfangsrike data. Et hovedbidrag fra kandidatens arbeid er nyutviklete metoder for å kommunisere med webtjenester uten de samme begrensningene for datavolum.

Det ferdig prosesserte datasettet kan også ofte være for stort til at hvert enkeltresultat, som for eksempel aktivitetsnivået til enkeltgen, kan bevises manuelt i etterkant. Det stilles derfor store krav til nøyaktige og reproduserbare resultater fra analyseprotokollene som benyttes. Dette er ikke minst viktig for genetiske data med anvedelsesområde innenfor medisin. Kandidaten har studert en av de mest brukte analyseprotokollene for å detektere genetisk variasjon i mennesker for å avdekke hvor sensitivt sluttresultatet er i forhold til endringer av inngangsparametre til analyseprotokollen. Studiens resultater viser at analyseprotokollen er robust og pålitelig, men indikerer også hvordan nøyaktigheten av analysen kan forbedres.

Personalia:

Paweł Sztromwasser ble født i Wrocław (Polen) i 1983. Han fullførte sin masterutdanning i informatikk ved Universitet i Wrocław i 2007, med masteroppgave innen bioinformatikk. Etter dette jobbet som vitenskapelig programmerer ved Computational Biology Unit (CBU), Uni Research AS, Bergen. Høsten 2008 tiltrådte han som stipendiat ved Institutt for Informatikk, Universitetet i Bergen, tilknyttet CBU. Hovedveileder for arbeidet har vært Kjell Petersen ved CBU og Institutt for Informatikk.

Avhandlingen kan lånes på Bibliotek for realfag. Avhandlingen er tilgjengelig i BORA. For kjøp/bestilling av avhandlingen, kontakt kandidaten direkte.

Foto/ill.:

Foto-Świt

Last ned pressebilde

Tidspunkt og sted for prøveforelesningen:

06.02.2014, kl. 1415. Oppgitt emne: DNA sequencing and genotyping in biomedicine - data processing and infrastructure challenges

Sted: Seminarrommet, CBU, 5. etg., Høyteknologisenteret, Thormøhlensgt. 55

Tidspunkt og sted for disputasen:

19.02.2014, kl. 1100, Stort auditorium, Datablokken, 2. etg., Høyteknologisenteret, Thormøhlensgate 55.

Kontaktpersoner:

Paweł Sztromwasser, tlf. 403 07 474, epost: pawel.sztromwasser@ii.uib.no

Mediekontakt ved Kom.avd, e-post: mediekontakt@uib.no, Telefon: 55 58 89 00