Shakespeare i DNA

dna1webb

 

Precis som disketterna och CD-skivorna kommer hårddiskarna att gå i graven. Mycket talar för att konstgjort DNA är framtidens lagringsmedium.

När den brittiske molekylärbiologen och Lady Gaga-entusiasten Nick Goldman beställde in den första ölen på Gastwerk Hotel i Hamburg den där aprilkvällen 2010 kände han en molande trötthet i kroppen. Han lät blicken vila på en av designhotellets råa tegelväggar och sjönk djupare ner i fåtöljen. Det hade varit en lång dag. Mötesdiskussionerna hade präglats av frustration. Ämnet som Nick Goldman och hans kolleger på European Bioinformatics Institute, EMBL-EBI, hade avhandlat var hur de på sikt skulle kunna fortsätta lagra och tillhandahålla molekylärbiologisk forskningsdata. Ända sedan starten 1992 har institutet, med bas i brittiska Hinxton, fungerat som ett slags dygnetruntöppet bibliotek för internationella forskare. Men de senaste åren har mängden experiment- och forskningsdata som strömmat in till institutet ökat exponentiellt, något man inte kunnat säga om anslagen. När Nick Goldman blundade såg han en karavan av lastbilar som rullade in på anläggningen för att leverera nya hårddiskar till EMBL-EBI:s serverhall som rymmer drygt 40 petabyte data. Nick Goldman och hans kolleger visste vad de ökande informationsmängderna kunde leda till. Om ingen hittade en adekvat lösning på lagringsproblemet skulle EMBL-EBI inom ett par år behöva införa restriktioner kring hur mycket rådata enskilda forskare fick lov att spara i Hinxton. Något som hade kunnat hota forskning som bygger på äldre, komparativ data. Samtidigt som mörkret föll utanför hotellbarens fönster vände sig Nick Goldman mot kollegan Ewan Birney som satt bredvid honom i baren. Fanns det några alternativ som ingen tänkt på? Kunde man angripa problemet från en ny horisont? För en stund lät de tankarna flöda fritt. Och mitt under en diskussion kom idén. Borde man inte kunna lagra information i DNA? Tanken var inte ny. Redan på 1960-talet hade fysikern Mikhail Neiman publicerat framtidsvisioner kring informationsförvaring i DNA i tidskriften Radiotekhnika Journal. Men till skillnad från Neimans sovjetiska 60-tal fanns nu förutsättningarna. Åtminstone i teorin. Tröttheten var som bortblåst. I det kreativa ruset beställde Nick Goldman och Ewan Birney in en ny omgång öl och en bunt servetter som de kladdade fulla med matematiska formler. Det blev en sen kväll.

Torsdagen den 24 januari 2013 – knappt tre år efter diskussionen i hotellbaren – ringde telefonen på Nick Goldmans klaustrofobiska kontor i Hinxton oavbrutet. Tidskriften Nature hade precis publicerat hans studie och journalister från hela världen ville få en pratstund med mannen som lyckats spara digital information i DNA och sedan läsa tillbaka den igen till sitt ursprungliga format. Under tre år hade Nick Goldman och hans kolleger på EMBL-EBI arbetat med att utveckla koden. När programmeringsarbetet var klart valde forskargruppen ut fem filer som skulle sparas i artificiellt DNA framställt i laboratorium. De var på jakt efter material med högt konstnärligt, historiskt och vetenskapligt värde. Valet föll på en textfil med samtliga 154 Shakespeare-sonetter samt en 26 sekunder lång ljudfil med delar av Martin Luther Kings berömda ”I have a dream”-tal – i ett tidigt skede förekom även Lady Gagas musik i diskussionerna. Nick Goldman och hans kolleger valde också att spara en PDF-fil med James Watson och Francis Cricks klassiska artikel om DNA-molekylens struktur samt en JPEG-bild föreställande EMBL-EBI:s högkvarter. Dessutom sparades en textfil som klargjorde hur koden skrivits och hur informationen skulle utläsas. När allt var klart skickades den färdiga koden till Agilent Technologies i San Fransisco – ett företag som specialiserat sig på att skriva artificiellt DNA. Efter några veckor kom ett paket i retur. Nick Goldman slet upp det, tog fram det lilla provröret och höll upp det mot ljuset. Han fick en smärre chock. Röret var tomt. Han tänkte att det måste ha blivit något fel. Med andan i halsen sprang Nick Goldman till en kollega som kunde lugna honom. I botten på det fyra centimeter långa röret låg något som liknande en minimal dammpartikel. Nick Goldman drog en lättnadens suck och postade röret till EMBL-EBI:s laboratorium i tyska Heidelberg där forskare lyckades läsa tillbaka DNA-sekvenserna till sina ursprungliga filformat med en träffprocent på mellan 99,99 och 100 procent. Lagringskapaciteten var häpnadsväckande. Om man skalade upp Goldmans experiment skulle man få plats med 2,2 petabyte data per gram DNA. Det motsvarar cirka 468 000 DVD-skivor.

– Om man sparade hela världens samlade digitala information i DNA hade lådorna med provrör rymts i bakluckan på en mindre skåpbil, säger Nick Goldman.

Han sitter i ett ödsligt sammanträdesrum på EMBL-EBI:s anläggning i Hinxton flankerad av forskarkollegan Paul Bertoni som också arbetade med DNA-studien. Framför dem på bordet står en låda med färgglada legoklossar som Nick Goldman använder för att pedagogiskt illustrera experimentet. Lite förenklat kan man säga att forskarna konverterade de digitala filernas binära ettor och nollor till DNA-molekylens byggstenar: adenin, tymin, cytosin och guanin. Sedan hackades DNA-spiralerna upp i mindre bitar. För att veta hur dessa förhöll sig till varandra uppfann Nick Goldman ett system som, genom noggrann indexering, band samman de olika bitarna i en lång hypotetisk DNA-kedja. Goldman, som till vardags arbetar med evolutionsbiologisk forskning, menar att DNA är det överlägset bästa mediet för långsiktig informationslagring:

– Jag har studerat mammut-DNA och häst-DNA som är hundratusentals år gammalt. Även om DNA inte förvaras i labbmiljö, utan kommer från en urtidshäst som frös ihjäl i Sibirien, är det stabilt under en extremt lång tid, säger han.

En annan fördel är att det inte är speciellt kostsamt att lagra informationsbärande DNA. Enligt Nick Goldman och Paul Bertoni räcker det att man förvarar provrören hyfsat kallt och mörkt så att de inte utsätts för ultraviolett strålning.

– Ditt kylskåp eller din frysbox hade fungerat alldeles utmärkt. Så länge apparaterna inte går sönder, säger Nick Goldman.

Men vad är då haken? Tja, det finns ett par stycken. Att skriva digital information i artificiellt DNA är extremt dyrt. Den knappa megabyte information som Goldmans forskargrupp skrev i DNA kostade cirka 110 000 kronor. Sedan tillkom kostnaderna på cirka 2 000 kronor för att läsa tillbaka DNA-sekvenserna till de ursprungliga formaten.

– Folk betraktar ännu inte DNA-teknologi som en nyckel för datalagring. Men kostnaderna kommer att kapas dramatiskt när fler aktörer ger sig in på marknaden, säger Paul Bertoni självsäkert.

Han får medhåll av Nick Goldman som berättar att det i dagsläget bara finns två-tre företag som specialiserat sig på att skriva information i DNA. Allt som krävs för en rejäl prispress är att det kommer in en ny aktör med en vassare teknik. Inom en tioårsperiod räknar Nick Goldman med att metoden kommer att bli kostnadseffektiv för arkivmaterial som behöver sparas i 50 år eller mer.

– Allt beror ju på hur mycket pengar köparen har! En miljonär skulle mycket väl, redan idag, kunna tänka sig att betala 110 000 kronor för att spara sitt testamente och ett par bröllopsbilder i DNA som ett coolt sätt att lagra data, säger Nick Goldman.

Priset är inte den enda hämskon. När digital information väl skrivits i DNA går det inte att göra några ändringar eller uppdateringar, exempelvis i en text. En annan nackdel är att informationsbärande DNA förstörs i samband med avläsningen. Nick Goldman är övertygad om att vidare forskning i ämnet kommer att mynna ut i en avläsningsteknik som inte är lika ”destruktiv”. Det är inte bara Nick Goldmans forskargrupp som intresserar sig för DNA som lagringsmedium. I augusti 2012 publicerade Harvard-genetikern George Church och biokemisten Sri Kosuri en liknande studie i tidskriften Science. I deras studie kodades George Church senaste bok, elva JPEG-bilder och ett Javascript-program i artificiellt DNA. Men deras kod var inte lika sofistikerad som Goldmans, vilket ledde till en högre felprocent vid avläsningen. De två studierna har lett till ett stort intresse från arkivvärlden, berättar Paul Bertoni som blivit inbjuden till ett flertal konferenser på temat digital arkivering. Nick Goldman och Paul Bertoni tror att det bara är en tidsfråga innan någon större aktör vågar hoppa på DNA-lagringståget. Det skulle kunna vara bibliotek eller museer med gigantiska samlingar. Även olika typer av arkiv – exempelvis presidentarkiv, militära arkiv eller arkiv som innehåller information om kärnavfallslagringsplatser – är möjliga intressenter. En bransch som redan visat intresse för DNA-tekniken är filmindustrin, berättar Nick Goldman.

Vi lämnar konferensrummet och tar en promenad på EMBL-EBI:s hypermoderna anläggning. Den känns lite malplacerad där den ligger utkastad i utkanten av det rurala Hinxton där pensionärerna på den lokala puben diskuterar vem det var som glömde sin ytterrock i kyrkan i samband med den senaste begravningen. Vi går till EMBL-EBI:s spatiösa datacenter som är inrymt i en separat byggnad. Bakom rutorna syns blinkande hårddiskar från golv till tak. Avancerade kylanläggningar ser till att hålla hårddiskarna rätt tempererade. Då och då syns skuggorna av de tekniker som arbetar dygnet runt i det kolossala centret. Av säkerhetsskäl får vi inte komma in. Vi får nöja oss med att trycka näsan mot glaset och betrakta hårddiskarna som rymmer drygt 40 petabyte forskningsdata. Nick Goldman berättar att all information som lagras här hade rymts i drygt 18 gram DNA.

– Vart tredje år måste alla hårddiskar bytas ut eftersom vi inte kan vänta tills något går sönder. Det är både kostsamt och opraktiskt. Det hade varit enklare om vi kunnat spara allt i DNA, säger han.

Oceanen av blinkande hårddiskar leder in samtalet på den enorma mängd digital information som varje dag sparas runt om i världen. Beräkningar visar att mängden digital information kommer att öka med ofattbara 35 triljoner gigabytes fram till 2020. Med hjälp av statistik har Nick Goldman gjort en annan studie som visar att det om 150 år kommer att behövas ett extra jordklot för att härbärgera alla hårddiskar.

– Jag tror att sociala medier som Facebook inom en snar framtid behöver införa begränsningar kring hur mycket data varje enskild användare får ladda upp. Det är omöjligt att fortsätta så här, säger han.

Nick Goldman är övertygad om att dagens hårddiskar på sikt kommer att konkurreras ut av nya, mer effektiva metoder att lagra data. DNA, som utvecklats av naturen under miljarder år med syftet att lagra enorma mängder information, ser han som ett trovärdigt alternativ. Sedan Nick Goldman inledde sin DNA-forskning har han allt mer kommit att intressera sig för långtidsbevaring och det som brukar kallas ”The digital dark age”. Termen beskriver ett framtidsscenario då det kommer att vara svårt, eller till och med omöjligt, att studera dagens elektroniska filer eftersom de antingen förstörts eller sparats i föråldrade format. Frågan är aktuell inom arkivvärlden. Men någon slutgiltig lösning på problemet finns ännu inte. Nick Goldman tror att världssamfundet inom en relativt snar framtid kommer att skapa en bank med betydelsefull information sparad i artificiellt DNA. Han drar paralleller till det globala frövalvet på Svalbard där kopior av världens viktigaste matgrödor förvaras i ett utsprängt valv i Platåberget utanför Longyearbyen. Tillsammans med sin kollega Ewan Birney har Nick Goldman börjat göra skisser på hur ett motsvarande DNA-valv hade kunnat utformas.

– DNA är domedagssäkert. Så länge vi bygger valvet på ett tryggt ställe och lämnar instruktioner om principen och koden så kommer mänskligheten, förr eller senare, alltid att kunna läsa det. Även efter en imaginär apokalyps, säger Nick Goldman och ler.

Vi tar farväl av Nick Goldman och Paul Bertoni och lämnar EMBL-EBI:s anläggning. Under promenaden på bygatan genom Hinxton där vitsipporna precis slagit ut läser jag i mobilen några av de Shakespeare-sonetter som sparades i artificiellt DNA. Bland annat nummer 65 i sonettcykeln som avslutas med strofen: ”That in black ink my love may still shine bright”. Om Nick Goldmans vision blir verklighet kommer framtidens poeter att ersätta det svarta bläcket med artificiellt DNA.

Text: Johan Joelsson

Bilder: Jonatan Jacobson

 

dna3webb

 

dna6webb

 

dna9webb

 

dna12webb

 

dna4webb                 dna5webb

 

dna2webb

 

dna8webb

 

dna7webb

 

dna10webb                 dna11webb

 

dna13webb