Kontakt Impressum Datenschutz

web40art.com


AI - SciFi - Reality - Web 4.0 - Art

 

DNA-Speicher für mehr Daten

DNA-Speicher
Bild (Remix): Pixabay | Bild-Info

Die Datenmenge, die jeden Tag produziert wird, von Videoclips, die ins Internet hochgeladen werden, bis zu Satellitendaten, wird immer größer und bald werden die Speicher knapp. Hinzu kommt, dass Speicher, wie Festplatten, DVDs, USB-Sticks und selbst Magnetbänder nur eine begrenzte Haltbarkeit haben. Eine neue Möglichkeit, wesentlich mehr Daten für viel längere Zeit zu speichern, bietet da vielleicht die Erbsubstanz DNA...

Die gesamte Erbinformation eines Lebewesens ist in seiner DNA gespeichert, einem Riesenmolekül in Form einer Doppelhelix, deren beiden Stränge durch zahlreiche "Sprossen" miteinander verbunden sind. Diese bestehen wiederum aus vier so genannten "Basen" (Adenin, Guanin, Cytosin und Thymin), meist abgekürzt durch deren Anfangsbuchstaben (A, G, C, T), wobei ein Paar aus zwei Basen, also ein "Basenpaar", immer eine dieser "Sprossen" bildet.

Ein Basenpaar besteht entweder aus den beiden Basen "Adenin + Thymin" oder "Cytosin + Guanin", wobei es auch noch darauf ankommt, ob etwa bei der Kombination "Adenin + Thymin" zuerst das Adenin oder das Thymin in dem Basenpaar auftritt, sodass "Adenin + Thymin" ein anderes Basenpaar ist, als "Thymin + Adenin". Somit ergeben sich vier verschiedene Möglichkeiten, wie ein Basenpaar, bzw. eine "Sprosse" zusammengesetzt ist: "A+T", "T+A", "C+G" und "G+C".

Beispielsweise sind in der Doppelhelix der menschlichen DNA etwa drei Milliarden Basenpaare in einer genau festgelegten Reihenfolge hintereinander angeordnet, die dadurch den einzigartigen genetischen Code des Menschen ergeben. Während dieser biologische Code aus vier Grundelementen zusammengesetzt ist, also den Basenpaaren "A+T", "T+A", "C+G" und "G+C", besteht der digitale Code einer Datei nur aus zwei Grundelementen, den Nullen und Einsen.

Würde der biologische, bzw. genetische Code des Menschen in digitalen Code aus Nullen und Einsen umgerechnet, dann ergäbe sich daraus eine Datei mit einer Größe von gerade einmal 1,5 Gigabyte. Das ist nicht besonders viel, dafür ist dieser Code in der Natur, also in seiner ursprünglichen biologischen Form, jedoch auf sehr kleinem Raum abgespeichert, eben auf der Größe des DNA-Moleküls.

In nur einem Gramm DNA könnten sogar hunderte Millionen Gigabyte an Daten jeglicher Art gespeichert werden, von einfachen Textdateien, über Fotos, bis hin zu Video-Dateien, wenn es gelingen würde, die aus Nullen und Einsen bestehenden Dateien in biologische DNA-Moleküle umzuwandeln. Wenn die DNA kühl und trocken gelagert wird, könnte dieser Biospeicher sogar sehr lange Zeitspannen von tausenden Jahren erhalten bleiben, im Gegensatz zu herkömmlichen Speichern, deren Haltbarkeit auf wenige Jahre oder bestenfalls Jahrzehnte begrenzt ist, weshalb die darauf gespeicherten Daten nach einer bestimmten Zeit immer wieder auf neue Speicher übertragen werden müssen.

Daher versuchten Forscher schon seit Jahren, eine Speichermethode auf DNA-Basis zu entwickeln. In der Anfangszeit gelang ihnen dies jedoch nur mit mäßigem Erfolg. Zum einen waren die Kosten viel zu hoch, zum anderen konnten nur sehr kleine Dateien mit einer Größe von wenigen Bytes in DNA-Abschnitten gespeichert werden. Auch das spätere Umwandeln der künstlich hergestellten DNA-Moleküle, zurück in Nullen und Einsen, also in die ursprünglichen Dateien, war sehr häufig fehlerhaft.

Im Jahr 2016 sorgte Microsoft dann für Aufsehen, als bekannt wurde, dass das Unternehmen die Firma Twist Bioscience, ein Biotechnologie-Unternehmen aus San Francisco, damit beauftragt hatte, zehn Millionen DNA-Stränge künstlich herzustellen, um eine mögliche Speichermethode auf DNA-Basis zu erforschen und dann erklärte, dass es gelungen sei, 200 Megabyte an Daten in DNA-Strängen zu speichern und anschließend wieder fehlerfrei in Dateien zurückzuwandeln.

Einen weiteren entscheidenden Durchbruch in diesem Forschungsbereich erzielten dann im März 2017 zwei Forscher der Columbia University und dem New York Genome Center, der Bioinformatiker Yaniv Erlich und seine Kollegin Dina Zielinski. In einem Experiment speicherten sie eine zwei Megabyte große Datenmenge in DNA-Substanz und verwendeten dabei ein spezielles Codierverfahren, den so genannten "Fountain Code", mit dessen Hilfe das Speichern von Daten in DNA-Biomolekülen noch einfacher möglich ist. Selbst beim Anfertigen zahlreicher Kopien ihrer DNA-Speichermoleküle mit Hilfe der PCR-Methode (PCR - Polymerase-Kettenreaktion) traten in den Kopien keine Datenfehler auf.

Die Kosten für diese Experimente lagen zwar noch bei mehreren tausend Dollar für eine immer noch geringe Datenmenge von lediglich zwei Megabyte, dennoch werden die von Yaniv Erlich und seiner Kollegin Dina Zielinski entwickelten Verfahren der Forschung auf diesem Gebiet wohl neuen Aufschwung geben.


 
Diesen Artikel teilen...
 
Durch Klick auf eines der folgenden Themen/Schlagwörter ähnliche Artikel finden...