DNS – Ein neuer Supercomputer?

Die Computer-Wissenschaftler Ron Rivest, Adi Shamir und Leonard Adleman publizierten 1978 einen Aufsatz über die von ihnen entwickelte “Method for Obtaining Digital Signatures and Public-Key Cryptosystems”, ein weltweit unter den Initialen der Gruppe “RSA” bekannt gewordenes Verfahren der digitalen Verschlüsselung von Informationen. Der immense Erfolg der Entwicklung war überraschend. Adleman, ein Experte für Nummern-Theorie, der schon vorher durch sein Programm “Life” bekannt geworden war, einer Simulation künstlichen Lebens, hatte nicht einmal von der Existenz der amerikanischen Nationalen-Sicherheits-Agentur (NSA) gewusst, als diese sich plötzlich meldete, kryptologische Verfahren als Waffe klassifizierte und deren Weitergabe als Waffenhandeln untersagen wollte. Aber es war zu spät, das Verfahren war schon außerhalb der USA bekannt geworden. 1982 gründete die Gruppe die Firma RSA Inc., um es kommerziell auszuwerten. Bis heute ist Adleman Teilhaber und Berater der Firma, deren Zukunft im Zeitalter des Information-Highways noch rosiger geworden ist. Doch dem 49-jährigen Mathematiker scheint noch einmal der große Wurf gelungen zu sein, und zwar mit der Erfindung des DNS-Computers …
Nachdem Adleman in den 80er Jahren bemerkte, dass die wissenschaftliche Forschung über AIDS immer mehr expandierte, begann er eigene Studien. Er entwickelte einen 1993 von Forschern der John Hopkins Universität bestätigten Ansatz, die natürliche Produktion der lebenswichtigen CD4-Zellen anzukurbeln, die von HIV getötet werden. Der Trick, auf den Adleman kam, ist folgender: wenn die verwandten CD8-Zellen, die auch bei AIDS-Infizierten ausreichend vorhanden sind, künstlich entfernt werden, produziert der Körper automatisch die durch AIDS dezimierten und daher dringend benötigten CD4-Zellen, um das Gleichgewicht wieder herzustellen. So schlicht bewies Adleman, dass auch für Newcomer Entdeckungen in der Biologie möglich sind. Doch es sollte noch besser kommen.

Als sich Adleman im Rahmen seiner AIDS-Studien in die Grundlagen der Genetik einarbeitete, fiel ihm auf, dass die Informationsverarbeitung in Organismen viele Gemeinsamkeiten mit der von Computern hat. Desoxyribonucleinsäure, besser bekannt unter der Abkürzung DNS, speichert Informationen in einem Vier-Buchstaben-Alphabet, das von Organismen so manipuliert wird wie Einsen und Nullen vom Computer. DNS ist ein natürlicher Bestandteil der Zellkerne. Sie enthält neben Zucker (Desoxyribose) und Phosphorsäure die vier Bausteine Adenin, Thymin, Guanin und Cytosin (A, T, G, C). Die lineare Abfolge dieser vier Basen in einem sogenannten DNS-Strang enthält die genetischen Informationen. Wichtig ist, dass die vier Basen nicht nur Molekülstränge bilden, sondern dass sich diese durch Wasserstoffbrücken zu einem Doppelstrang verbinden: der von den Molekulargenetiker James Watson und Francis Crick entdeckten Doppelhelix. Dabei sind die beiden DNS-Stränge exakt komplementär zueinander, denn aufgrund stereochemischer Gesetzmäßigkeit verbindet sich Adenin nur mit Thymin und Guanin nur mit Cytosin. A ist von T und G von C das komplementäre Spiegelbild. Ein Stück der Doppelhelix hat also stets eine Zusammensetzung wie im folgenden Beispiel:

…CGATAGCTGGCTTAG…

…GCTATCGACCGAATC…

Nur so können sich die einzelnen Stränge zur gedrillten Doppelhelix verbinden. Die langkettigen Moleküle sind der stoffliche Träger der genetischen Informationen. Im DNS-Strang einer Bakterie folgen z.B. 25 Millionen dieser 4 Buchstaben aufeinander. Die Evolution hat die DNS als eine Art natürlichen Informationsspeicher hervorgebracht, dessen Funktion die Steuerung und Reproduktion von Leben ist. Adleman fragte sich nun, wie sich die Prozesse der Informationsverarbeitung in der DNS benutzen lassen, um gezielte Aufgaben zu lösen. Die Vorzüge eines solchen DNS-Computers hatte er dabei klar vor Augen. Er wäre nicht nur kleiner, billiger und ökologisch verträglicher, sondern auch – aufgrund millionenfacher paralleler, d.h. gleichzeitiger Prozesse – allen heutigen Computern um ein Vielfaches überlegen.

Wer die DNS als Informationsspeicher und Rechner einsetzen will, muß wissen, wie man bestimmte Sektoren lesen, ausschneiden und kopieren kann. Durch seine AIDS-Studien verfügte Adleman über das dafür notwendige gentechnologische Wissen. Für die Gentechnik ist es nicht schwierig, eine beliebige Buchstaben-Sequenz in einem DNS-Strang herzustellen. Das Problem war nun, wie sich eine Fragestellung in das Vier-Buchstaben-Alphabet der DNS übersetzen lässt und wie sich die biologischen und chemischen Prozesse in der DNS als dessen Berechnung benutzen lassen. Und: um welches Problem sollte es sich dabei handeln? Schließlich mußte nicht nur die Möglichkeit bewiesen werden, dass sich DNS als Computer einsetzen lässt, sondern auch dass dessen Leistung die aller bekannten Computer übertrifft.

Nach sechs Monaten hatte Adleman ein geeignetes Design für den ersten DNS-Computer und auch ein Problem gefunden, an dem selbst Supercomputer scheitern: das sogenannte Hamilton-Pfad Problem. Es lässt sich als das Problem eines Handlungsreisen beschreiben, der die kürzeste Reiseroute zwischen verschiedenen Städten sucht und dabei auf eine bestimmte Anzahl von Flugverbindungen eingeschränkt ist. Vereinfachen wir Adlemans Versuchsanordnung und nehmen wir an, die Städte sind Berlin, Düsseldorf, Frankfurt und Stuttgart. Und nehmen wir weiter an, dass Flugverbindungen zwischen Berlin-Frankfurt, Frankfurt-Stuttgart, Frankfurt-Düsseldorf, Düsseldorf-Stuttgart bestehen. Wenn die Reise in Berlin beginnen und in Stuttgart enden soll, was ist die kürzeste Verbindung, die im Idealfall aus nur drei Flügen besteht? Die Antwort ist leicht. Wir fliegen von Berlin nach Frankfurt, von Frankfurt nach Düsseldorf und von Düsseldorf nach Stuttgart. Verdreifacht man allerdings die Zahl der Städte und Verbindungen, dann sind selbst Supercomputer überfordert. Adleman ging im ersten Anlauf zunächst von 7 Städten und 14 Flugverbindungen aus. Mit Hilfe der Gentechnik stellte er für jeden Stadtnamen einen 20 Buchstaben langen DNS-Strang aus dem Vier-Buchstaben-Alphabet Adenin (A), Thymin (T), Guanin (G) und Cytosin (C) her. In unserem vereinfachten Beispiel sind sie bloß 6 Buchstaben lang. Aus Berlin wird etwa TAGCGA, aus Frankfurt GCTTAG, aus Stuttgart GTCCGG usw. Die Flugverbindungen erhalten dann Flugnummern, die aus den 3 letzten Buchstaben des Abflugortes und den 3 ersten des Ankunftsortes zusammengesetzt werden: Die Verbindung Berlin-Frankfurt (TAGCGA-GCTTAG) erhält so die Flugnummer CGA-GCT, die zwischen Frankfurt und Stuttgart (GCTTAG-GTCCGG) die Flugnummer TAG-GTC. Setzt man nun die die Flugnummern dieser Verbindungen hintereinander (CGA-GCT+TAG-GTC), so taucht in Mitte der Name für Frankfurt auf, wie das folgende Schema zeigt:

Städte: Berlin-Frankfurt Frankfurt-Stuttgart

DNS-Namen: TAGCGA-GCTTAG GCTTAG-GTCCGG

DNS-Flugnummern: CGA GCT TAG GTC

DNS-Name Frankfurt: GCT TAG

Reiht man also die DNS-Flugnummern aneinander, so bilden sich die Namen der Städte, die auf der Reiseroute liegen. Aber wie lässt sich diese Reihung von Flugnummern mit Hilfe von DNS automatisieren und wie soll sich aus den Ergebnissen eine Antwort auf die Frage nach der kürzesten Reiseroute ergeben?

Adlemans DNS-Computer macht sich zunutze, dass sich DNS-Stränge zu einer Doppelhelix verbinden, wenn sie sich komplementär zueinander verhalten. Deswegen hat er für alle Städte und Flüge auch die komplementären Namen und Flugnummern synthetisiert. Jeder DNS-Strang hat ja in der Doppelhelix einen komplementären Strang, indem A für T, G für C steht und umgekehrt. Der komplementäre Name für Frankfurt (GCTTAG) ist z.B. CGAATC. Genau hier liegt nun das ganze Geheimnis des DNS-Computers. Schmeißt man nämlich alle DNS-Stränge und ihre komplementären Gegenstücke in einen Topf, so fügen sich die zueinander passenden Stränge zu langen Doppelmolekülen zusammen und bilden so sämtliche Ketten aller möglichen Flugkombinationen. Wie das folgende Schema zeigt, kombiniert sich der DNS-Strang für den Flug Berlin-Frankfurt (Flugnummer: CGA-GCT) mit dem für den Flug Frankfurt-Stuttgart (Flugnummer: TAG-GTC), wenn sie auf den Strang des komplementären Namens für Frankfurt (CGAATC) treffen.

Städte: Berlin-Frankfurt Frankfurt-Stuttgart

DNS-Flugnummern: CGA GCT TAG GTC

komplementärer Name für Frankfurt: CGA ATC

Adleman hat in seinem Versuch mit 7 Städten und 14 möglichen Verbindungen gearbeitet. Von jedem dieser insgesamt 21 DNS-Stränge, aber auch von ihren komplementären Gegenstücken hat er je 30 Billionen Kopien synthetisiert und sie in eine wässrige Lösung gegeben. Übertragen auf unser Beispiel wäre die Antwort nun in einer Kette enthalten, die mit der Sequenz CGA anfängt, dem Beginn einer Flugverbindung, die in Berlin startet, und mit GTC endet, was die Sequenz für einen Flug ist, der in Stuttgart endet. Doch welche der sich bildenden Doppelhelix-Ketten ist die richtige, d.h. steht für die kürzeste Reiseroute? Und wie lässt sie sich im Gewimmel der millionen Ketten finden? Adleman ging davon aus, dass die Antwort nicht kürzer als 6 und nicht länger als 8 oder 9 aneinandergereihte Flugnummern sein konnte. Gentechnisch sortierte er deshalb alle Ketten aus, die zu lang oder zu kurz waren, oder den falschen Anfangs- oder Zielort hatten. Nach einer Woche hatte er dann die Antwort. Das mag lang erscheinen, doch der DNS-Computer ist bei der Berechnung dieses Problems nicht nur hundertmal schneller als ein Supercomputer, sondern verbraucht auch nur ein Millionstel von dessen Energie und hat eine millionfach höhere Speicherdichte.

Aber so eindrucksvoll die Leistung von Adlemans ersten DNS-Computer auch sein mag, die Ermittlung der Antworten auf Probleme wie das des Hamilton-Pfades erfordert noch eine erhebliche Automatisierung. Und so gab es neben enthusiastischen Stimmen auch kritische, als Adleman die Ergebnisse seiner Arbeit veröffentlichte. Würde es gelingen, mit dem DNS-Computer mehr als nur kombinatorische Probleme zu lösen? Und würde es möglich sein, die Eingabe von Aufgaben so zu vereinfachen, dass sich die neue Technologie so universell einsetzen lässt wie ein herkömmlicher PC?

Der mit Adleman befreundete Computer-Wissenschaftler Richard Lipton erkannte die nächsten Schritte des DNS-Computers zum Universalcomputer. Neben einigen neuen Techniken, Antworten aus der DNS-Suppe herauszufischen, entwickelte er ein Kodierungsverfahren, dass das 4-Buchstaben-Alphabet der DNS in Nullen und Einsen übersetzt. Dadurch wurde es möglich, die Suppe mit symbolischer Logik zu würzen, die Ja-Nein-Entscheidungen erlaubt. Damit ist der DNS-Computer annähern so universell programmierbar wie moderne Computer. Nach Lipton würde ein DNS-Computer mit Billionen parallel arbeitender Prozessoren nicht mehr als $ 100.000 kosten. Auf einer von ihm im April 1995 abgehaltenen Konferenz in Princeton überschlugen sich Wissenschaftler verschiedener Bereiche. Sie sehen mit dem DNS-Computer Durchbrüche in der Quantenmechanik, dem Design von Medikamenten oder auch in der Entschlüsselung der menschlichen Gene bevorstehen. Zwei Studenten von Lipton hingegen stellten ganz pragmatisch in Aussicht, innerhalb von einigen Monaten das bislang als absolut sicher geltende amerikanische Verfahren der digitalen Datenverschlüsselung, den “Data Encryption Standard”, knacken zu können. Sollte dies tatsächlich gelingen, wird der Run auf die molekulare Informationsverarbeitung erst richtig losgehen. Denn dann sind handfeste Anwendungen nicht nur in der Nachrichtentechnik, sondern auch in den Nachrichtendiensten greifbar. Doch auch schon ohne solche spektakulären Erfolge überschlagen sich die Visionen des Machbaren. Adleman sieht ganz neue Arten von Computern auf uns zukommen: organische, chemische, katalytische usw. Das mag wie Science Fiction klingen, die ja tatsächlich schon von gentechnisch hergestellten, lebenden Waffen erzählt, doch dieses Genre sollte man nicht unterschätzen. Schließlich war es Stanislaw Lem der schon 1972 in seinem Erzählband Nacht und Schimmel die Idee des DNS-Computers vorwegnahm.

Dort allerdings entwickelt dieser Selbstbewusstsein und interessiert sich schon nach wenigen Minuten nicht mehr für die Probleme der minderbemittelten Gattung Mensch …

Dirk de Pol, DNS – Ein neuer Supercomputer? Die Neue Gesellschaft / Frankfurter Hefte 2/96, Verlag J.H.W. Dietz, Bonn 1996 ISSN 0177-6738

digital

AUCH INTERESSANT

Menü