Будинки Новини та аналіз Вам потрібне додаткове сховище? спробуйте ДНК

Вам потрібне додаткове сховище? спробуйте ДНК

Зміст:

Anonim

Інженери протягом десятиліть успішно висувають більше сховищ у менші простори, але це не може тривати назавжди. Наступний великий стрибок зберігання даних може набути форми ДНК усередині органічної речовини: Вчені в лабораторіях по всій країні експериментують із синтетичною ДНК як середовищем зберігання.

"Якщо ви подивитесь, куди йде електроніка, кремнієві технології, багато основної технології, яку ми сьогодні використовуємо для побудови комп'ютерів, ми майже наближаємось до межі", - каже Луїс Анріке Чезе, доцент кафедри інформатики та інженерія у Вашингтонському університеті. "ДНК дуже щільна, вона дуже міцна, і для її утримання потрібно дуже мало енергії, тому використання ДНК для зберігання даних є великою перевагою".

Сезе співпрацює з Карін Стросс, науковою дослідницею архітектури комп’ютерів в Microsoft Research, над співпрацею між двома установами - проектом, який мостить інформатику та біологію. Для команди, яка складається приблизно з 20 осіб, університет забезпечує молекулярних біологів, а Microsoft - комп'ютерними вченими.

Щоб зрозуміти, як ДНК можна використовувати для зберігання, врахуйте, що всі комп'ютерні дані є двійковими або базовими-2. ДНК - це основа-4, що складається з аденіну, цитозину, гуаніну та тиміну (скорочено A, C, G та T). Перший крок - перетворення інформації бази-2 в базу-4, тому А відповідає 00, С - 01, Г - 10 і Т - 11 (це трохи спрощує її, але потрапляє в ідею).

Потім вчені використовують машину під назвою синтезатор ДНК, щоб поєднати чотири хімічні речовини в потрібному порядку. Результат багато разів зберігає інформацію у вигляді сольового скупчення, меншого за кінчик олівця. Читаючи цю інформацію, потрібен секвенсор ДНК.

Хоча це може здатися крихким - як щось, що може здутись, коли двері раптово відкриються - ДНК - це найсильніший засіб зберігання даних, який ми бачили. Вчені успішно прочитали ДНК, якій вже сотні тисяч років.

Послідовність ДНК передбачає видалення крихітного шматочка зберігається матеріалу, і процес виснажує цей зразок. Отже, запис ДНК можна прочитати в кінцевій кількості разів. Це, однак, не проблема, оскільки на збереженому матеріалі є стільки зайвих даних; його можна пробувати знову і знову. На сьогоднішніх носіях зберігається також обмежена кількість циклів запису та читання, перш ніж вони виходять з ладу, тому це не є новим.

Як вказує Сезе, ДНК ніколи не буде застарілою. Хоча багато хто з нас мають дискети в задній частині ящика, які ми вже не можемо читати, це не буде долею ДНК. "Ми завжди будемо піклуватися про ДНК з причин життя та здоров'я, тому у вас завжди буде спосіб читання інформації, що зберігається в ДНК", - говорить Чезе.

У липні 2016 року Microsoft та Університет Вашингтона успішно зашифрували 200 МБ даних у форму ДНК, найкращі результати попереднього запису в 22 Мб. За допомогою ДНК, каже Строс, в 1-дюймовому кубі можна буде зберегти 1 екзабайт даних - це 1 мільярд ГБ.

"Ми зробили оцінку того, скільки даних ви можете вмістити в певному обсязі", - говорить Строс. "Ми намагалися оцінити, який би був обсяг, якби сьогодні ми вирішили архівувати весь доступний Інтернет, маючи на увазі все, що не стоїть за паролем чи будь-якою електронною стіною, і ми придумали розмір великої коробки".

Це звучить як далека пропозиція, але Ceze вважає, що ми побачимо комерційні системи зберігання ДНК на ринку через десять років. Вони не працюватимуть так само, як мікропроцесорні сховища, оскільки для створення ДНК потрібне вологе хімічне середовище, але вони забезпечуватимуть величезну ємність та випадковий доступ з тією ж швидкістю, яку зараз забезпечують корпоративні стрічкові системи.

Швидко наступаюче поле

ДНК існує вже мільярди років, але демонстрація ДНК як корисної технології зберігання почалася в 1986 році, коли дослідник MIT Джо Дейвіс закодував просте бінарне зображення в 28 пар базових ДНК.

Ще одним піонером у цій галузі є Джордж Черч, професор генетики, який працює в Гарвардському медичному училищі з 1977 року, а власну лабораторію працює з 1986 року. Церква зацікавлена ​​у зниженні вартості читання та запису ДНК з 1970-х років, вважаючи, що коли-небудь вони збираються разом для створення практичного зберігання даних. Він зацікавився роботою над дослідженнями ДНК близько 2000 року і провів критичні тести на секвенування та синтез у 2003 та 2004 роках. До 2012 року він зміг скласти обидві області та створити систему для кодування даних. Він написав цю роботу у впливовій статті 2012 року в Science .

"До 2003 та 2004 рр. Секвенування та синтез здійснювались по суті в капілярах - або невеликих трубочках - де ви мали б одну трубку на послідовність", - пояснює Черч. "Це було досить ручним і не масштабованим. Урок, який ми засвоїли з напівпровідникової галузі мікрофабрикації, вам потрібно було придумати спосіб розмістити їх по суті у двовимірній площині, а потім зменшити розмір функції. Ні один із них методи на основі стовпців були сумісні з цим, і тому в 2003 році ми показали, як можна розподілити послідовності на двовимірній площині, а потім зобразити їх за допомогою флуоресцентного зображення, яке зараз є домінуючим способом послідовності. Потім у 2004 році ми показали, що ви могли виготовити ДНК на площині, а потім зсунути її, і тоді вона могла бути ще більш компактною; тому літак був просто тимчасовим місцем для їх синтезу. Потім ви могли їх ущільнити в тривимірний об'єкт, який був мільйони разів компактніше, ніж звичайне зберігання даних.

"Це були доказом концептуальних вправ у 2003 та 2004 роках. У 2012 році ми та інші вдосконалили методи читання та запису ДНК, і я об'єднав їх в один експеримент, де я закодував книгу, яку я щойно записав у ДНК, включаючи зображення, що показують, що в основному все, що є цифровим, може бути закодовано ДНК ".

Хоча вартість є значною перешкодою для зберігання ДНК, Церква зазначає, що ціна різко знизилася за короткий час, коли було проведено дослідження. Вартість читання ДНК покращилася приблизно в 3 мільйони разів, тоді як вартість написання покращилася в мільярд разів. Він може бачити, як покращився ще на мільйон разів за ще менший час. Він також вказує, що вартість копіювання матеріалу ДНК майже безкоштовна, як і вартість тривалого зберігання. Для архівного зберігання вартість читання даних не є великою перешкодою, оскільки багато архівних матеріалів ніколи не читаються, а деякі елементи читаються вибірково. Подивіться на витрати всієї системи, радить він. Традиційні методи зберігання рухаються зі швидкістю закону Мура і незабаром будуть плато. Але технологія зберігання ДНК рухається швидше, ніж закон Мура, і не виявляє жодних ознак плато.

Архівне та хмарне зберігання - це те, що Церква спочатку сприймає зберігання ДНК. Компанії, включаючи IBM, Microsoft та Technicolor, мають власні науково-дослідні та дослідно-конструкторські команди, які вивчають цю область, зазначає він. Він співпрацював з Technicolor у 2015 році, щоб зберігати «Поїздку на Місяць», класичний фільм 1902 року, який колись вважався втраченим, до ДНК. Зараз у Technicolor є багато копій ДНК, які в поєднанні не більше, ніж цяточок.

Церква має лабораторію з 93 людей, які працюють над зберіганням ДНК і зараз зосереджуються на двох цілях. Перший - кардинально покращити швидкість за цикл. Інформація зберігається в сотнях шарів, кожен товстий як молекула. Кожне додавання наразі займає три хвилини, але Церква вважає, що його можна звести до меншої секунди. Це в 200 000 разів швидше, зазначає він, і означає перехід від органічної хімії до біохімії. Він також хоче змінити спосіб виготовлення інструментів для читання та письма, щоб зробити їх значно меншими. Наразі вони мають розміри великих холодильників. Він хоче, щоб це зменшило.

Вбудована надмірність та необхідність виправлення помилок

Один із дослідників, на яких вплинула стаття Церкви в 2012 році, - професор Ольгіка Міленкович з Університету Іллінойсу, Урбана-Шампейн. У статті згадувалося про необхідність кодування, що негайно викликало її інтерес. Кодування в дослідженні зберігання даних - це техніка додавання надмірності до даних, надмірність, яка згодом може бути використана для виправлення помилок, що виникають під час процесу читання та запису. Для прикладу, чому це важливо, дивіться дві картинки Citizen Kane тут. Обоє були закодовані в ДНК командою Міленковича та потім прочитані. Здогадайтесь, хто з них використав надмірність.

Ви маєте рацію: зображення лівої кодувалося надмірністю, а зображення праворуч - ні.

Простий спосіб додавання надмірності - це повторення кожного символу кількість разів. Замість того, щоб писати 0, пишіть його чотири рази. Це підхід грубої сили - простий, але жахливо неефективний. Робота Міленковича полягає в тому, щоб домогтися того ж виправлення помилок більш досконалим способом. Він передбачає методи, які називаються перевірки паритетності або лінійні перевірки конгруентності, щоб забезпечити способи перевірки даних.

"Все поле полягає в тому, щоб допомогти вам виправити помилки, якщо вони з'являються, а ще краще - уникати помилок, які, за вами, ймовірно, з'являться", - говорить Міленкович. "Ми вводимо контрольоване надмірність, щоб позбутися помилок, і це контрольоване надмірність не у формі простого повторення, оскільки це дуже неефективно".

Це те, що принесло Міленкович у поле, але її дослідження зараз стосуються зниження величезних витрат на синтез ДНК.

"Мій студент Х. Табатабае Язді, який був дуже активним на цю тему, і я дуже намагався придумати розумний спосіб уникнути синтезу ДНК. Синтезування ДНК - це абсолютно вузьке місце для цієї технології через високу вартість, - каже Міленкович.

Хоча Міленкович намагається розкрити занадто багато інформації про неопубліковані дослідження, її рішення передбачає "хитрі математичні підходи" і все стосується часу, де розмір інтервалу між бітами інформації має значення.

"Якщо ви не обіцяєте формальності, яку ви хочете використовувати ATGC, щоб дійсно кодувати бінарні символи в певному місці, ви можете придумати набагато розумніші та ефективніші засоби зберігання інформації, тому що вам не потрібно синтезувати нитки знову і знову. знову, - пояснює Міленкович. "Ви можете синтезувати їх один раз певним чином, а потім повторно використовувати цю синтезовану ДНК розумним комбінаторним способом".

Завдяки своїй роботі Міленкович сподівається знизити витрати на синтез ДНК як мінімум на три порядки. Цього ще недостатньо, зазначає вона, але це прогрес. Це також сприяє проведенню досліджень, які вона вважає захоплюючими.

"Дуже чесно, якщо чесно, грати в Бога і кодувати власну інформацію в ДНК", - говорить Міленкович. "Це дає людині відчуття хвилювання, коли вона знає, що ви граєте з обраною молекулою природи і змушує її робити те, що ви хочете зберігати, кодувати і передавати інформацію в майбутнє".

Внесення коштів - будь-який день зараз

Це не все сухе запилене академічне дослідження зі зберіганням ДНК. Helixworks, компанія, що базується в Ірландії, вже намагається заробити на цьому гроші. У нього є продукт на Amazon - такий собі.

"Ми запустили на Amazon, щоб ви могли отримати 512 Кб цифрових даних, закодованих у ДНК", - пояснює Німеш Піннаманені, співзасновник компанії. "Це щось дуже маленьке. Можливо, картина чи, можливо, вірш, щось подібне".

Це незвична покупка, але це може бути ідеальним знаком любові для людини, яка має все, особливо якщо ця людина є вченим:

"Я пам'ятаю, як один замовник телефонував нам. Він хотів подарувати дружині - вони обоє - біотехнологи - він хотів подарувати дружині на річницю весілля. Він хотів поставити повідомлення в ДНК і подарувати їй ДНК", - згадує Піннамані. "Їй доведеться послідувати ДНК, щоб прочитати повідомлення. Це досить складний спосіб відправити любовне повідомлення, але, можливо, це біле для біотехнологів, знаєте?"

Але Helixworks трохи випередила себе, розмістивши свій продукт на Amazon в серпні 2016 року, перш ніж він був готовий виконати замовлення. Двоє людей придбали компанії 199 доларів DNADrive - 14-каратову золоту капсулу із скупченням ДНК всередині - до того, як Helixworks змушений був залишити свій продукт. DNADrive досі перебуває на Amazon, але його не можна придбати.

Це не означає, що Helixworks закінчився, просто надто нетерплячий. Зараз занадто далеко, щоб зупинитись. Компанія розпочала роботу в університеті міста Борос у Швеції, де Піннаманені (на фотографії зліва) та Сахін Халапаті (справа), інший співзасновник компанії, отримували ступінь магістра з біотехнології. Вони зібрали кошти на дослідження зберігання ДНК, продовжили свою роботу, повернувшись додому в Бангалор, Індія, і розробили доказ концепції.

Завдяки додатковим коштам вони принесли їх до програми прискорювачів IndieBio, керованої SOSV, стартовою фірмою венчурного капіталу в Сан-Франциско, Каліфорнія. Helixworks була обрана програмою і отримала 50 000 доларів готівкою та можливість працювати з лабораторії в графстві Корк, де це було останні шість місяців. Програма включає в себе наставництво з виведення продукту, яке Helixworks використає на цьогорічному фестивалі South by Southwest, де він буде змагатися у виставковому заході.

Хоча вибивання золотих капсул ДНК може врешті стати вигідною стороною, Піннаманні каже, що майбутнє його компанії - у компактних домашніх та офісних ДНК-принтерах, які вона зараз розробляє. Він хоче зробити зберігання ДНК простим і доступним для всіх, хто може їх використовувати.

"Ми зрозуміли, що вам потрібно мати щось, що працює як картридж у принтері", - пояснює Піннамані. "У вас просто чотири кольори, і ці чотири кольори можуть поєднуватися, щоб утворювати будь-який можливий колір, так? Ось так працює ваш чорнильний принтер. Ми зрозуміли, що нам потрібно мати щось подібне в нашій системі. Ми розробили картридж з 32 реагентів, які може бути об'єднано для формування будь-якої можливої ​​послідовності ДНК ".

У той час як інші лабораторії платять близько 30 000 доларів кожного разу, коли їм потрібно синтезувати ДНК, операція, на яку потрібні тижні, Піннаманені каже, що його винахід може суттєво знизити вартість та час. Helixworks співпрацює з Opentrons, компанією, яка виробляє автоматичне лабораторне обладнання, щоб створити принтер. Це те, що буде подано на SXSW.

"Те, що ми демонструватимемо на виставці, - це написання ДНК прямо перед вашими очима", - говорить Піннаманені.

Компанія поки не приймає жодних замовлень. І це добре, адже той романтичний біотехнолог ще чекає свого ювілейного подарунка.

Вам потрібне додаткове сховище? спробуйте ДНК