רעיון מרכזי מתמטיקה וכלכלה פורסם: 16 ביולי, 2025

מידע עצום במולקולה זעירה: עידן חדש באחסון מידע על דנ”א (DNA)

תַקצִיר

כמה תמונות צילמתם השבוע? האם צפיתם ב-YouTube? ומה עם סדרה ב-Netfllix? כל המידע הדיגיטלי מהפעולות האלו נשמר בטלפון, במחשב, ובענן, כדי שתוכלו לשלוף אותו מתי שתרצו. מכיוון שבשנים האחרונות אנחנו מייצרים יותר ויותר מידע, הטכנולוגיה המשמשת לאחסון הנתונים האלה ניצבת בפני אתגרים מורכבים. פתרון מבטיח להתמודדות עם האתגרים האלה, הוא שימוש במולקולות דנ”א (DNA) מלאכותיות. דנ”א הוא חומר טבעי המצוי בכל תא ותא של יצור חי, ובו מאוחסן המידע הגנטי העצום של אותו היצור. כיום יודעים לייצר מולקולות דנ”א במעבדה. לכן, ניתן לעשות שימוש בפוטנציאל האחסון האדיר של הדנ”א, ולשמור בו מידע דיגיטלי ולא רק ביולוגי. במאמר זה נציג פתרון שמשלב ביולוגיה ומחשבים, שני עולמות שאנחנו מחברים כדי לייצר מולקולות דנ”א מלאכותיות שמאחסנות מידע דיגיטלי גדול לזמן ממושך ובאופן ידידותי לסביבה.

אתגר אחסון המידע

כמות המידע הדיגיטלי שאנחנו יוצרים הולכת וגדלה בקצב מסחרר מידי יום. לפי ההערכות, כמות המידע שנצטרך לאחסון בשנת 2025 תהיה גדולה פי חמישה ויותר מכמות המידע שהיה קיים ב-2018 (איור 1). הגידול המשמעותי במידע תלוי במספר גורמים, ביניהם השימוש בטלפונים חכמים, רשתות חברתיות, צמיחה של טכנולוגיות בינה מלאכותית (AI) ועוד. הטכנולוגיות הללו יוצרות מגוון עשיר של נתונים מסוגים שונים, כמו מידע אישי, תכנים ממדיות חברתיות, מידע עסקי, נתונים רפואיים, מידע מחיישנים וכל מידע אחר שמאוחסן במחשב.

איור 1 - צפי כמות המידע הדיגיטלי בעולם בטווח השנים 2010–2025, ביחידות זטה-בית.
  • איור 1 - צפי כמות המידע הדיגיטלי בעולם בטווח השנים 2010–2025, ביחידות זטה-בית.

ככל שהטכנולוגיה שלנו מתפתחת, נרצה לאחסן יותר מידע ולאפשר גישה אליו. לכן, על פניו, נראה כי הגידול בכמות המידע הוא דבר נפלא, אז למה זו בעצם בעיה? הריבוי ההולך וגדל של מידע שאנחנו יוצרים וצריכים לאחסן מציב בפני האנושות אתגרים רבים שקשורים לאחסון הנתונים הללו. בפרט, אנחנו מתקרבים לנקודה שבה טכנולוגיות האחסון הקיימות היום לא יעמדו בעומס. יש לכך השלכות מרחיקות לכת, שכן העולם הטכנולוגי שבו אנחנו חיים תלוי באחסון מוצלח של מידע דיגיטלי.

בשנים האחרונות, נאמר לנו ”תשמרו את הקבצים שלכם בענן, כך יהיה לכם מקום” כאילו היה אותו ”ענן” מרחב אינסופי ובלתי נראה המסוגל לאחסן בתוכו מידע ללא גבול. אבל, חשוב להבין מה באמת עומד מאחורי המילה הזו ”ענן”. לא מדובר במרחב אינסופי ובלתי נראה, אלא במבנים עצומים של מרכזי נתונים אשר מתפרסים על פני שטח של מספר מגרשי כדורגל המחוברים זה לזה. מרכזים אלה מכילים אלפי ואפילו מיליוני מחשבים המשמשים לאחסון וניהול המידע הרב ששמור בהם. מסיבה זו, לא רק שהם גוזלים מקום ואדמה יקרים, צריכת החשמל בהם משתווה לזו של עיר בגודל בינוני. לכן, לא נוכל להמשיך ולאחסן מידע באופן זה, וכבר בעתיד הקרוב יהיה עלינו למצוא פתרונות אחסון חלופיים (איור 2).

איור 2 - מרכז אחסון המידע המתוכנן של חברת Meta (Facebook). קרדיט לאיור: Meta (Facebook).
  • איור 2 - מרכז אחסון המידע המתוכנן של חברת Meta (Facebook). קרדיט לאיור: Meta (Facebook).

יתרונות האחסון של הדנ”א

ישנן מספר דרישות שפתרונות אחסון המידע צריכים לענות עליהן: לאפשר אחסון של כמויות מידע גדולות, להיות ידידותיים לסביבה ובעלי תוחלת חיים ארוכה. אחד הפתרונות המבטיחים להתמודדות עם אתגרים אלו הוא השימוש במולקולות דנ”א מלאכותיות לאחסון מידע דיגיטלי. אבל, איך? מה יש במולקולה הזו ובמבנה שלה שמאפשר זאת?

דנ”א הוא מולקולה הקיימת בטבע בכל יצור חי, מחיידקים ועד בני אדם. הדנ”א מכיל את כל המידע הגנטי הדרוש ליצירת חיים. מולקולת דנ”א בנויה כשרשרת ארוכה המורכבת מארבע אבני בניין, והן אדנין (המסומן באות A), גואנין (G), תימין (T) וציטוזין (C). הסדר שבו ארבע אבני הבניין הללו מרכיבות את שרשרת הדנ”א הוא ייחודי לכל יצור חי.

כיום ניתן לייצר דנ”א במעבדה באופן מלאכותי, ולתכנן את המולקולה כך שתורכב כמעט מכל רצף של ארבע אבני הבניין שנרצה. טכנולוגיה זו של ייצור דנ”א מלאכותי נמצאת בראשית דרכה, וישנם שני אילוצים עיקריים שעלינו להביא בחשבון. ראשית, אנחנו יכולים לייצר מולקולות קצרות בלבד. שנית, מכל מולקולה בודדת שנרצה לייצר, יתקבלו אלפי עותקים (כמעט) זהים שלה.

בעוד שטכנולוגיית הייצור של דנ”א נמצאת עדיין בחיתוליה, מזה שנים רבות אנחנו יודעים לקרוא ולזהות את הסדר של ארבע אבני הבניין שמרכיבות את המולקולה [1]. כיום ניתן בקלות ובדיוק רב ”לרצף” מולקולת דנ”א, כלומר לזהות את רצף אבני הבניין שבה.

“למה בעצם דנ”א?” למולקולות דנ”א יתרונות רבים כרכיב אחסון מידע, וזאת בהשוואה לחלופות הדיגיטליות שבהן אנחנו משתמשים כיום:

.1 נפח אחסון

מולקולת הדנ”א אמנם זעירה בגודלה אך היא יכולה להכיל כמות מידע עצומה. לכן לא יהיה צורך במבנים ענקיים כמו מרכזי אחסון המידע שקיימים היום. למשל, אם נשמור הרבה מולקולות דנ”א עם מידע דיגיטלי בתוך כלי אחסון שגודלו כשל אדם ממוצע, נוכל לשמור כ-150 מיליארד טרה-בית. זהו נפח אחסון אדיר, השקול למה שניתן לאחסן בכ-150 אלף מרכזי אחסון.

.2 יציבות לאורך זמן

למולקולת דנ”א יש מבנה יציב שיכול להישמר למשך זמן ארוך ולכן מדענים כיום מצליחים לרצף דנ”א ממאובנים של יצורים שחיו בכדור הארץ לפני מאות אלפי שנים. מסיבה זו, אחסון מידע דיגיטלי על דנ”א יוכל להישמר למשך זמן רב, בעוד משך החיים של טכנולוגיות האחסון הנוכחיות הוא כ-3-30 שנים.

.3 חיסכון באנרגיה

דנ”א אינו דורש חיבור תמידי לחשמל כדי לשמור את הנתונים שעליו. לכן, פתרונות אחסון מבוססי דנ”א עתידים לאפשר חיסכון עצום בצריכת אנרגיה ולהוות פתרון ידידותי לסביבה.

שיטת העבודה לאחסון מידע על דנ”א

איך לוקחים מידע דיגיטלי שהאדם מייצר, כמו קובץ מוזיקה, וידאו, או תמונה, ושמים אותו על מולקולות דנ”א זעירות? הסוד הוא בשפה. מידע דיגיטלי מאוחסן על מחשב בשפה בינארית שמורכבת משתי אותיות בלבד, 0 ו-1. לעומת זאת, מידע ביולוגי מאוחסן על מולקולת דנ”א בשפה אחרת לגמרי, שפת קוד גנטי של דנ”א, ובה ארבע אותיות, A, C, G, T. אם נדע לתרגם שפה אחת לשנייה, נוכל לאחסן את המידע הדיגיטלי במולקולות דנ”א קטנטנות, בהן נשמרות כמויות אדירות של מידע. לכן, מה שאנחנו עושים הוא לייצר מולקולות דנ”א מלאכותיות שבנויות מראש לפי המידע הדיגיטלי שאנחנו רוצים לשמור, וזאת על ידי תרגום השפה הבינארית לשפת הדנ”א. לפניכם דוגמה להבנת תהליך התרגום.

כדי לבצע תרגום נדרש מכנה משותף המחבר בין שתי השפות. האם תוכלו לחשוב על מכנה משותף כזה?

נתחיל ונחפש קודם כל בשפה הבינארית. שחקו עם האותיות 0 ו-1, ונסו לסדר אותן בזוגות בצורות שונות, למשל 1 עם 0, או 0 עם 0, וכדומה… במהרה תגלו שהשילובים האפשריים הם רק אלו:

00

01

10

11

ארבעת השילובים האלה הם מכנה משותף מספק, כי גם בשפת הדנ”א יש רק ארבע אפשרויות, והן האותיות A, C, G, T. אהא! מצאנו את המכנה המשותף. נוכל לכתוב כל זוג בינארי עם אות אחת בשפת הדנ”א:

במקום 00 נכתוב A.

במקום 01 נכתוב C.

במקום 10 נכתוב G.

במקום 11 נכתוב T.

בעזרת תוכנת מחשב, נתרגם את כל המידע מהקובץ הדיגיטלי הכתוב בשפה בינארית, ונכתוב אותו בשפת הדנ”א.

למשל:

אם בקובץ הדיגיטלי כתוב:

000100111110010011

נחלק את הרצף הבינארי לזוגות ונסמן כל זוג בצבע:

00 01 00 11 11 10 01 00 11

ואז נתרגם כל זוג בינארי לאות שקבענו בשפת הדנ”א:

A C A T T G C A T.

חשוב לציין שזוהי רק דוגמה, בפועל משתמשים בתרגומים יותר מתוחכמים מאלו שהוצגו כאן. זאת במטרה לשמור על המידע גם אם מתרחשות שגיאות במערכת [2].

התרגום לשפת הדנ”א מאפשר לנו להתקדם לשלבים הבאים בתהליך אחסון המידע [3].

איור3 מציג תקציר של הדרך שבה אנחנו שומרים מידע דיגיטלי על גבי מולקולות דנ”א, ואז שולפים אותו חזרה לפי השלבים הבאים:

    1. כתיבת הקבצים בשפה בינארית. בגלל האורך המוגבל של מולקולות הדנ”א שאותן אנחנו יכולים לייצר, נחלק את הקבצים לחתיכות קטנות ונכתוב כל חתיכה בשפה בינארית.

    2. תרגום של המידע הדיגיטלי הכתוב בשפה הבינארית לשפת הדנ”א. שלב זה נעשה בעזרת תוכנת מחשב.

    3. שמירת המידע במולקולות דנ”א ע”י ייצור המולקולות הרצויות במעבדה בעזרת מכשור מתקדם. בגלל אופן הפעולה של המכשור שבו אנחנו משתמשים כיום, מכל מולקולה בודדת שאנחנו רוצים לייצר, נקבל מספר רב של עותקים, וכל המולקולות הללו נשמרות יחד בכלי אחסון ללא סדר בניהן. כמו כן, בגלל התהליך הרגיש יתכנו שגיאות בחלק מהמולקולות.

איור 3 - תהליך אחסון מידע דיגיטלי על מולקולת דנ”א במעבדה ופענוח חזרה של קבצי המקור הדיגיטליים.
  • איור 3 - תהליך אחסון מידע דיגיטלי על מולקולת דנ”א במעבדה ופענוח חזרה של קבצי המקור הדיגיטליים.
  • התהליך מתחיל מכתיבת הקבצים בשפה בינארית (שלב 1). בשלב השני, מתבצע תרגום (שלב 2) של המידע הדיגיטלי הכתוב בשפה הבינארית לשפת הדנ”א. לאחר מכן מתבצעת שמירה של המידע במולקולות דנ”א (שלב 3) ע”י ייצור המולקולות הרצויות במעבדה בעזרת מכשור מתקדם. מאוחר יותר, גישה למידע מתבצעת בעזרת קריאה (שלב 4) של מולקולת הדנ”א שנמצאת בכלי האחסון למילים בשפת הדנ”א ופענוח (שלב 5), שלהן, כלומר לתרגם אותן חזרה לקבצים שלנו באופן ממוחשב. (Created with BioRender.com).

כאן מסתיים תהליך העברת המידע הדיגיטלי אל מולקולות הדנ”א המלאכותיות, אשר שומרות את המידע בצורה יציבה לאורך זמן רב. בכל עת ניתן לשלוף את המידע מהמולקולות, ולהפוך אותו חזרה לקובץ הדיגיטלי המקורי בעזרת השלבים הבאים:

    4. קריאה של מולקולת הדנ”א הנמצאות בכלי האחסון. מתהליך הקריאה מתקבל אוסף של מילים בשפת הדנ”א.

    5. פיענוח רצף המילים משפת הדנ”א (תרגום) בחזרה לקבצים בשפה הבינארית. תהליך זה נעשה בעזרת תוכנת מחשב שמייצרת את הקובץ המקורי כפי שהיה בראשית הדרך.

סיכום

במאמר הזה דנו באתגרים הקיימים כיום לאחסון מידע והצענו פתרון חדש ומבטיח בדמות מולקולת הדנ”א. כמובן שהדרך עוד ארוכה עד שנוכל להעלות את המידע שלנו לענן מבוסס דנ”א, כי עוד צריך למצוא שיטות להוזיל עלויות ולשפר את הטכנולוגיה. אך בפעם הבאה שתצלמו תמונה, או תראו סדרה, חשבו לאן המידע הזה הולך והיכן הוא מאוחסן, כי יכול להיות שבקרוב תשלפו אותו מתוך מולקולת דנ”א ששומרת על כמות עצומה של מידע, לטווח ארוך, תוך כדי שמירה על הסביבה – דבר שמתאפשר בזכות חיבור בין שני עולמות, הביולוגיה והמחשבים.

עבודה זאת נעשתה במימון האיחוד האירופי (DiDAX, 101115134). עם זאת, הדעות וההשקפות המובעות הן של המחברים בלבד ואינן משקפות בהכרח את אלו של האיחוד האירופי או של הסוכנות המבצעת של מועצת המחקר האירופית. האיחוד האירופי או הרשות המממנת אינם יכולים להיחשב כאחראים להן.

מילון מונחים

בינה מלאכותית (Artificial Intelligence (AI)): מערכות או מכונות המחקות אינטליגנציה אנושית לביצוע משימות.

דנ”א מלאכותי (Synthetic DNA): נקרא גם דנ”א סינטטי. רצפים של מולקות דנ”א שנוצרו באופן מלאכותי במעבדה ולא נגזרו ממקורות טבעיים.

ריצוף דנ”א ”קריאה” (DNA Sequencing): שיטה מעבדתית המשמשת לקביעת הסדר המדויק של ארבע האותיות המרכיבות את מולקולת ה-DNA. ריצוף DNA מאפשר למדענים ”לקרוא” את המידע המאוחסן בDNA.

שפה בינארית (Binary Language): השפה המשמשת מחשבים ובאמצעותה מיוצג מידע במחשבים. שפה זו מבוססת על מערכת המספרים הבינארית העושה שימוש בספרות 0 ו-1 בלבד כדי לייצג את המידע.

הצהרת ניגוד אינטרסים

המחברים מצהירים כל המחקר נערך בהעדר כי קשר מסחרי או פיננסי שיכול להתפרש כניגוד אינטרסים פוטנציאלי.


מקורות

[1] Sanger, F., Nicklen, S., Coulson, A. R. 1977. DNA sequencing with chain-terminating inhibitors. Proc. Natl. Acad. Sci. 74:5463–5467. doi: 10.1073/pnas.74.12.5463

[2] Cosman, P. 2015. The Secret Code Menace. Winchester: Ransom.

[3] Grass, R. N., Heckel, R., Puddu, M., Paunescu, D., and Stark, W. J. 2015. Robust chemical preservation of digital information on DNA in silica with error-correcting codes. Angewandte Chemie Int. 54:2552–2555. doi: 10.1002/anie.201411378