שיטות חישוביות בחזית הביולוגיה

על שיטות לניתוח של ביטוי גנים ברמת התא הבודד למלחמה במחלות חשוכות מרפא

 

מאת ד”ר דביר ארן מעמותת סיינס אברוד בשיתוף עמותת מדע גדול, בקטנה.

 

שיטות המשלבות מודלים ממוחשבים וניסויים במעבדה נמצאות בחזית המחקר הגנטי, ועוזרות לנו להבין כיצד משפיעות מחלות על הגוף האנושי. דגימות הנלקחות מרקמות של יצורים חיים מורכבים מערב-רב של תאים מסוגים שונים, ולכן ביטוי הגנים שלהם מעורפל וקשה לניתוח. טכנולוגיות חדשות מאפשרות לפרוט את ביטוי הגנים לפי סוגי התאים השונים שברקמה ומובילות לתגליות יוצאות דופן, בין השאר במלחמה במחלות חשוכות מרפא.

לפני כ-20 שנה, לקראת סיום פרויקט מיפוי הגנום האנושי, נפגשו חוקרי הגנום הבכירים בעולם בכנס במעבדות קולד ספרינג הארבור. במהלך הכנס יזמו החוקרים משחק ניחושים לגבי השאלה מהו מספר הגנים בגוף האדם. מאות חוקרים השתתפו בהימור והממוצע עמד על 62,598 גנים. בסופו של דבר ב-2003 הוכרזה הזוכה – פרופ’ לי רואן שהימרה על 25,947 גנים – המספר הנמוך ביותר מבין כלל ההימורים. היום מעריכים את מספר הגנים בגוף האדם בכ-20,000 גנים, פחות מעכברים (23 אלף), כלבים (25 אלף), אורז (50 אלף) וצמח החיטה (100 אלף). ההבנה שביצורים מתוחכמים כמונו יש כל כך מעט גנים עדיין מפתיעה, אך בשנים שעברו מאז ההימור למדנו כי חרף מספרם המצומצם, עוצמת הביטוי של כל גן משתנה בין תא לתא. ההבדלים בעוצמת הביטוי יוצרים את השונות בין מאות סוגי התאים בגוף האדם, ומאפשרים את העושר של הקיום האנושי.
גן הוא רצף DNA שעובר ביטוי: מהרצף נוצרים העתקי RNA (תשלילים העשויים מחומצה ריבונוקלאית) ומחלק מתשלילים אלו מתבצע תרגום לבניית חלבון. חלק מהגנים מתבטאים רק בסוגי תאים מסוימים. כך למשל, על אף שכמעט כל התאים בגוף מכילים בדיוק את אותו ה-DNA, רק תאים מסוימים בלבלב מייצרים את ההורמון אינסולין. עם סיום מיפוי הגנום האנושי, פותחו טכנולוגיות שונות כדי למדוד רמות של RNA בתאים כדי לזהות את הגנים שמתבטאים ברקמה ואת עוצמות הביטוי שלהם.
על מנת למדוד ביטוי גנים יש ליטול דגימה מרקמה המכילה הרבה מאוד תאים. בעזרת חומרים שונים הורסים את התאים ושולפים מתוכם את ה-RNA. רצפי ה-RNA שנשלפו מייצגים גנים שהתבטאו בתאים השונים, ומספר ההעתקים של כל רצף מייצג את עוצמת הביטוי של הגן בדגימה. היכולת למדוד ביטוי גנים היא כלי מרכזי בארגז הכלים של המחקר הביולוגי.
מספר העותקים המתקבל ממדידת ביטוי גנים הוא נתון חשוב אבל גם מתעתע כיוון שהרקמה מורכבת מכמות גדולה של תאים מסוגים שונים, ולכל סוג תא יש פרופיל ביטוי שונה. לדוגמה, נניח שברקמה שלנו שני סוגי תאים: בסוג א׳ הגן מתבטא 100 פעמים, ובסוג ב׳ הגן כבוי. אם הרקמה מורכבת בחציה מסוג א׳ וחציה מסוג ב׳, נקבל 50 העתקים. לעומת זאת, אם ברקמה רק עשירית מהתאים הם מסוג א׳, נקבל 10 העתקים בלבד. במילים אחרות, הנתון המתקבל הוא במידה מסוימת שרירותי – הוא משקף את הרכב התאים ברקמה שנבדקה ולא רק הבדלים בביטוי גנים כתוצאה משינויים מנגנוניים (שהם אלו שלרוב מעניינים את החוקרים).
כדי להפנות את תשומת לב הקהילה המדעית לכך שישנן מגבלות לנתוני מדידת גנים כאשר לא מתחשבים בהרכב הרקמה, וכדי להציע פתרון אפשרי של בעיה זו, ב-2015 עמיתי ואני פרסמנו מחקר שבו ניתחנו מידע של ביטוי גנים מעשרת אלפים דגימות של גידולים סרטניים [1]. במאמר הדגמנו שמחקרים רבים בסרטן הגיעו לתוצאות שגויות בגלל שהתעלמו מהמורכבות התאית של הרקמה הסרטנית. גידול סרטני מתחיל מתא בודד בעל מוטציות ברצף ה-DNA אשר משתכפל ללא הכרה. אולם, ברקמה סרטנית רק כמחצית מהתאים הם סרטניים – השאר הם תאי תמיכה ותאים של המערכת החיסונית. באותו מחקר פיתחתי שיטה המעריכה את אחוז התאים הסרטניים בדוגמה שנמדדה. באמצעות נתון נוסף זה הראינו כי תוצאות של מחקרים רבים שפורסמו בעבר בסבירות רבה משקפות הבדלים בטוהר הדגימות (tumor purity) ולא בהכרח הבדלים מנגנוניים בגידול הסרטני כפי שטענו מחברי אותם מאמרים.
ההבנה הזו סייעה להפנמה בקרב הקהילה המדעית של הצורך לקחת בחשבון את טוהר הגידול. התחולל שיפור משמעותי, ועדיין המדד הבינארי שהשתמשתי בו (סרטן/לא-סרטן) הוא כמובן לא מספיק והשאיפה היא לדעת מה ההרכב המדויק של סוגי התאים ברקמה. שיטות חישוביות חדשות מאפשרות להסיק ממדידה של ביטוי גנים את מספרם המשוער של סוגי התאים בדגימה [2].
טכנולוגיה מתקדמת אף יותר מאפשרת למדוד ביטוי גנים בתאים בודדים (single-cell RNA-seq). טכנולוגיה זו פועלת בצורה דומה לשיטה למדידת ביטוי גנים שתיארנו לעיל, אך לפני שמפרקים את התאים כדי להפיק את ה-RNA, מפוררים את הרקמה לתאים בודדים ומסמנים את ה-RNA של כל תא בסמן ייחודי. לאחר מכן מערבבים את כל ה-RNA המסומנים ואז מבצעים מדידה של ביטוי גנים. כך, במקום לקבל ערך אחד לכל גן מקבלים ערך ביטוי של הגן בכל תא.
ב-2019 עמיתי ואני פרסמנו מחקר [3] שבו בדקנו את ביטוי הגנים בתאים בודדים במודל עכברי למחלה הנקראת לייפת ריאתית (pulmonary fibrosis) ממנה נפטרה בשנה שעברה רעייתו של נשיא המדינה, נחמה ריבלין. לייפת ריאתית היא מחלה קשה וחשוכת מרפא, במהלכה נוצרות צלקות בריאה. במחקר פיתחתי שיטה חישובית חדשה לניתוח של ביטוי גנים בתאים בודדים ובאמצעותה זיהינו תת-סוג חדש של תאים של מערכת החיסון האחראים על בליעת פולשים ותיקון נזקים (מקרופאגים). הראינו גם שניתן לחסום את התאים הללו ולמנוע מהם להיכנס לצלקת, והבאנו ראיות לכך שבבני אדם החולים במחלה מתקיים מנגנון דומה לזה שהתגלה במודל העכברי.
האתגרים אף פעם לא נגמרים ויש עוד הרבה לאן להתקדם. טכנולוגיות עכשוויות מאפשרות לזהות לא רק את הביטוי ברמת התא הבודד, אלא גם איפה התא נמצא ברקמה ואת יחסי הגומלין שלו עם התאים שסביבו. כמו כן, אנו יכולים למדוד את השינוי של הביטוי לאורך זמן ותפקודים אחרים בתא. כשהסתיים פיצוח הגנום האנושי ב-2001 חשבו שלקרוא את רצף ה-DNA יהיה פשוט כמו לקרוא בספר. די מהר התבהר שכדי להבין איך 20,000 גנים אחראים לכל המורכבות והתחכום של יצורים חיים, ושל האדם בפרט, נצטרך לעבוד הרבה יותר קשה ולגייס את כוחות המחשוב, ההנדסה והדמיון. בקיץ הקרוב אפתח מעבדה חישובית בפקולטה לביולוגיה בטכניון שבה נרתום את השיטות המתקדמות להבנת ביטוי גנים, לצד טכנולוגיות אחרות, כדי לאפשר פריצות דרך מחקריות ולקדם עידן של רפואה מותאמת אישית.

__________________________________________________________________________________________________________________________________________________________________________________

ראיון עם החוקר – ד”ר דביר ארן

– בכמה מילים: אשמח שתציג את עצמך:
דביר, נשוי ליפעת, אבא למיתר, ארבל ואביב, וביולוג חישובי. בשנה שעברה סיימתי חמש שנים של פוסט-דוקטורט ב-UCSF, ובשנה האחרונה אני עובד כדאטה סיינטיסט ב-Anthem.ai בפאלו אלטו. המחקר שלי נע בין פיתוח שיטות חישוביות וניתוח של מנגנונים ביולוגיים, בין אנליזה של דאטה ציבורי לייצור דאטה פרטי, בין מחקר בסיסי למחקר יישומי, ובין מחקר ביולוגי למחקר קליני. בקיץ אנחנו חוזרים לארץ ואפתח מעבדה בטכניון שתנסה להתמקם איפשהו בין כל המרחבים הללו.
– כשאתה לא עוסק במדע, מה אתה עושה?
רב עם הילדים.
– איך אתה מתאר את המעבר מדוקטורט בישראל לפוסט-דוקטורט בחו”ל?
את המעבר אני כבר לא ממש זוכר, אבל בשבילנו שש השנים האחרונות היו כמו חופשה ארוכה (אולי קצת ארוכה מדי).
– מה משך אותך למעבדה\פרוייקט הנוכחי?
את הפוסט עשיתי במעבדה של פרופ׳ אטול ביוט (בהתחלה בסטנפורד ואז המעבדה עברה ל-UCSF). אטול הוא איש חזון שהיה בין מובילי התחום שנקרא Translational Bioinformatics, ובשנים האחרונות הוא מוביל את תחום ה-Clinical Informatics. נמשכתי ליכולת לקחת מחקר אקדמי ולתרגם אותו למחקר יישומי שמייצר אימפקט מחוץ למגדל השן. אני מקווה להטמיע את החזון הזה גם במעבדה שלי.
– איך סיינס אברוד משתלבת בעשייה בתקופה זו?
המחקר לפעמים גורר אותנו לעולם מבודד ואינדיבידואלי (לא רק בעידן הקורונה). כיף שיש את סיינס אברוד שהופכת אותנו לקהילה.
– ספר על אירוע מיוחד עם סיינס אברוד?
מנואל טרכטנברג בא להיפגש עם הקהילה בסטנפורד והיה מעניין ומעשיר.
– האם אתה מקווה לחזור לארץ?
בלב אף פעם לא עזבנו.
– מה התוכניות שלך לעתיד הקריירה שלך?

להפסיק לריב עם הילדים. וברצינות, אני מאוד מתלהב מהמעבר לטכניון שבעיני מוביל את הדרך בארץ בנושא שילוב בין אקדמיה ותעשייה. הכישרון, היצירתיות והמעוף שפגשתי בטכניון לא היו מביישים את המוסדות המובילים בעולם, ואני מחכה להפוך לחלק מהקהילה המפרגנת ושוקקת חיים הזאת.

__________________________________________________________________________________________________________________________________________________________________________________

הטקסט נכתב על ידי ד”ר דביר ארן, בשיתוף עם עמותת מדע גדול בקטנה. דביר ארן הוא בעל תואר ד״ר לביולוגיה חישובית מהאוניברסיטה העברית, כיום חבר סגל חדש בטכניון ומקים בימים אלה את מעבדתו, בה הוא בה הוא מפתח כלים חישוביים למחקר רפואי וביולוגי.

 

***
עמותת “מדע גדול, בקטנה” הוקמה במטרה לבנות גשר בין הקהילה המדעית ועולם המדע אל הציבור הרחב. העמותה מנגישה מדע באופן מקצועי, אמין ואובייקטיבי. מנהלי העמותה ומתנדביה הכותבים במסגרת הפעילות בעמותה, הם כולם מדענים פעילים או חובבים, ובעלי תארים מתקדמים מאוניברסיטאות מובילות. לכל כותבי העמותה יש ניסיון עשיר בהנגשת מדע, בכתב וגם בעל פה, וכל הכתבות נתונות לביקורת מדעית הכוללת ביקורת עמיתים של מומחי התחום הפעילים בעמותה. כולם, פועלים בהתנדבות מלאה ומתוך רצון ותשוקה אמיתית להנגשת מדע בעבור כל אחת ואחד שמתעניינים בדברים המרתקים שמתרחשים בסביבה של כולנו.

***

__________________________________________________________________________________________________________________________________________________________________________________

מקורות וקריאה נוספת:

 

  1. Aran, D., Sirota, M. & Butte, A. Systematic pan-cancer analysis of tumour purity. Nat Commun 6, 8971 (2015). https://www.nature.com/articles/ncomms9971/
  2. Aran, D., Hu, Z. & Butte, A.J. xCell: digitally portraying the tissue cellular heterogeneity landscape. Genome Biol 18, 220 (2017). https://doi.org/10.1186/s13059-017-1349-1
  3. Aran, D., Looney, A.P., Liu, L. et al. Reference-based analysis of lung single-cell sequencing reveals a transitional profibrotic macrophage. Nat Immunol 20, 163–172 (2019). https://doi.org/10.1038/s41590-018-0276-y