دروس کوتاه سرطان: تبارشناسی تومور

در حقیقت تلاش خواهیم کرد از یک مقدمه عمومی شروع کنیم. کمی در مورد سرطان صحبت کنیم. در مورد این‌که مساله چیست. سپس چند حالت خاص مساله را به صورت ترکیبیاتی تعریف کنیم. بعد یک حالت آن را حل کنیم. این مساله، از مساله‌هایی است که نشان می‌دهد علوم کامپیوتر، آن هم نظری‌ترین قسمت‌هایش چگونه در سرطان ممکن است به درد بخورند. اگر ببینید، از نویسنده‌های مقاله آقای آلون است که از نظری‌ترین علوم کامپیوتری‌ها و ترکیبیات‌کارهاست.

خلاصه:

مساله اصلی این ارائه، یافتن یک درخت تکاملی از داده‌های کم حجم تومور است. سرطان، طبق تعریف، از سلول‌هایی به وجود می‌آید که نسبت به سلول‌های سالم تغییرات ژنتیکی کرده باشند. اما، یک تومور سرطانی، شامل یک سلول نیست، بلکه شامل سلول‌های فراوان و متنوعی است. امید می‌رود که شناخت سلول‌های مختلف و تنوع سلول‌ها بتواند به ما کمک کند تا برخورد مناسب‌تری با یک تومور خاص سرطانی داشته باشیم. بدین منظور، تلاش می‌کنیم تنوع در یک تومور سرطان را بشناسیم. پس آزمایش‌هایی انجام می‌دهیم که اطلاعاتی در مورد تنوع سلول‌ها در تومور به ما بدهد. اما اطلاعات برای بازسازی اطلاعات کل تومور کافی نیست، در نتیجه محدودیت‌های واقعی را در نظر می‌گیرم تا جواب واقعی‌تری به دست بیاوریم. از محدودیت‌های واقعی، وجود رابطه تکاملی درون تومور است. مساله اصلی این ارائه یافتن اطلاعات درون یک تومور با استفاده از داده‌های محدود است. این مساله به زبان علوم کامپیوتری به یک مساله یافتن درخت اشتاینر تبدیل می‌شود. مساله یافتن درخت اشتاینر، یک مساله ان‌پی-سخت است و الگوریتم‌های تقریبی زیادی برای آن ارائه شده است. اجرای همان الگوریتم‌ها برروی اطلاعات زیستی، نیازمند زمان نمایی است. در این ارائه، چند راه حل برای مساله درخت اشتاینر را مرور می‌کنیم و استفاده آن الگوریتم‌ها را برای مساله یافتن درخت تکاملی بررسی می‌کنیم. به‌طور کلی در این ارائه، پس از معرفی مقدماتی مساله و ارتباط آن با سرطان، الگوریتم‌های اولیه برای ساختن درخت تکاملی را مرور می‌کنیم. با استفاده از برنامه‌ریزی خطی و بهینه‌سازی ترکیبیاتی الگوریتم‌های نظری و تقریبی را ارائه می‌کنیم. 

منبع اصلی ارائه:

Alon, Noga, et al. “Approximate maximum parsimony and ancestral maximum likelihood.” IEEE/ACM transactions on computational biology and bioinformatics 7.1 (2010): 183-187.

ولی خداوکیلی خیلی کار سختی است آماده کردن این ارائه!

ساختار سه‌بعدی ژنوم در هسته و رابطه‌اش با سرطان

ژنوم در سلول‌های انسانی، چند رشته بسیار طولانی از چند مولکول است که به یکدیگر چسبیده‌اند. این رشته‌ها حاوی تمامی اطلاعاتی هستند که برای ساختن اجزاء سلولی لازم داریم. اما این رشته‌های طولانی به همین سادگی در هسته سلول قرار نگرفته‌اند. با یک ساختار بسیار پیچیده این رشته‌ها در هسته تاخورده‌اند. اخیرا با آزمایش‌هایی نشان‌داده شده که نحوه تاخوردن ژنوم در هسته خیلی هم تصادفی نیست.

اما مقاله‌هایی نیز در این زمینه تولید شده که نشان می‌دهند در سرطان نحوه تاخوردگی ژنوم در هسته تغییر می‌کند. شواهد بسیار گنگ هستند و بیشتر به نظریه‌پردازی شبیه هستند. در این زمینه دانشجویی در جلسه دفاعش ادعایی کرد و بعدا مقاله‌ای در این زمینه را ارسال کرد. دیدن مقاله در این زمینه خالی از لطف نیست.

Corces MR, Corces VG. The three-dimensional cancer genomeCurr Opin Genet Dev. 2016;36:1-7.

به هر حال به نظر می‌آید در یک سلول کوچک اطلاعات فراوانی وجود دارد که بسیار از آن‌ها به سادگی ژنوم نیستند. مثلا همین قرار گرفتن اجزاء قطعات مختلف ژنوم در کنار هم در فضا اطلاعات مهمی از سلول است که در رفتار سلول موثر است تا این حد که در سرطان‌ها، برای رشدشان نیازمند تغییر قرارگیری ژنوم در فضا هستند. این‌ها از طرفی نشان می‌دهد که چقدر دانش ما نسبت به سلول کم است و از طرفی نشان می‌دهد که چقدر جای رشد برای علم زیست‌شناسی وجود دارد.

سخنرانی دکتر Monteil با موضوع محاسبات نوری

دکتر Monteil که از فرانسه آمده‌اند و هنوز تهران هستند، یک سخنرانی در دانشگاه تهران دارند. 

سخنرانی‌شان در مورد sage در دانشگاه شریف که خیلی خوب بود. خیلی مشتری داشت و اساتید هم خیلی تشویق کردند. خودشان هم فردی بسیار علاقه‌مند و با حوصله بودند. تا ۲-۳ ساعت بعد ارائه هم بودند که پاسخ دانشجویان را بدهند. کلا سخنرانی خوب بود.

امیدوارو این سخنرانی‌شان هم خوب بشود.

آموزندگی درس بهینه‌سازی برخط

در ترم حاضر درس بهینه‌سازی برخط را با دکتر علیشاهی ارائه می‌کنیم. در این درس مطالب جالب فراوانی وجود داشت. البته هنوز عمق مطلب را یادنگرفته‌ام، اما صورت‌بندی مساله‌ها خیلی جالب بود.

یکی از مطالب درس، یادگیری برخط بود. در یادگیری برخط می‌خواهیم الگوریتمی برای یادگیری تولید کنیم با این فرض که از همان ابتدا باید پاسخگو باشد. به عبارت دیگر، از همان ابتدا به الگوریتم نمونه‌هایی داده می‌شود، پاسخ از او پرسیده می‌شود و به ازای پاسخ نادرست جریمه می‌شود. بدین صورت الگوریتم از ابتدا باید پاسخ بدهد. 

از این جهت، یادگیری برخط خیلی شبیه یادگیری غیربرخط، یا یادگیری ماشین است. تفاوت‌های این دو یادگیری این است که، یادگیری ماشین دو فاز دارد: فاز آموزش و فاز آزمایش. در فاز آموزش در یادگیری غیربرخط به شما چند نمونه با پاسخ نمونه‌ها داده می‌شود. شما اجازه دارید در این مدت نمونه‌ها و پاسخ‌ها را ببینید و یادبگیرید، بدون اینکه هزینه‌ای بدهید. سپس در فاز آزمایش به شما نمونه‌هایی می‌دهند و شما باید پاسخ بدهید، بدون اینکه اجازه داشته باشید از درست و یا نادرست بودن پاسخ‌های خود استفاده کرده و یادگیری خود را تقویت کنید. در یادگیری برخط همیشه شما اجازه دارید یادگیری را به‌روز کنید ولی در مقابل همیشه باید هزینه پرداخت کنید.

خود صورت‌بندی یادگیری برخط شبیه‌تر است به واقعیت. درنتیجه همین صورت‌بندی به اندازه کافی جالب است. اما طبیعتا کاربردهای فراوان واقعی زیادی در یادگیری برخط هست که در آینده شاید به آن‌ها بپردازیم.

کارگاه معرفی Sage توسط یکی از نویسندگانش

این هفته آقای Thierry Monteil از اساتید  LAAS-CNRS و INSA Toulouse مهمان ما در ایران هستند. موضوع اصلی پژوهش ایشان که بیشتر به ما مربوط است، مدل‌های نامتداول محاسباتی است.

اگر با اساتید قبلی فرانسوی و ارائه‌هایشان آشنا باشید، مثلا مدل محاسباتی ماشین سیگنال را می‌شناسید. در این مدل با سیگنال‌هایی که حرکت می‌کنند در فضای یک-بعدی و با تعریف یک سری قواعد برای برخورد آن‌ها، می‌توان یک ماشین محاسباتی تعریف کرد. به این ماشین، ماشین سیگنال می‌گویند. می‌توان نشان داد که ماشین سیگنال قدرت محاسباتی بیشتری از ماشین تورینگ دارد، یعنی هرآنچه ماشین تورینگ می‌تواند حل کند، توسط ماشین سیگنال هم قابل حل کردن است و البته چیزهایی هستند که ماشین سیگنال می‌تواند حل کند ولی ماشین تورینگ نمی‌تواند. هم‌چنین ایشان کارهایی در مورد محاسبات با نور انجام داده‌اند.

علاوه بر فعالیت در زمینه‌های بالا، ایشان از توسعه‌دهندگان نرم‌افزار Sage هستند. قرار شد ایشان ارائه در دانشگاه شریف داشته باشند که در آن در مورد نرم‌افزار Sage صحبت کنند. پوستر ارائه ایشان در ادامه آمده است:

ایشان خودشان به سروکله زدن با کامپیوتر و نرم‌افزارها و دانشجویان علاقه‌مند بودند. در نتیجه اگر با ایشان کاری دارید می‌توانید بعد از ارائه‌شان به ایشان مراجعه کنید.

احتمالا شنبه بعدازظهر هم یک ارائه داشته باشند در دانشکده علوم و فنون نوین دانشگاه تهران.

سعی می‌کنیم جلساتی هم با ایشان بگذاریم ببینیم می‌توانیم با ایشان هم‌کاری داشته باشیم یا خیر. 

معرفی دکتر غلامی رودی

دکتر علی غلامی رودی، را از قبل از ورود به دانشگاه می‌شناختم. از المپیاد کامپیوتری‌های گذشته بود که در ایران ماند و کامپیوتر خواند و در نهایت هیئت علمی شد. در دانشگاه نوشیروانی بابل. استاد فعالی هستند، درس‌های زیادی ارائه می‌کنند و در کنارش کارهای جالبی هم انجام می‌دهند. کلا گشت و گذار در قسمت علمی صفحه وب‌شان لذت‌بخش است.

یکی از کارهایی که انجام می‌دهند این است که یک مجله-مانندی دارند به نام پنج‌شنبه‌های سخت. فردی است به نام دال که این مجله در مورد او و کارهای او و مساله‌هایی است که او تعریف می‌کند. فردی مرموز و دانش‌مند! خواندن مجله خالی از لطف نیست. دیدن اساتید جوانی که حوصله این کارها را دارند مانند نسیمی خنک در گرمای تابستان لذت‌بخش است.

یک نرم‌افزارهایی هم تولید کرده‌اند برای تولید متن‌های فارسی. راستش درست متوجه نشدم چی هستند. یک ویرایشگر فارسی-انگلیسی و شاید چیزهای دیگر. می‌توانید این را هم در وب‌گاهشان پیدا کنید.

کلا پس از مطالعه وب‌گاهشان کمی وسوسه شدم که گولشان بزنم که ۱) در تولید یک وب‌گاه با هم هم‌کاری کنیم. ۲) تشویقشان کنم برای هم‌کاری پژوهشی در زمینه‌های جدیدتر علوم کامپیوتر. ۳) تشویقشان کنم که این درس‌هایی که من می‌دهم را ایشان هم بدهند. بدین‌صورت چند نفری در اقصی نقاط ایران تولید کنیم که زمینه‌های مطالعاتی‌شان حداقل به هم نزدیک باشد. ۵) [بله، مورد ۴ این‌جا جا افتاده! لازم نیست تذکر بدهید!] هم‌کاری در مسابقات علمی، چه ACM و چه المپیاد.

سمینارهای پاییزی پژوهشکده علوم زیستی IPM

پژوهشکده علوم زیستی IPM سمینارهای خوب بیوانفورماتیکی به صورت منظم در این چند سال گذشته برگزار کرده. پاییز امسال نیز مانند سال‌های گذشته سمینارهایی دارد. برنامه پاییز به صورت زیر است:

از بین برنامه‌ها، سخنرانی‌های آقای ملک‌پور و سخنرانی آقای کالیراد به نظر بنده جالب‌تر است.