در این مقاله سعی کردهایم تا کاربرد رایانش ابری در ژنتیک و بررسی توالی LncRNA، که بخشی از ژنوم پستانداران است را شرح دهیم. به همین دلیل به سراغ همکاری آزمایشگاه Caltech Guttman با شرکت رایانش ابری آمازون وب سرویس (AWS) رفتهایم.
آزمایشگاه گاتمن در موسسه فناوری کالیفرنیا (Caltech) واقع شده است و توسط دانشمند برجستهای به نام دکتر میچ گاتمن رهبری میگردد. این آزمایشگاه زیستشناسی، در واقع یک مرکز تحقیقاتی است که به مطالعه دسته جدیدی از ژنها به نام lncRNA میپردازد. توالی یابی ژنوم ، بیوشیمی، زیستشناسی مولکولی، زیستشناسی سلولی، زیستشناسی محاسباتی و رایانش ابری از جمله ابزارآلات این تیم تحقیقاتی هستند.
گاتمن و تیمش به دنبال پاسخ این سوالند که چگونه lncRNA ، مولکولهای پروتئین و DNA را در سلول سازماندهی میکند تا برنامههای دقیق بیان ژن را کنترل کنند.
RNA بلند غیر کدکننده یا lncRNA چیست؟
مشاهدات جدید نشاندهنده وجود درصد بالایی از RNA بلند غیر کدکننده پروتئین یا lncRNA در ژنوم انسان است. lncRNA شکل مخفف عبارت long non-coding RNAs میباشد که بخش عمدهای از فرآوردههای بیان ژن در توالیهای ریبونوکلئوتیدی را تشکیل میدهند. این توالیها شامل مولکولهای RNA بلند با طول بیش از 200 نوکلئوتید میباشند. مطالعات اخیر نشاندهنده نقش مهم این توالیها در ایجاد بیماریهایی نظیر سرطان، بیماریهای قلبی و عروقی، مالتیپل اسکلروزیس و …است.
چالش پیش از مهاجرت به فضای ابری
دکتر گاتمن در سال 2013 به Caltech پیوست و اولین درخواست وی یک خوشه محاسبات سنگین (HPC) الاستیک و انعطافپذیر بود. وی در اینباره میگوید:
«وقتی به خوشهای برای آزمایشگاه خود فکر میکردیم، میدانستیم که باید از تقاضاهای نوسانی محاسباتی ما پشتیبانی کند. گاهی اوقات ما به 1000 گره محاسباتی نیاز داریم، و گاهی اوقات فقط 10 گره لازم است.
وی در ادامه افزود که این تقاضاهای نوسانی، با میزان در دسترس بودن دادهها و اینکه در چه مرحلهای از یک پروژه تحقیقاتی قرار دارند، رابطه مستقیم دارد. همچنین اگر چندین پروژه به صورت همزمان و همگرا با یکدیگر اجرا شوند، میزان نیاز به منابع محاسبات سنگین را بهشدت افزایش میدهند.
درخواست گاتمن با سیاستهای Caltech همخوانی نداشت. زیرا آنها نمیخواستند برای پشتیبانی از نیازهایشان، خوشهای در محل خود بسازند. ایجاد خوشهای از سرورهای خانگی یا اصطلاحا On premise در کالیفرنیای آمریکا بسیار هزینه بردار است و مدیران Caltech بهخوبی از این قیمتها مطلع بوند.
جان لیلی، مدیر ارشد، سیستمها و خدمات مدیریت اطلاعات در Caltech، این مشکل را اینگونه شرح میدهد:
کالیفرنیا، یکی از بالاترین قیمتها را در زمینه املاک و برق کشور دارد. بنابراین نگران هزینه ایجاد خوشه خانگی در اینجا بودیم. ما همچنین نمیخواستیم وقت خود را صرف مدیریت و نگهداری خوشه کنیم.
بنابراین علاوه بر گران بودن قیمت برق و املاک در کالیفرنیا، نگرانی دیگر Caltech ، وقت و هزینه مورد نیاز برای مدیریت و نگهداری از سرورها بود. از طرفی گاتمن و تیمش قدرتی میخواستند که به راحتی اعتبار دسترسی خوشهای را مدیریت کنند. جان لیلی در این باره میگوید:
ما میخواستیم بتوانیم حسابهای کاربری خوشهای را از یک مکان مرکزی فعال و غیرفعال کنیم، بدون اینکه نگران باشیم اعتبار هر یک از دستگاهها را از دست بدهیم.
تاریخچه رایانش ابری در ژنتیک
رایانش ابری به عنوان یک فناوری نوین، در دهه اول قرن 21 آغاز به کار کرد و به سرعت در حوزههای مختلف، از جمله ژنتیک، محبوبیت پیدا کرد. تاریخچه رایانش ابری در ژنتیک را میتوان به مراحل زیر تقسیم کرد.
1. ظهور رایانش ابری (اوایل 2000)
رایانش ابری به عنوان یک مدل جدید محاسباتی در اوایل دهه 2000 معرفی شد. آمازون در سال 2006 خدمات وبسرویسهای خود را ارائه داد که به کاربران این امکان را میداد تا به منابع محاسباتی از طریق اینترنت دسترسی پیدا کنند. این مدل به محققان در زمینههای مختلف، از جمله ژنتیک، کمک کرد تا به سرعت و به راحتی به دادهها و منابع محاسباتی دسترسی داشته باشند.
2. پروژههای تحقیقاتی بزرگ (2007)
در سال 2007، گوگل و IBM به همراه چند دانشگاه، پروژههای تحقیقاتی در مقیاس بزرگ را در زمینه رایانش ابری آغاز کردند. این پروژهها به توسعه ابزارها و روشهای جدید برای تجزیه و تحلیل دادههای ژنتیکی کمک کردند و به محققان این امکان را دادند که به طور همزمان بر روی دادهها کار کنند.
3. کاربرد در مطالعات ژنتیکی (اواسط 2010)
با پیشرفت فناوری رایانش ابری، محققان توانستند از آن برای تجزیه و تحلیل دادههای پیچیده ژنتیکی استفاده کنند. به عنوان مثال، در سالهای اخیر، بسیاری از آزمایشگاهها از زیرساختهای ابری برای بررسی توالیهای lncRNA و دیگر بخشهای ژنوم استفاده کردهاند. این امر به محققان این امکان را میدهد که دادههای بزرگ را سریعتر و با دقت بیشتری تحلیل کنند.
4. همکاریهای بینالمللی (حاضر)
امروزه، همکاریهای بینالمللی در زمینه رایانش ابری و ژنتیک افزایش یافته است. به عنوان مثال، همکاری بین Caltech و آمازون به توسعه ابزارهای تجزیه و تحلیل دادههای ژنتیکی کمک کرده است. این همکاریها به محققان این امکان را میدهد که به منابع و دادههای مشترک دسترسی پیدا کنند و تحقیقات خود را بهبود بخشند.
نقش رایانش ابری در ژنتیک
رایانش ابری در سالهای اخیر نقش مهمی در پیشرفت مطالعات ژنتیکی ایفا کرده است. منابع نامحدود و انعطاف پذیری ذاتی رایانش ابری، موجب شده تا از این فناوری برای توسعه و ارائهی خدمات درمانی و تحقیقات پزشکی در زمینه هایی نظیر ژنتیک و پزشکی مولکولی استفاده شود.
ذخیره سازی و پردازش داده های ژنتیکی
رایانش ابری امکان ذخیره سازی و پردازش حجم عظیمی از داده های ژنتیکی را فراهم میکند. به عنوان مثال، آزمایشگاه گاتمن با همکاری آمازون، از یک خوشه HPC که شامل سرورهای متصل به یک ابر خصوصی مجازی میباشد، برای ذخیرهسازی و تجزیه و تحلیل داده های lncRNA استفاده میکند. این امکان را فراهم میکند که محققان بتوانند داده های ژنتیکی را سریعتر پردازش کرده و به نتایج مطالعات دست یابند.
انعطاف پذیری و کشسانی
سرورهای ابری دارای کشش و انعطاف پذیری بالایی هستند که به محققان این امکان را میدهد تا بتوانند منابع محاسباتی را به سرعت افزایش یا کاهش دهند.
به عنوان مثال، آزمایشگاه گاتمن توانست بدون نیاز به خرید سخت افزار جدید، فضای ذخیره سازی خود را از 5 ترابایت به 24 ترابایت افزایش دهد. این قابلیت کشسانی به محققان کمک میکند تا بتوانند نوسان تقاضاهای محاسباتی خود را مدیریت کنند.
صرفه جویی در هزینه ها
رایانش ابری همچنین موجب صرفه جویی در هزینه های مطالعات ژنتیکی میشود. محققان با استفاده از مدل پرداخت به میزان مصرف، تنها هزینه منابع مورد استفاده را پرداخت میکنند و نیازی به سرمایه گذاری اولیه بر روی سخت افزار ندارند.
در مجموع، رایانش ابری با فراهم کردن منابع نامحدود، انعطاف پذیری و صرفه جویی در هزینه ها، نقش مهمی در پیشرفت مطالعات ژنتیکی ایفا میکند و به محققان کمک میکند تا بتوانند داده های ژنتیکی را سریعتر ذخیره، پردازش و تجزیه و تحلیل کنند.
مزایای استفاده از رایانش ابری در ژنتیک
با کمک رایانش ابری، آزمایشگاه گاتمن اکنون قابلیت کشسانی برای مدیریت نوسان تقاضاهای محاسباتی خود را دارد. لیلی میگوید:
ما برای مدیریت استفاده از محاسبات خود مجبور نبودیم خوشه فیزیکی خود را بسازیم، زیرا AWS به طور خودکار برای ما مقیاس میشود.
گاتمن نیز از فضای محاسباتی بزرگ و کشسانی که در اختیار دارد بسیار راضی است و درباره عدم نیاز به اولویتبندی پروژهها میافزاید:
ما دیگر نیازی به صرف زمان برای اولویتبندی پروژهها از قبل نداریم. میدانیم که بدون نیاز به تجدید هر چند سال یک بار، قدرت محاسباتی کافی خواهیم داشت.
همچنین چابکی رایانش ابری باعث شده است که تیم گاتمن قادر به توسعه و آزمایش روشهای جدید تحقیقاتی باشد. افزایش آنی میزان منابع مورد نیاز، بدون صرف هزینه و انرژی و تنها با یک کلیک، از دیگر مهمترین مزایای ابری است. لیلی در اینباره میگوید:
ما اخیراً نیاز داشتیم که سیستم GlusterFS خود را از 5 ترابایت به 24 ترابایت گسترش دهیم و توانستیم بدون خرید سختافزار جدید این کار را انجام دهیم.
ما به سادگی سرورهای بیشتری را اضافه کردیم و فضای ذخیرهسازی ابری را افزایش دادیم و این فقط یک ساعت طول کشید. قبلاً هفتهها طول میکشید تا این کار انجام شود، زیرا بحثهایی درباره قیمتهای خرید سختافزار وجود داشت و سپس باید تهیه، نصب و آزمایش را انجام میدادیم.
علاوه بر این، محققان در آزمایشگاه می توانند داده های lncRNA را با استفاده از ابر AWS سریعتر تجزیه و تحلیل کنند. گاتمن افزود:
تحلیل lncRNA نیاز به پردازش محاسباتی و یکپارچه سازی زیادی دارد. اما با استفاده از ابر، میتوانیم به سرعت 1000 یا بیشتر گره را محاسبه کنیم. این چارچوب زمانی ما را برای تجزیه و تحلیل توالی ژنومی از هفتهها به روزها تغییر میدهد. ما با ظرفیت محدودی که قبلا داشتیم نمیتوانستیم این کار را انجام دهیم.
کاربرد رایانش ابری در ژنتیک
رایانش ابری به عنوان یک فناوری نوین، در زمینه ژنتیک و بیوانفورماتیک کاربردهای متعددی دارد که به تسهیل تجزیه و تحلیل دادههای ژنتیکی و بهبود فرآیندهای تحقیقاتی کمک میکند. در ادامه به برخی از این کاربردها اشاره میشود.
1. تجزیه و تحلیل دادههای ژنتیکی
رایانش ابری به محققان این امکان را میدهد که حجم بالایی از دادههای ژنتیکی را ذخیره و تجزیه و تحلیل کنند. به عنوان مثال، آزمایشگاه گاتمن با استفاده از زیرساختهای ابری، توانسته است به سرعت دادههای lncRNA را پردازش کند. این آزمایشگاه از یک خوشه HPC (محاسبات با کارایی بالا) استفاده میکند که به آنها اجازه میدهد تا به سرعت 1000 یا بیشتر گره را محاسبه کنند و زمان تحلیل را به طرز چشمگیری کاهش دهند.
2. صرفهجویی در هزینهها و منابع
استفاده از رایانش ابری به محققان این امکان را میدهد که بدون نیاز به خرید سختافزار جدید، منابع محاسباتی خود را گسترش دهند. به عنوان مثال، آزمایشگاه گاتمن توانسته است فضای ذخیرهسازی خود را از 5 ترابایت به 24 ترابایت افزایش دهد، بدون اینکه نیاز به خرید سختافزار جدید داشته باشد.
3. بهینهسازی زمانبندی و تخصیص منابع
رایانش ابری همچنین به بهینهسازی زمانبندی وظایف و تخصیص منابع کمک میکند. الگوریتمهای ژنتیک میتوانند برای زمانبندی کارها در محیطهای ابری به کار گرفته شوند، که این امر به کاهش زمان و هزینههای اجرایی کمک میکند. این الگوریتمها میتوانند به طور مؤثری منابع را مدیریت کرده و کارایی سیستم را افزایش دهند.
4. تسهیل همکاری و اشتراکگذاری دادهها
رایانش ابری امکان همکاری بین محققان را تسهیل میکند. پژوهشگران میتوانند به راحتی دادههای خود را در فضای ابری ذخیره کرده و با دیگران به اشتراک بگذارند، که این امر به تسریع فرآیندهای تحقیقاتی و بهبود کیفیت نتایج کمک میکند.
5. پشتیبانی از تحقیقات بالینی
در زمینه تحقیقات بالینی، رایانش ابری به پژوهشگران این امکان را میدهد که اطلاعات بیماران را به طور منظم دریافت و ذخیره کنند. این دادهها میتوانند از نقاط مختلف جمعآوری شده و در فضای ابری ذخیره شوند، که به تسهیل تحقیقات بالینی و تجزیه و تحلیل دادههای ژنتیکی کمک میکند.
به طور کلی، رایانش ابری با فراهم کردن منابع نامحدود، انعطافپذیری و صرفهجویی در هزینهها، به پیشرفتهای قابل توجهی در تحقیقات ژنتیکی و پزشکی مولکولی منجر شده است.
شرکت های استفاده کننده از رایانش ابری در ژنتیک
رایانش ابری به عنوان یک فناوری کلیدی در تحقیقات ژنتیکی و پزشکی مولکولی شناخته میشود و شرکتهای مختلفی از این فناوری بهرهبرداری میکنند. در زیر به برخی از این شرکتها و کاربردهای آنها در زمینه ژنتیک اشاره میشود.
آزمایشگاه گاتمن (Gatman Lab):
این آزمایشگاه از خدمات رایانش ابری آمازون (AWS) برای تجزیه و تحلیل دادههای ژنتیکی استفاده میکند. آنها از یک خوشه HPC (محاسبات با کارایی بالا) بهره میبرند که به آنها امکان میدهد تا به سرعت منابع محاسباتی را افزایش دهند و نیازهای خود را بدون خرید سختافزار جدید تأمین کنند. این آزمایشگاه به ویژه در بررسی توالیهای lncRNA فعال است.
آمازون وب سرویسز (AWS):
AWS به عنوان یکی از بزرگترین ارائهدهندگان خدمات رایانش ابری، به شرکتها و مؤسسات تحقیقاتی در زمینه ژنتیک خدمات متنوعی ارائه میدهد. این خدمات شامل ذخیرهسازی دادهها، پردازش محاسباتی و ابزارهای تحلیلی برای مدیریت و تجزیه و تحلیل دادههای ژنتیکی است.
گوگل و مایکروسافت:
این دو شرکت نیز خدمات ابری خود را در زمینههای مختلف، از جمله ژنتیک و بیوانفورماتیک ارائه میدهند. خدمات آنها شامل ابزارهای تحلیل داده و یادگیری ماشین است که به محققان کمک میکند تا دادههای ژنتیکی را به طور مؤثری پردازش کنند.
شرکت فناوران رابط طب (دکتر لینک):
این شرکت از فناوری رایانش ابری برای بهبود خدمات درمانی و مدیریت اطلاعات پزشکی استفاده میکند. این فناوری به آنها کمک میکند تا دادههای بیماران را به طور مؤثر ذخیره و مدیریت کنند و در نتیجه به تحقیقات بالینی و ژنتیکی پرداخته شود.
این شرکتها با استفاده از رایانش ابری، به محققان و پزشکان این امکان را میدهند که به دادههای ژنتیکی دسترسی پیدا کنند و آنها را به سرعت تحلیل کنند، که این امر به پیشرفتهای قابل توجهی در زمینههای مختلف پزشکی و ژنتیک منجر میشود.
نرم افزار های کاربردی رایانش ابری در ژنتیک
رایانش ابری به عنوان یک فناوری کلیدی در تحقیقات ژنتیکی، نرمافزارهای متعددی را برای تجزیه و تحلیل دادههای ژنتیکی و بهبود فرآیندهای تحقیقاتی ارائه میدهد. در زیر به برخی از این نرمافزارها و خدمات اشاره میشود.
AWS Genomics:
آمازون وب سرویسز (AWS) مجموعهای از ابزارها و خدمات را برای تجزیه و تحلیل دادههای ژنتیکی فراهم میکند. این خدمات شامل ذخیرهسازی، پردازش و تجزیه و تحلیل دادههای توالییابی ژنوم است.
Google Cloud Genomics:
گوگل کلود یک پلتفرم ابری است که به محققان این امکان را میدهد تا دادههای ژنتیکی را ذخیره کرده و با استفاده از ابزارهای تحلیلی پیشرفته، آنها را تجزیه و تحلیل کنند. این پلتفرم به ویژه در زمینههای هوش مصنوعی و یادگیری ماشین کاربرد دارد.
Microsoft Azure for Genomics:
مایکروسافت آژور ابزارهای متنوعی را برای تجزیه و تحلیل دادههای ژنتیکی ارائه میدهد. این خدمات شامل پردازش دادههای بزرگ و تجزیه و تحلیل پیشرفته است که به محققان کمک میکند تا به سرعت به نتایج دست یابند.
DNAnexus:
DNAnexus یک پلتفرم ابری تخصصی برای تجزیه و تحلیل دادههای ژنتیکی است که به محققان این امکان را میدهد تا دادههای توالییابی را به راحتی تجزیه و تحلیل کنند و نتایج را به اشتراک بگذارند.
Seven Bridges:
این پلتفرم ابری به محققان در زمینههای بیوانفورماتیک و ژنتیک کمک میکند تا دادههای ژنتیکی را تجزیه و تحلیل کنند و به راحتی با دیگران همکاری کنند.
BaseSpace Sequence Hub:
این نرمافزار از Illumina، به محققان این امکان را میدهد که دادههای توالییابی را ذخیره و تجزیه و تحلیل کنند و به راحتی با دیگران به اشتراک بگذارند.
سرویس های ابری ابر فردوسی
شرکت ابر فردوسی ارائه دهنده سرویسهای ابری متنوع با بهترین قیمت و کیفیت است. از جمله این سرویسها میتوان به:
- سرور ابری
- سرور محاسبات سنگین
- سرور گرافیکی
- سرور ژوپیتر لب
- سرور اختصاصی و…
اشاره کرد. به عنوان مثال میتوانید از محاسبات سنگین این شرکت، برای کاربردهای مشابه در این مقاله بهره برد. جهت آشنایی و یا استفاده کلیک نمایید.
رایانش ابری چه نقشی در تحقیقات ژنتیکی دارد؟
مایکروسافت آژور چه ابزارهایی برای پردازش دادههای بزرگ در زمینه ژنتیک فراهم میکنه؟
Seven Bridges چگونه به همکاری محققان در زمینه بیوانفورماتیک کمک میکنه؟