استفاده از داده کاوی در انفورماتیک زیست

Bioinformatics

به نظر می رسد رویکردهای داده کاوی برای بیوانفورماتیک کاملاً مناسب است ، زیرا غنی از داده است. استخراج داده های بیولوژیکی به استخراج دانش مفید از مجموعه داده های عظیم جمع آوری شده در زیست شناسی و سایر زمینه های علوم زندگی مرتبط مانند پزشکی و علوم اعصاب کمک می کند. از کاربردهای داده کاوی در بیوانفورماتیک می توان به یافتن ژن ، استنباط عملکرد پروتئین ، تشخیص بیماری ، پیش آگهی بیماری ، بهینه سازی درمان بیماری ، بازسازی شبکه تعامل پروتئین و ژن ، پاک سازی داده ها و پیش بینی محل سلولی پروتئین اشاره کرد.

در سالهای اخیر ، تحولات سریع در ژنومیک و پروتئومیک ، مقدار زیادی داده بیولوژیکی ایجاد کرده است. نتیجه گیری از این داده ها به تجزیه و تحلیل محاسباتی پیچیده ای نیاز دارد. بیوانفورماتیک یا زیست شناسی محاسباتی ، علمی میان رشته ای برای تفسیر داده های بیولوژیکی با استفاده از فناوری اطلاعات و علوم رایانه است.

با ادامه تولید و ادغام مقادیر زیادی از داده های ژنومی ، پروتئومیک و سایر موارد ، اهمیت این زمینه تحقیق جدید افزایش خواهد یافت. یک منطقه فعال خاص از تحقیقات در بیوانفورماتیک ، کاربرد و توسعه تکنیک های داده کاوی برای حل مشکلات بیولوژیکی است.

تجزیه و تحلیل مجموعه داده های بیولوژیکی بزرگ مستلزم ایجاد معنا در داده ها با استنباط ساختار یا تعمیم داده ها است. نمونه هایی از این نوع تجزیه و تحلیل شامل پیش بینی ساختار پروتئین ، طبقه بندی ژن ، طبقه بندی سرطان بر اساس داده های ریزآرایه ، خوشه بندی داده های بیان ژن ، مدل سازی آماری تعامل پروتئین و پروتئین و غیره است. بنابراین ، ما یک پتانسیل بزرگ برای افزایش تعامل بین داده ها می بینیم معدن و بیوانفورماتیک.

فهرست مطالب

بیوانفورماتیک

اصطلاح بیوانفورماتیک توسط Paulien Hogeweg در سال 1979 برای مطالعه فرایندهای غیررسمی در سیستم های بیوتیکی ابداع شد. این ماده اولیه از اواخر دهه 1980 در ژنومیک و ژنتیک مورد استفاده قرار گرفت ، به ویژه در مناطقی از ژنومیک که شامل توالی DNA در مقیاس بزرگ است. بیوانفورماتیک را می توان کاربرد فناوری رایانه در مدیریت اطلاعات بیولوژیکی تعریف کرد.

بیوانفورماتیک علم ذخیره سازی ، استخراج ، سازماندهی ، تجزیه و تحلیل ، تفسیر و استفاده از اطلاعات از توالی ها و مولکول های بیولوژیکی است.

این امر عمدتا با پیشرفت در تعیین توالی DNA و تکنیک های نقشه برداری تقویت شده است. طی چند دهه گذشته تحولات سریع در فن آوری های تحقیق مولکولی ژنومیک و سایر فناوری ها و تحولات در فن آوری های اطلاعاتی با هم ترکیب شده اند و اطلاعات عظیم مربوط به زیست شناسی مولکولی را تولید می کنند. هدف اصلی بیوانفورماتیک افزایش درک فرآیندهای بیولوژیکی است.

برای خرید لایسنس پاور بی ای Power BI کلیک کنید

داده کاوی «Data Mining»

داده کاوی به استخراج دانش از مقدار زیادی داده اشاره دارد. داده کاوی (DM) دانش یافتن الگوها و رابطه های جالب جدید در حجم عظیمی از داده ها است. این به عنوان “فرایند کشف همبستگی ها ، الگوها و روندهای معنادار جدید با کاوش در مقدار زیادی داده ذخیره شده در انبارها” تعریف می شود.

داده کاوی همچنین گاهی دانش دانش در پایگاه داده (KDD) نامیده می شود. داده کاوی مختص هیچ صنعتی نیست. این امر به فناوری های هوشمند و تمایل به کشف امکان دانش پنهان موجود در داده ها نیاز دارد. رویکردهای داده کاوی به نظر ایده آل برای بیوانفورماتیک مناسب است ، زیرا غنی از داده است ، اما فاقد تئوری جامع سازمان زندگی در سطح مولکولی است.

پایگاه داده های گسترده اطلاعات بیولوژیکی هم چالش ها و هم فرصت هایی را برای توسعه روش های جدید KDD ایجاد می کند. استخراج داده های بیولوژیکی به استخراج دانش مفید از مجموعه داده های عظیم جمع آوری شده در زیست شناسی و سایر زمینه های علوم زندگی مرتبط مانند پزشکی و علوم اعصاب کمک می کند.

وظایف داده کاوی

در عمل ، دو هدف اصلی “سطح بالا” داده کاوی ، پیش بینی و توصیف است.

وظایف اصلی مناسب برای داده کاوی ، که همه شامل استخراج الگوهای جدید معنی دار از داده ها است ، عبارتند از:

طبقه بندی: طبقه بندی یادگیری تابعی است که یک مورد داده را در یکی از چندین کلاس از پیش تعریف شده نقشه برداری (طبقه بندی) می کند.
برآورد: با توجه به برخی از داده های ورودی ، برای مقداری متغیر پیوسته ناشناخته مقدار ارائه می شود.
پیش بینی: همان طبقه بندی و تخمین است با این تفاوت که سوابق بر اساس برخی رفتارهای آینده یا ارزش آینده تخمین زده می شوند).
قوانین انجمن: تعیین اینکه همه چیز با هم هماهنگ است ، به آن مدل سازی وابستگی نیز گفته می شود.
خوشه بندی: تقسیم بندی یک جمعیت به تعدادی از زیر گروه ها یا خوشه ها.
شرح و تجسم: نمایش داده ها با استفاده از تکنیک های تجسم.

یادگیری از داده ها به دو دسته تقسیم می شود:

یادگیری کارگردانی (“تحت نظارت”)
بی جهت (“بدون نظارت”).

سه وظیفه اول – طبقه بندی ، تخمین و پیش بینی – نمونه هایی از یادگیری تحت نظارت هستند.

سه وظیفه بعدی – قوانین ارتباط ، خوشه بندی و توصیف و تجسم – نمونه هایی از یادگیری بدون نظارت هستند. در یادگیری بدون نظارت ، هیچ متغیری به عنوان هدف جدا نمی شود. هدف ایجاد رابطه بین همه متغیرها است. یادگیری بدون نظارت سعی در یافتن الگوهایی بدون استفاده از یک زمینه هدف خاص دارد.

توسعه ابزارهای جدید داده کاوی و کشف دانش موضوع تحقیق فعال است. یکی از انگیزه های توسعه این ابزارها کاربرد بالقوه آنها در زیست شناسی مدرن است.

کاربرد داده کاوی در بیوانفورماتیک

کاربردهای داده کاوی در بیوانفورماتیک شامل یافتن ژن ، تشخیص دامنه عملکرد پروتئین ، تشخیص نقش عملکرد ، استنباط عملکرد پروتئین ، تشخیص بیماری ، پیش آگهی بیماری ، بهینه سازی درمان بیماری ، بازسازی شبکه تعامل پروتئین و ژن ، پاکسازی داده ها و پیش بینی محل سلولی پروتئین است. .

به عنوان مثال ، از فناوری ریزآرایه برای پیش بینی نتیجه بیمار استفاده می شود. بر اساس داده های ریزآرایه ژنوتیپی بیماران ، می توان زمان زنده ماندن و خطر متاستاز تومور یا عود آنها را تخمین زد. از یادگیری ماشین می توان برای شناسایی پپتید از طریق طیف سنجی جرمی استفاده کرد.

همبستگی بین یونهای قطعه ای در یک طیف جرمی پشت سرهم در کاهش عدم تطابق تصادفی برای شناسایی پپتید با جستجوی پایگاه داده بسیار مهم است.

یک الگوریتم امتیازدهی کارآمد که اطلاعات همبستگی را به صورت هماهنگ و جامع در نظر بگیرد بسیار مطلوب است.

نتیجه گیری و چالش ها

بیوانفورماتیک و داده کاوی در حال توسعه به عنوان علمی میان رشته ای هستند. روش های داده کاوی به نظر ایده آل برای بیوانفورماتیک مناسب است ، زیرا بیوانفورماتیک غنی از داده است اما فاقد تئوری جامع سازمان زندگی در سطح مولکولی است.

با این حال ، داده کاوی در بیوانفورماتیک توسط بسیاری از جنبه های پایگاه داده های بیولوژیکی ، از جمله اندازه ، تعداد ، تنوع و فقدان یک هستی شناسی استاندارد برای کمک به پرس و جو از آنها و همچنین داده های ناهمگن از کیفیت و اطلاعات منشأ آنها ، مختل می شود.

مشکل دیگر دامنه سطح دامنه های تخصصی موجود در میان کاربران بالقوه است ، بنابراین تهیه مکانیزم دسترسی مناسب برای همه برای متصدیان پایگاه داده دشوار است. ادغام پایگاه های داده بیولوژیکی نیز یک مشکل است.

امروزه داده کاوی و بیوانفورماتیک به سرعت در حال رشد هستند. بررسی موارد مهم تحقیق در بیوانفورماتیک و ایجاد روشهای جدید داده کاوی برای تجزیه و تحلیل مقیاس پذیر و موثر ، مهم است.

به دنبال این هستید که داده های خود را از طریق تجزیه و تحلیل بصری به نمایش بذارید ؟ با ما در داده کاوی ویستا ارتباط برقرار کنید.

با یکی از کارشناسان داده ما تماس بگیرید و صحبت کنید، و ما به هر سوالی که ممکن است داشته باشید پاسخ خواهیم داد.

دوره آموزشی هوش تجاری با Tableau «کلیک کنید» و هوش تجاری با Power BI «کلیک کنید» یک برنامه جامع است که بر توسعه مهارت در تجزیه‌ و تحلیل داده‌ها، تجسم و گزارش سازی و گزارش دهی و دشبوردسازی با استفاده از این ابزارها تمرکز دارد.

سپاسگذاریم از وقتی که برای خواندن این مقاله گذاشتید

برای خرید لایسنس تبلو Tableau کلیک کنید

برای مشاهده ویدیوهای آموزشی داده کاوی و هوش تجاری ما را در شبکه های اجتماعی دنبال کنید

Youtube Chanel :VISTA Data Mining

Aparat Chanel: VISTA Data Mining

Instagram Chanel: VISTA Data Mining

Telegram Chanel: VISTA Data Mining

Linkedin Chanel: VISTA Company

امتیاز دهید

تلفن ثابت

تلفن هات لاین