یادگیری ماشین چیست؟

یکی ار واژه هایی که با توجه به رشد فناوری بسیار شنیده می شود “یادگیری ماشین” است. یادگیری ماشین با مشاهده داده های اولیه جهت استخراج الگو های مختلف همچون مثال ها و تجربه مستقیم آغاز میگردد. هدف اصلی یادگیری ماشین در نهایت حذف دخالت انسان در این فرایند میباشد به طوری که ماشین به صورت خودکار اقدام به یادگیری و بهبود نتایج نماید.

برخی از تعاریف موجود برای یادگیری ماشین

وب سایت سیستم هایی خبره : یادگیری ماشین بخشی از حوزه هوش مصنوعی می باشد که به سیستم های کامپیوتری امکان میدهد تا به صورت خودکار و بهبود از طریق تجربه و بدون اینکه صراحتا برنامه ریزی شوند توان یادگیری داشته باشند.

SAS: یادگیری ماشین متد تحلیل داده ای است که فرایند مدل سازی تحلیل داده به صورت خودکار صورت میگیرد. یادگیری ماشین در واقع شاخه ای از هوش مصنوعی می باشد که برپایه این تصور که ماشین های با کسب تجربه باید بیاموزند بنا نهاده شده است.

ویکی پدیا : یادگیری ماشین شاخه ای از علوم کامپیوتر است که به کامپیوترها توانایی یادگیری بدون اینکه صراحتا برنامه نویسی شوند را می دهد. 

شکوفایی یادگیری ماشین

آرتور سامول از پیشروان حوزه بازی های کامپیوتری و هوش مصنوعی در سال 1959 همزان با دورانی که در شرکت IBM مشغول به کار بود واژه یادگیری ماشینرا برای اولین بار مطرح نمود. یادگیری ماشین به عنوان یک حوزه مجزا در دهه 1990 شکوفا شد.

با توجه به تحولات صورت گرفته در زمینه فناوری کامپیوتر یادگیری ماشین در دورانی کنونی با آنچه در گذشته وجود داشت تفاوت هایی دارد.  یادگیری ماشین از داخل متدهایی شناسایی الگو و  این ایده که  کامپیوترها می توانند بدون اینکه برنامه مشخصی را دریافت کنند کارهایی را انجام دهند، متولد شد. جنبه تکرار شوندگی یادگیری ماشین همواره مورد توجه بوده زیرا متد های این حوزه با قرار گرفتن در میدان داده های جدید می توانند به صورت مستقل خود را بهبود دهند.

حتی با در نظر گرفتن تمامی تاثییرهای یادگیری ماشین در دنیای کنونی، این حوزه به عنوان یک علم جدید مطرح نمیگردد بلکه از ان به عنوان دانشی که وجود داشته ولی حال جان تازه ای گرفته یاد می شود.

یادگیری ماشین و آمار به صورت تنگاتنگی به یکدیگر مرتب هستند، به طوری که به گفته مایکل ایروین جوردن از دانشمندان آمریکایی یادگیری ماشین از تئوری تا ابزارهای موجود همگی سابقه تاریخی در مباحث آمار دارند. همچنین وی پیشنهاد داد تا واژه “علم اطلاعات” به صورت کلی به این حوزه اطلاق گردد.

برخی از کاربردهای شناخته شده یادگیری ماشین

یادگیری ماشین به صورت مستقیم و غیر مستقیم در حوزه های مختلف کاربرد دارد، اما شاید برخی از شناخته شده ترین صورت مساله های که از یادگیری ماشین در آنها استفاده می شود از قرار زیر باشد :

  •         سیستم های پیش بینی و پیشنهاد دهی در سایت های بزرگ همچون آمازون و نت فلیکس
  •         ماشین های خود ران گوگل
  •         سیستم های تشخیص تقلب در کسب کارهای مختلف همچون بانک و بیمه و…
  •         پردازش زبان های طبیعی

متد های یادگیری ماشین

روال یادگیری با مشاهده داده های اولیه جهت استخراج الگو های مختلف همچون مثال ها و تجربه مستقیم آغاز میگردد. هدف اصلی یادگیری ماشین در نهایت حذف دخالت انسان در این فرایند میباشد به طوری که ماشین به صورت خودکار اقدام به یادگیری و بهبود نتایج نماید. برای انجام چنین کاری کامپیوتر با استفاده از انواع مختلف داده اقدام به ایجاد یک مدل از فضای داده ارایه شده می نمیاد و سپس با توجه به صورت مساله موجود و بهره گیری از روش های مختلف از مدل ایجاد شده راه حل مطلوب را تولید می کند.

با توجه به نامعین بودن حجم داده ها برای الگوریتم ها و روشهای مختلف میزان کارایی عملکرد و خطای آنها غیر قطعی می باشد. برای ارایه کارایی مناسب در سیستم های یادگیری ماشین باید پیچیدگی فرضیه مورد بحث و تابع مطلوب استراج شده در فرایند یادگیری متناسب باشند.

یادگیری ماشینی اغلب از دو روش supervised و unsupervised استفاده می نماید.

الگوریتم های یادگیری supervised میتوانند با آن چیزی که از گذشته با استفاده از داده های برجسب گذاری شده آموخته اند شروع به پیشبینی آینده نمایند. این کار با آموزش از طریق نمونه داده های اولیه شروع شده و بعد از استخراج تابع مطلوب امکان دریافت ورودی و پیشبینی در خروجی را فراهم می آورد. در ادامه سیستم میتواند پیشبینی های خود را با داده های واقعی مقایسه کرده و بر اساس آن اقدام به بهبود الگوریتم و تابع مطلوب نمیاید.

الگوریتم های یادگیری unsupervised زمانی استفاده می شوند که خود داده های آموزشی اولیه هم دسته بندی و برچسب گذاری نشده باشند. در این نوع از الگوریتم ها سعی بر این است تا بتوان تابعی یافت تا ساختار پنهان موجود در میان داده های بدون برچسب را نمایش دهد. عملا پاسخ صحیح در این نوع الگرویتم ها معنی مشخصی ندارد بلکه تلاش این نوع سیستم ها یافتن یک ساختار برای تفسیر این نوع از داده ها می باشد.

الگوریتم های یادگیری semi-supervised در واقع از هر دو نوع داده های با برچسب و بدون برچسب برای یادگیری استفاده می کند. مشخصا سیستم هایی که از این روش و با بهره گیری از مقدار کم داده بر چسب گذاری شده و مقدار زیادی داده بدون برچسب در فرایند یادگیری استفاده می نمایند، دارای قدرت دقت بالاتری هستند. نیاز به وجود منابع مرتبط و کارامد تر داده های برچسب گذاری شده از مواردی که باعث می شود به این روش از یادگیری روی بیاوریم.

در هرکدام از متد های اعلام شده از الگوریتمهای مختلف آماری برای دست یابی به تابع مطلوب استفاده می شود که برخی از شناخته شده ترین های آنها از قرار زیر هستند.

یادگیری supervised  :

  •         Decision Trees
  •         Naive Bayes Classification
  •         Ordinary Least Squares Regression
  •         Support Vector Machine

یادگیری un-supervised  :

  •         Clustering Algorithms
  •         Singular Value Decomposition
  •         Independent Component Analysis

لازم به ذکر است که با توجه به گستره کاربری در یادگیری ماشین الگوریتم های استفاده شده نیز گسترده و همواره در حال بروز رسانی می باشند.

افزودن دیدگاه