ابرداده ها چگونه به تکنولوژی یادگیری ماشینی کمک کنند؟
همگی ما می دانیم که در عصرتکنولوژی می توانیم داده های بسیار بزرگی را بدست آوریم، بسیاری از مجهولات و مسائل دنیای امروزی ، به دلیل عدم داشتن اطلاعات مفید و مخصوص مربوط به آن مجهولات است.
با به دست آوردن اطلاعات بسیار و یادگیری ماشینی می توانیم برداده ها تسلط پیدا کنیم و آن را درمسیر صحیح به کارببریم .آینده عصر فناوری به این موارد نیاز دارد.
واژه ابرداده ها دراین قرن زیاد به گوش می رسد و برای زمانی است که ما اطلاعات گسترده وسازمان یافته ای را درمورد موضوعی به دست می آوریم و آن ها را برای به کاربردن دسته بندی خواهیم کرد . ما با جستجو درابرداده ها بسیاری از هزینه هایی که برای پردازش اطلاعات پرداخت می کنیم را کاهش می دهیم و بسیاری از نکاتی که برما پوشیده بود ، دیگرمبهم نمی باشد.
برای مثال زمانی که محصولی را به فروش می رسانیم تا زمانی که ازاطلاعات خریداران باخبر نباشیم , نمی توانیم آن را گسترش دهیم و زمانی که اطلاعات ما به ابرداده تبدیل شود , آن وقت گسترش فروش آن را مشاهده می کنید.
زمانی دنیا به آستانه بزرگی ابرداده ها می رسد که اطلاعات ذخیره شده به صورت آنلاین گسترش یابد و اینترنت اشیا و گجت های پوشیدنی به آن افزوده شوند . درآن هنگام حرکت درمیان آن ها امری ضروری ومهم بوده و یادگیری ماشین وارد کار می شود.
اشتباه نکنید یادگیری ماشینی ربطی به رباط های خانگی ندارد ویادگیری ماشینی خیلی نزدیکتربه ما از رباط های خانگی است. برای مثال پوشه هرزنامه (spam folder) درایمیل شما براساس الگاریتم های خاصی پیام های شما را دریافت می کند و به صورتی یاد گرفته است که آن را درقسمت بارگذاری کند.
مثالی مشابه دیگر، صفحه ی فیسبوک شما است که براساس لایک کردن وکامنت گذاشتن و به اشتراک گزاری، تمایلات علاقمندی های شما را با توجه به تمایلاتتان تقسیم بندی می کند.
زمانی که ابرداده ها به یادگیری ماشینی برسند ، انقلاب بزرگی درعصرتکنولوژی رخ خواهد داد . به این صورت که در بخش پزشکی که پتانسیل بزرگی دراین امر دارد، الگوریتم های هوشمندی با استفاده ازابرداده ها بوجود اورد.
بسیار پس از داشتن اطلاعات بسیاری از خود واطلاعات ژنتیکی کمک بزرگی به علم پزشکی می کند، یادگیری ماشینی می تواند دربین اطلاعات ثبت شده جستجو به عمل آورد واطلاعات پزشکی را به هم متصل میکند.
بسیاری که به سرطان مبتلا هستن برای درمانش به سمت پزشک می اید وماشین به وی اطلاعات می دهد که این فرد یک ژن یا مجموعه ای ازژن های خاص دارد و باید برای او درمان های خاص بکار ببرد.
هوش مصنوعی با یادگیری ماشینی چه تفاوتی دارد؟
دوستان عزیزهر تکنیکی که کامپیوترها را قادر سازد که از رفتار انسان ها تقلید کنند را هوش مصنوعی می گویند.
درحالی که یادگیری ماشینی زیر مجموعه ای از هوش مصنوعی است. شما هیچ وقت نباید تعریف هوش مصنوعی را با یادگیری ماشینی و یادگیری مخلوط کنید زیرا چیزی جزگیج شدن شما دربرندارد یادگیری ماشینی داده ها را درکنار هم جمع آوری می کند وباعث می شود کامپیوتربرنامه های کاربردی را ازخود ارائه دهد.
بگذارید شمارا با تعریف دیپ لرنینگ آشنا کنم و آن هم زیرمجموعه ای از یادگیری ماشینی است که محاسبات چند لایه شبکه های عصبی را ممکن می سازد . با این حال تعریف یادگیری عمیق زیر مجموعه ای از ماشین لرنینگ که مسایل پیچیده را قابل حل می کند.
خوانندگان گرامی باید با تعریفی از هوش مصنوعی آشنا شده باشند ، بنابراین از توضیح آن در این مقاله صرف نظر می کنم.
با این حال دریادگیری ماشینی مابه تکنیک های اولیه درهوش هوش مصنوعی پی می بریم.
یادگیری ماشین
تا اکنون شما به این فکر کرده اید چگونه نوشتن را یادگرفته اید واملا گرامرها را ازبرگرفته اید؟
شما کتاب ها را خوانده اید و با گذر زمان فارغ التحصیل شده اید و داده های زیادی را پردازش کرده اید و آن ها را آموخته اید. این دقیقا مانند ماشین لرنینگ است به این دلیل که اطلاعات زیادی به الگوها بدهیم و بگذاریم از چیزها سردربیاورند و در آینده اهداف ما را قابل دستیابی کنند.
برای مثال به معاملات مالی خود الگوریتم داده بدهیم وبه آن ها بگوییم که جعلی ها را پیدا کنند و درآینده بتواند کلاه برداری ها را پیش بینی کند.
ما با گسترش الگوریتم ها ، بسیاری از مسائل را حل می کنیم ولی بعضی از مسائل مثل حرف زدن وشناختن دست خط که برای انسان ها آسان است را ماشین ها نمی توانند تشخیص دهند.
استفاده از نورون های مصنوعی ایده ایی بود که درسال های قبل وجود داشته است، با این وجود که شبکه های عصبی شبیه سازی شده برای حل مشکلات مورد استفاده قرار می گرفتند. مسائل پیچیده ای را که الگوهای دیگرنمی توانند از پسش بربیایند را حل کنند.
انواع یادگیری ماشینی
سه نوع از الگوهای یادگیری ماشینی
- یادگیری نظارت شده
- یادگیری نظارت نشده
- یادگیری تقویتی
یادگیری نظارت شده
معمولا در روشهای یادگیری ماشینی از یادگیری نظارت شده استفاده میکنند . در یادگیری ماشین نظارت شده ، سیستم تلاش میکند تا از نمونههای قبلی بیاموزد که در آن وجود داشته است. به عبارت دیگر، در این نوع یادگیری، سیستم تلاش می کند تا الگوها را بر اساس مثالهای داده شده به آن یاد بگیرد.
همانطور که قبلا گفته شد ، در یادگیری ماشین مجموعه داده هایی که به الگوریتم داده میشود و ماشین منطق خود را بر اساس آن مجموعه داده ها یوجود می آورد . این مجموعه داده دارای سطرها و ستونهایی است.
سطرها که از آنها با عنوان رکورد و نمونه داده نیز یاد میشود نماینده نمونه دادهها هستند. برای مثال اگر مجموعه داده مربوط به بازیهای فوتبال وضعیت جوی باشد، یک سطر حاوی اطلاعات یک بازی خاص است.
ستونها که از آنها با عنوان خصیصه، ویژگی، مشخصه نیز یاد میشود, در واقع ویژگیهایی هستند که هر نمونه داده را توصیف میکنند.
مواردی مانند وضعیت هوا شامل ابری بودن یا نبودن، آفتابی بودن یا نبودن، وجود یا عدم وجود مه، بارش یا عدم بارش باران و تاریخ بازی از جمله ویژگیهایی هستند که وضعیت یک مسابقه فوتبال را توصیف میکنند.
حال اگر در این مجموعه داده به عنوان مثال، ستونی وجود داشته باشد که مشخص کند برای هر نمونه داده در شرایط جوی موجود برای آن نمونه خاص بازی فوتبال انجام شده یا نشده (برچسبها) اصطلاحا میگوییم مجموعه داده برچسبدار است.
اگر آموزش الگوریتم از چنین مجموعه دادهای استفاده شود و به آن آموخته شود که بر اساس نمونه دادههایی که وضعیت آنها مشخص است (بازی فوتبال انجام شده یا نشده)، درباره نمونه دادههایی که وضعیت آنها نامشخص است تصمیمگیری کند، اصطلاحا گفته میشود یادگیری ماشین نظارت شده است.
مسائل یادگیری ماشین نظارت شده قابل تقسیم به دو دسته «دستهبندی» و «رگرسیون» هستند.
دستهبندی:یک مساله، هنگامی دستهبندی محسوب میشود که متغیر خروجی یک دسته یا گروه باشد. برای مثالی از این امر میتوان به تعلق یک نمونه به دستههای «سیاه» یا «سفید» و یک ایمیل به دستههای «هرزنامه» یا «غیر هرزنامه» اشاره کرد.
رگرسیون:یک مساله هنگامی رگرسیون است که متغیر خروجی یک مقدار حقیقی مانند «قد» باشد. در واقع در دستهبندی با متغیرهای گسسته و در رگرسیون با متغیرهای پیوسته کار میشود.
یادگیری نظارت نشده
در یادگیری نظارت نشده، الگوریتم باید خود به تنهایی بهدنبال ساختارهای جالب موجود در دادهها باشد. به بیان ریاضی، یادگیری نظارت نشده مربوط به زمانی است که در مجموعه داده فقط متغیرهای ورودی (X) وجود داشته باشند و هیچ متغیر داده خروجی موجود نباشد.
به این نوع یادگیری، نظارت نشده گفته میشود زیرا برخلاف یادگیری نظارت شده، هیچ پاسخ صحیح داده شدهای وجود ندارد و ماشین خود باید به دنبال پاسخ باشد.
به بیان دیگر، هنگامی که الگوریتم برای کار کردن از مجموعه دادهای بهره گیرد که فاقد دادههای برچسبدار (متغیرهای خروجی) است، از مکانیزم دیگری برای یادگیری و تصمیمگیری استفاده میکند. به چنین نوع یادگیری، نظارت نشده گفته میشود. یادگیری نظارت نشده قابل تقسیم به مسائل خوشهبندی و انجمنی است.
قوانین انجمنی:یک مساله یادگیری هنگامی قوانین انجمنی محسوب میشود که هدف کشف کردن قواعدی باشد که بخش بزرگی از دادهها را توصیف میکنند. مثلا، «شخصی که کالای الف را خریداری کند، تمایل به خرید کالای ب نیز دارد».
خوشهبندی:یک مساله هنگامی خوشهبندی محسوب میشود که قصد کشف گروههای ذاتی (دادههایی که ذاتا در یک گروه خاص میگنجند) در دادهها وجود داشته باشد. مثلا، گروهبندی مشتریان بر اساس رفتار خرید آنها.
یادگیری تقویتی
یک برنامه رایانهای که با محیط پویا در تعامل است باید به هدف خاصی دستیابد (مانند بازی کردن با یک رقیب یا راندن خودرو). این برنامه بازخوردهایی را با عنوان پاداشها و تنبیهها فراهم و فضای مساله خود را بر همین اساس هدایت میکند. با استفاده از یادگیری تقویتی، ماشین میآموزد که تصمیمات مشخصی را در محیطی که دائم در معرض آزمون و خطا است اتخاذ کند.
از اینکه وقت خود را برای خواندن این مقاله گذاشتید از شما بسیار متشکرم.
[zombify_post]
دیدگاهتان را بنویسید