آکادمی داده کاوی

گفتگو با خانم مینا ربطی

 خب من مینا ربطی هستم و 6 سال هست که در حوزه داده کاوی و یادگیری ماشین فعالیت میکنم و به تدریس در این حوزه فوق العاده مهم و کاربردی مشغول هستم . شروع کارم با داده کاوی ویادگیری ماشین با چند پژوهشکده تحقیقاتی بود که بر روی پردازش تصویر و بینایی ماشین یک سری فعالیت هارو انجام دادیم که  خب علاقه من رو به این حوزه بیشتر کرد و باعث شد که ادامه دار باشه . در حوزه کسب و کار هم در بحث خوشه بندی مشتریان و تدوین استراتژی های فروش با یکی از کمپانی های بیمه و همچنین تدوین سیستم های توصیه گر با یکی از برند های فروشگاهی همکاری میکنم .

خب بریم سراغ سوال هامون ،خیلی ها علاقه مند هستند تا وارد این حوزه بشن اما یه سردرگمی دارن یا نمیدونن شروع مسیرشون از کجا میتونه باشه ، پیشنهادتون براشون چی هست ؟؟ چه فیلد هایی وجود داره که میتونن به اونها توجه کنند یا روش متمرکز بشن ؟

ببنید بحث داده کاوی و  در یک مفهوم دیگه یادگیری ماشین بحث خیلی  بزرگ و گسترده ای هستش که داده کاوی تو حوزه های مختلف کسب و کار مانند هوش تجاری  یکی از زیر مجموعه های تقریبا کوچیک اون به حساب میاد و خب کسی که میخواد وارد این حوزه بشه شاید یک مسیر کمی طولانی رو باید طی بکنه تا تجربیاتی رو بدست بیاره و بتونه به عنوان یک کارشناس داده، مهندس داده و یا تحلیل گر داده  تو این حوزه حرفی برای گفتن داشته باشه .یعنی صرف دونستن مفاهیم داده کاوی و کار کردن با چند نرم افزار  با عنوان تحلیل گر داده نمیتونه وارد این حوزه بشه .

 شاید بشه دوتا هدف رو براش در نظر گرفت ، یکی بحث تحصیلات تکمیلی و اپلای گرفتن هستش که خب شخص میتونه رشته  علم داده  Data scienceو … انتخاب کنه و در کارشناسی و یا کارشناسی ارشد مهارتهای تبدیل شدن به مهندس علم داده رو یادبگیره.این رشته بسیار در خارج ایران ترند هست و در حوزه شغلی یکی از پردرامدترین مشاغل شناخته میشه . و این همون مرحله یادگیری آکادمیک هست که میشه با این یادگیری وارد بازار کار شد. در ایران هم دانشگاه های زیادی مثل دانشگاه شهید بهشتی این حوزه دیتاساینس رو وارد تحصیلات تکمیلی کردند.

اما در حوزه وکسب و کار . شخص برای وارد شدن به بازار کار باید از یادگیری تجربی و استفاده از دوره های حضوری و دوره های معتبر آنلاین استفاده کنه که خوب  شاخه های مختلفی داره:

اگه الان کارشناس داده کاوی و تحلیل داده رو گوگل کنیم خب یکی از فیلد هایی که میاد ، وارد بحث هوش تجاری (BI expert) میشه . اگه کسی بخواد با این عنوان وارد یک کسب و کار بشه باید حداقل با مفاهیم اون به خوبی آشنایی داشته باشه که خب یکی از اونها داده کاوی و الگوریتم های یادگیری هستش . کارشناس BI باید علاوه بر مفاهیم کسب و کار، به تحلیل داده و تولید اطلاعات و گزارشات سازمانی تسلط کافی داشته باشه.

خب مورد دیگه ای که وجود داره کارشناس کلان داده یا بیگ دیتا هستش .بیگ دیتا یک بحث فوق العاده جذابه که این روز ها خیلی مطرح هست و در سازمان های بزرگ دارن از این فیلد  اطلاعات مهم و گرفتن الگو پنهان از داده ها استفاده می کنند. در این حوزه براساس داده های حجیم در حدود ترابایت و اگزابایت مفهوم  پردازش های  توزیع شده مطرح هست که در ایران  در حوزه بانک، تلکام و سازمان های بزرگ کارهایی انجام شده اما هنوز به اندازه فیلد های دیگه بازار چندانی پیدا نکرده اما با توجه به توسعه اش  در سال های اخیرجای امیدواری زیادی داره .

یه فیلد دیگه ای هم که وجود داره و بعضی از استارت اپ ها دارن روش کار میکنن بحث سیستم های پیشنهاد دهنده هستش که داره به عنوان یکی از زیر مجموعه های هوش مصنوعی خیلی کمک میکنه به عنوان مثال در فروشگاه های اینترنتی مثل دیجی کالا یا بامیلو و … برای پیش بینی رفتار بعدی کاربران برای سود دهی و جذب استفاده کنند .البته آمازون و یوتیوب از این recommender ها و ابزارهای هوش مصنوعی به طور وسیعی استفاده می کنند.

مورد دیگه ای هم که میشه واردش بشن بحث NLP و یا پردازش زبان طبیعی هست . این حوزه در بحث پردازش متن فارسی  مثلا برای تشخیص تقلب های علمی، تشخیص اسپم در ایمیل، پردازش صوت کاربرد زیادی داره . تحلیل شبکه های اجتماعی و تحلیل احساسات هم یکی از موضوعات  جذاب این فیلد است.

سوال دومی که دارم در مورد بحث دسترسی به داده هستش .یکی از چالش هایی که برای خیلی از افرادی که میخوان وارد این حوزه بشن یا مدتی شده دارن کار میکنن  وجود داره دسترسی به داده هست ، پیشنهادی درباره این موضوع دارین ؟؟

خب یکی از مهم ترین چالش هایی که تو بحث داده کاوی و کلان داده وجود داره  بحث دسترسی به داده هستش ولی من  تو این چند سالی که کار کردم اوایل که میخواستیم یک سری پروژه های تحقیقاتی برای یک سری سازمان بزنیم دسترسی به داده یک محدودیت خیلی بزرگ بود واسمون .خب اونها اصلا  نمیدونستن داده کاوی چیه و قراره چه کاری روی داده هاشون انجام بده و خیلی روی مباحث امنیتی تاکید داشتن .اما خب توی چند سال گذشته این دیدگاه تغییر کرده و خیلی بهتر شده.

ولی کلا کسی که میخواد وارد این حوزه بشه  برای  پروژه های کوچیک خیلی دیتاهای معتبری  مثل سایت دانشگاه کالیفرنیا و کگل… وجود داره که میتونه از این دیتاها تو حوزه های فروش ، بانک ، بیمه و …  استفاده کنه که مقالات معتبری روش کار کردن و برای کارهای تحقیقاتی بسیار مناسب هستش . اما خب در قدم های بعدی نیاز هست که تا حدودی دید سازمان ها هم (البته بیشتر دولتی) عوض بشه ، ازونجایی که بحث کلان داده هم توی دانشگاه ها مطرح شد و خب مقداری در کسب و کارها هم به اون پرداختن جای امیدواری داره.

این سوال رو بهتره اینطور بپرسم که چه مهارت هایی لازمه تا به یه کارشناس در این حوزه تبدیل بشیم ؟ داشتن تحصیلات دانشگاهی یک اصل ضروری به حساب میاد؟

میتونم بگم که تحصیلات دانشگاهی مثل همه رشته ها نرم افزاری به اون صورت خاص نیاز نیستش ، بحث اول به نظر من علاقه و پشتکار هست ، چون فکر میکنم کسی که میخواد وارد این حوزه بشه خیلی خیلی باید اطلاعاتش رو زیاد کنه ، مرتبا در حال به روز کرد خودش باشه و این کار نیاز مند یک تلاش و پشتکار جدی هست  چون معمولا خیلی سریع یک الگوریتم جدید میاد و نیاز هست که خودت رو آپدیت نگه داری .

مهارت هایی که لازم هستش رو میتونم به این صورت بگم که

برای کارشناس هوش تجاری همون طور که گفتم یک BI expert باید علاوه بر آمار و داده کاوی توانایی کار با پایگاه داده، طراحی پرس و جو query، استخراج انبار داده، مصورسازی ،ابزارهای گزارش گیری و تهیه داشبوردهای مدیریتی  را در مفاهیم کسب و کار داشته باشه. از نرم افزارهای هوش تجاری میشه به power BI ، تبلو tableau، Oracle Bi و sql اشاره کرد. برنلمه نویسی با PL/SQL هم امتیازه ، کلا برای این فیلد اوراکل رو بسیار پیشنهاد می کنم که در ایران بازار کار خیلی خوب و پردرامدی داره.

برای کارشناس بیگ دیتا کارشناس علاوه بر مفاهیم کار با داده ، و داده کاوی  باید با سیستم های توزیع شده و انبار داده، ETL هم آشنایی داشته باشند و گام بعدی هم حتما مسلط به  نرم افزار های هدوب ، اسپارک  … باشن  تا بتونند وارد این حوزه بشن . برای وارد شدن به این حوزه گذراندن دوره های دیتا ساینتیست پیشنهاد میشه. لازمه این فیلد کاری  برای یک کارشناس قطعا طراحی الگوریتم و برنامه نویسی، و تسلط کافی به یکی از زبان های R یا پایتون و یا هر دو هست. این فیلد با ادغام فیلد هوش تجاری همون بحث تحلیل گر داده یا دانشمند علم داده هست. یعنی میشه گفت یک دانشمند علم داده  به تمامی ابزارهای این دو فیلد آشنایی داره.

یک برنامه نویس NLP هم علاوه بر مهارت تو حل مساله و کدنویسی به خصوص با جاوا و پایتون، با مفاهیم متن کاوی،پردازش متن و کتابخانه های NLTK و openNLP تسلط کافی داشته باشه . وب کاوی و تحلیل شبکه های اجتماعی با زبان پایتون و R هم در این حوزه کار میشه.

نظرت در مورد بازار کار این حوزه با توجه به اهمیتش چی هست ؟

در بحث بازار کار ، چون قبلا هوش تجاری فقط فیلدی بود که ، افرادی که مدیر کنترل پروژه بودن میرفتن دوره های هوش تجاری ،اما در چند سال اخیر شرکت ها افرادی رو با عنوان کارشناس هوش تجاری و سابقه کار یک تا سه سال دیدم که استخدام میکنن و این نکته مثبتی هست . یعنی به خوبی داره به این حوزه توجه میشه و اهمیتش رو درک کردن .

در شاخه هایی که گفتم افراد بعد از کسب مهارت در دوره ها با یادگیری تجربی و دوره های عملی کارآموزی مثل دوره رایگان یادگیری ماشین رهنما کالج می تونن وارد بازار کار بشن و توانایی های خودشون رو به چالش بکشن . همچنین دورهمی هایی برای شبکه سازی مانند همتک هست در این حوزه که افراد میتونن خودشون رو به شرکت ها و برند های دیگه معرفی کنند و همکارانی هم در این حوزه پیدا کنند . من فکر میکنم بازار کارش در آینده پیش رو در ایران هم خیلی مثبت باشه و جای کار زیادی هم داره .

منبع: ری اکت اَپ

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مطالب مرتبط با این نوشته

لینک کوتاه این مقاله