آکادمی داده کاوی

تعریف داده کاوی

مقدمه
با گسترش فناوري اطلاعات و ارتباطات درجهان و ورود سريع آن به زندگي روزمره مردم مسائل و ضرورت­هاي تازه­اي به­ وجود­ آمده ­است .امروزه انسان توسعه يافته كسي است كه به اطلاعات دسترسي داشته ­باشد و دسترسي به اطلاعات نه يك ضرورت،كه يك قدرت محسوب­ مي­شود. دراين­ ميان شهر­ها به عنوان مراكز قدرت انساني و تمدن­هاي بشري بيش از پيش اهميت­ يافته­ اند. در این مقاله به تعریف داده کاوی می پردازیم ، به اعتقاد الوين تافلر، مردم كره زمين تا به امروز سه موج اساسي تحول راپشت سرگذاشته اند :

  • موج اول، موج انقلاب كشاوزي است كه زمان آغاز آن بركسي مشخص نيست.
  • موج دوم، انقلاب صنعتي است كه به دنبال اختراع ماشين بخار در سال  1764آغاز­ شد.
  • موج سوم يا انقلاب انفورماتيك است كه ازسال 1946 كه بشر به ساخت كامپيوتر نائل آمده آغاز گشته­است.

اگر در موج دوم سخت­ افزارها به كمك انسان­ها مي­آمدند، درموج سوم اين نرم­افزار­ها هستند که به خدمت بشر مي­شتابند و تفكرات و تصورات آدمي را به شكل كدهاي صفر و يك و با كمك امواج ماهواره­اي مبادله ­مي­كنند.

 در موج سوم، انسان هر روز که بيشتر ياد ­مي­گيرد، بيشتر مي فهمد كه با حقيقت فاصله دارد .موج سوم را موج خردورزي نيز لقب داده اند زيرا در اين عرصه­ ها، انسان­ها ديگر فرصت ندارند زياد با هم صحبت­كنند، همه چيز تعريف­شده و براي هر تعريف، يك كد درنظرگرفته­ شده ­است.اعریف داده کاوی

جهان امروز

از سوی دیگر در دنیای به شدت رقابتی امروز، اطلاعات بعنوان یکی از فاکتورهای تولیدی مهم پدیدار شده است. در نتیجه تلاش برای استخراج اطلاعات از داده ها توجه بسیاری از افراد دخیل در صنعت اطلاعات و حوزه های وابسته را به خود جلب نموده است.   
حجم بالای داده های دائما در حال رشد در همه حوزه ها و نیز تنوع آنها به شکل داده متنی، اعداد، گرافیکها، نقشه ها، عکسها،  تصاویر ماهواره ای و عکسهای گرفته شده با اشعه ایکس نمایانگر پیچیدگی کار تبدیل داده ها به اطلاعات است. علاوه بر این، تفاوت وسیع در فرآیندهای تولید داده مثل روش آنالوگ مبتنی بر کاغذ و روش دیجیتالی مبتنی بر کامپیوتر، مزید بر علت شده است. استراتژیها و فنون متعددی برای گردآوری، ذخیره، سازماندهی و مدیریت کارآمد داده های موجود و رسیدن به نتایج معنی دار بکار گرفته شده اند. بعلاوه، عملکرد مناسب ابرداده که داده ای درباره داده است در عمل عالی بنظر میرسد.

پیشرفتهای حاصله در علم اطلاع رسانی و تکنولوژی اطلاعات، فنون و ابزارهای جدیدی برای غلبه بر رشد مستمر و تنوع بانکهای اطلاعاتی تامین می کنند. این پیشرفتها هم در بعد سخت افزاری و هم نرم افزاری حاصل شده اند.

 ریزپردازنده های سریع، ابزارهای ذخیره داده های انبوه پیوسته و غیر پیوسته، اسکنرها، چاپگرها و دیگر ابزارهای جانبی نمایانگر پیشرفتهای حوزه سخت افزار هستند. پیشرفتهای حاصل در نظامهای مدیریت بانک اطلاعات در طی چهار دهه گذشته نمایانگر تلاشهای بخش نرم افزاری است.

 این تلاشها در بخش نرم افزار را میتوان بعنوان یک حرکت پیشرونده از ایجاد یک بانک اطلاعات ساده تا شبکه ها و بانکهای اطلاعاتی رابطه ای و سلسله مراتبی برای پاسخگویی به نیاز روزافزون سازماندهی و بازیابی اطلاعات ملاحظه نمود. بدین منظور در هر دوره، نظامهای مدیریت بانک اطلاعاتی مناسب سازگار با نرم افزار سیستم عامل و سخت افزار رایج گسترش یافته اند. در این رابطه میتوان از محصولاتی مانند، Dbase-IV, Unify, Sybase, Oracle  و غیره نام برد.

داده کاوی یکی از پیشرفتهای اخیر در راستای فن آوریهای مدیریت داده هاست. داده کاوی مجموعه ای از فنون است که به شخص امکان میدهد تا ورای داده پردازی معمولی حرکت کند و به استخراج اطلاعاتی که در انبوه داده ها مخفی و یا پنهان است کمک می کند. انگیزه برای گسترش داده کاوی بطور عمده از دنیای تجارت در دهه 1990 پدید آمد. مثلا داده کاوی در حوزه بازاریابی، بدلیل پیوستگی غیرقابل انتظاری که بین پروفایل یک مشتری و الگوی خرید او ایجاد میکند اهمیتی خاص دارد.تعریف داده کاوی مدرن

تحلیل رکوردهای حجیم نگهداری سخت افزارهای صنعتی، داده های هواشناسی و دیدن کانال های تلوزیونی از دیگر کاربردهای آن است. در حوزه مدیریت کتابخانه کاربرد داده کاوی بعنوان فرایند ماخذ کاوی نامگذاری شده است. این مقاله به کاربردهای داده کاوی در مدیریت کتابخانه ها و موسسات آموزشی می پردازد. در ابتدا به چند سیستم سازماندهی داده ها که ارتباط نزدیکی به داده کاوی دارند می پردازد؛ سپس عناصر داده ای توصیف میشوند و درپایان چگونگی بکارگیری داده کاوی در کتابخانه ها و موسسات آموزشی مورد بحث قرار گرفته و مسائل عملی مرتبط در نظر گرفته می شوند.مفاهیم داده کاوی
مديريت ذخيره سازی و دستيابی اطلاعات
داده های اطلاعاتی به عنوان يکی از منابع حياتی سازمان شناخته می شود و بسياری از سازمان ها با اطلاعات و دانش سازمانی خود مانند ساير دارايی های ارزشمندشان برخورد می کنند .
 نکته: داده اطلاعاتی (Data) به اطلاعات خام سازمان اتلاق می‌شود و اطلاعات (Information) به داده‌های پردازش شده. همچنين داده های پردازش شده پس از طبقه بندی و آناليز به دانش سازمان (Knowledge) تبديل می گردند.

حال تصور نماييد، دسترسی به اطلاعات (Information) در شرايطی که داده‌ها به روش نامناسبی نگهداری شوند و يا روش ضابطه مندی جهت دستيابی به آنها وجود نداشته باشد تا چه حد مشکل است . برای رسيدن به يک سيستم اطلاعاتی مناسب، داده‌ها می بايست به صورتی منطقی طبقه بندی و ذخيره شوند تا استفاده از آن ها ساده‌تر بوده، با کارايی بيشتری تحليل شوند و سريعتر مورد استفاده قرار گيرند و در نتيجه مديريت بهتری بر آن ها اعمال شود.

ساختار بانک اطلاعاتی سازمان
داده های سازمان ها در انواع بانک های اطلاعاتی و با ساختارهای متنوعی ذخيره می‌گردند . طراحی و سازماندهی اين ساختارها، بکارگيری و انتقال به بانک‌های اطلاعاتی پيشرفته و بهينه سازی آن ها يکی خدماتی است که توسط واحدهای فناوری اطلاعات ارايه می شود .تعریف داده کاوی و جایگاه datamining

داده­ كاوي(Data Mining)  چيست؟

فناوري­هاي نوين اطلاعاتي و ارتباطي، و همچنين تكنولوژي­هاي پشتيبان تصميم، با جمع­آوري، ذخيره، ارزيابي، تفسير و تحليل، بازيابي و اشاعه اطلاعات و دانش به كاربران خاص، مي­توانند در اطلاع­يابي به­موقع، صحيح و مورد­نياز به افراد تاثير زيادي داشته­باشند. يكي از ابزارهاي مورد استفاده در اين فناوري­ها، داده كاوي مي باشد. داده­کاوي شامل استفاده از ابزار­هاي پيشرفته تحليل داده به منظور کشف الگو­هاي معتبر، از قبل نا­شناخته و روابط در مجموعه داده­هاي بزرگ است. اين ابزار­ها، مدلهاي آماري، الگوريتم­هاي رياضي و متد­هاي يادگيري ماشين (الگوريتم­هايي که عملکرد خود را از طريق تجربه به­صورت اتوماتيک بهبود مي­دهند) مي­باشد. داده­کاوي فراتر از جمع­آوري و مديريت داده است، و شامل تجزيه و تحليل و پيش­گويي مي­شود. نام ديگر آن کشف دانش در پايگاه داده يا به اختصار KDD است . 

داده­کاوي مي­تواند روي داده­هاي کمي، متني، يا چند­رسانه­اي انجام­گيرد. کاربرد­هاي آن شامل موارد زير مي­باشد :

  •     قوانين وابستگي: الگو­هايي که در آن وجود يك آيتم دلالت بر وجود آيتم ديگر دارد،
  •    کلاس­بندي: انتساب الگو­ها به يک مجموعه کوچک از کلاس­هاي از قبل تعريف شده به وسيله­ کشف بعضي روابط بين ويژگي­ها،
  •    خوشه ­بندي: گروه­بندي مشتريان يا مجموعه الگو­هايي که ويژگي­هاي مشابهي دارند،
  •    پيش­گويي: کشف الگو­ها براي پيش­گويي منطقي درباره آينده،
  •     تحليل مسير يا الگو­هاي ترتيبي: الگو­هايي که در آن يک رخداد منجر به وقوع رخداد ديگر مي­شود.

داده­کاوي يک تکنولوژي جديد نيست ولي کاربرد آن به­طور معناداري در بخش­هاي مختلف خصوصي و عمومي رو­به­رشد بوده و عموما صنايعي چون بانک، بيمه، پزشکي و خرده­فروشي از داده­کاوي به هدف کاهش هزينه­ها، افزايش تحقيقات و افزايش فروش استفاده مي­کنند.آکادمی داده کاوی

مفاهيم پايه در داده کاوی

در انجام پروژه داده کاوی معمولا به کشف الگوهاي مفيد از ميان داده ها اشاره مي شود . منظور از الگوي مفيد ، مدلي در داده ها است که ارتباط ميان يک زير مجموعه از داده ها را توصيف مي کند و معتبر ، ساده ، قابل فهم و جديد است .

 تعریف داده کاوی

در متون آکادميک تعاريف گوناگوني براي داده کاوي ارائه شده است . در برخي از اين تعاريف داده کاوي در حد ابزاري که کاربران را قادر به ارتباط مستقيم با حجم عظيم داده ها مي سازد معرفي گرديده است و در برخي ديگر ، تعاريف دقيقتر که درآنها به کاوش در داده ها توجه مي شود موجود است . برخي از اين تعاريف عبارتند از :

تعریف داده کاوی عبارت است از فرايند استخراج اطلاعات معتبر ، از پيش ناشناخته ، قابل فهم و قابل اعتماد از پايگاه داده هاي بزرگ و استفاده از آن در تصميم گيري در فعاليت هاي تجاري مهم.

اصطلاح داده کاوي به فرايند نيم خودکار تجزيه و تحليل پايگاه داده هاي بزرگ به منظور يافتن الگوهاي مفيد اطلاق مي شود

تعریف داده کاوی يعني جستجو در يک پايگاه داده ها براي يافتن الگوهايي ميان داده ها .

تعریف داده کاوی يعني استخراج دانش کلان ، قابل استناد و جديد از پايگاه داده ها ي بزرگ .

تعریف داده کاوی يعني تجزيه و تحليل مجموعه داده هاي قابل مشاهده براي يافتن روابط مطمئن بين داده ها .

همانگونه که در تعاريف گوناگون داده کاوي مشاهده مي شود ، تقريبا در تمامي تعاريف به مفاهيمي چون استخراج دانش ، تحليل و يافتن الگوي بين داده ها اشاره شده است .

نویسنده: جناب آقای هژبر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مطالب مرتبط با این نوشته

لینک کوتاه این مقاله