مقدمه
با گسترش فناوري اطلاعات و ارتباطات درجهان و ورود سريع آن به زندگي روزمره مردم مسائل و ضرورتهاي تازهاي به وجود آمده است .امروزه انسان توسعه يافته كسي است كه به اطلاعات دسترسي داشته باشد و دسترسي به اطلاعات نه يك ضرورت،كه يك قدرت محسوب ميشود. دراين ميان شهرها به عنوان مراكز قدرت انساني و تمدنهاي بشري بيش از پيش اهميت يافته اند. در این مقاله به تعریف داده کاوی می پردازیم ، به اعتقاد الوين تافلر، مردم كره زمين تا به امروز سه موج اساسي تحول راپشت سرگذاشته اند :
- موج اول، موج انقلاب كشاوزي است كه زمان آغاز آن بركسي مشخص نيست.
- موج دوم، انقلاب صنعتي است كه به دنبال اختراع ماشين بخار در سال 1764آغاز شد.
- موج سوم يا انقلاب انفورماتيك است كه ازسال 1946 كه بشر به ساخت كامپيوتر نائل آمده آغاز گشتهاست.
اگر در موج دوم سخت افزارها به كمك انسانها ميآمدند، درموج سوم اين نرمافزارها هستند که به خدمت بشر ميشتابند و تفكرات و تصورات آدمي را به شكل كدهاي صفر و يك و با كمك امواج ماهوارهاي مبادله ميكنند.
در موج سوم، انسان هر روز که بيشتر ياد ميگيرد، بيشتر مي فهمد كه با حقيقت فاصله دارد .موج سوم را موج خردورزي نيز لقب داده اند زيرا در اين عرصه ها، انسانها ديگر فرصت ندارند زياد با هم صحبتكنند، همه چيز تعريفشده و براي هر تعريف، يك كد درنظرگرفته شده است.
جهان امروز
از سوی دیگر در دنیای به شدت رقابتی امروز، اطلاعات بعنوان یکی از فاکتورهای تولیدی مهم پدیدار شده است. در نتیجه تلاش برای استخراج اطلاعات از داده ها توجه بسیاری از افراد دخیل در صنعت اطلاعات و حوزه های وابسته را به خود جلب نموده است.
حجم بالای داده های دائما در حال رشد در همه حوزه ها و نیز تنوع آنها به شکل داده متنی، اعداد، گرافیکها، نقشه ها، عکسها، تصاویر ماهواره ای و عکسهای گرفته شده با اشعه ایکس نمایانگر پیچیدگی کار تبدیل داده ها به اطلاعات است. علاوه بر این، تفاوت وسیع در فرآیندهای تولید داده مثل روش آنالوگ مبتنی بر کاغذ و روش دیجیتالی مبتنی بر کامپیوتر، مزید بر علت شده است. استراتژیها و فنون متعددی برای گردآوری، ذخیره، سازماندهی و مدیریت کارآمد داده های موجود و رسیدن به نتایج معنی دار بکار گرفته شده اند. بعلاوه، عملکرد مناسب ابرداده که داده ای درباره داده است در عمل عالی بنظر میرسد.
پیشرفتهای حاصله در علم اطلاع رسانی و تکنولوژی اطلاعات، فنون و ابزارهای جدیدی برای غلبه بر رشد مستمر و تنوع بانکهای اطلاعاتی تامین می کنند. این پیشرفتها هم در بعد سخت افزاری و هم نرم افزاری حاصل شده اند.
ریزپردازنده های سریع، ابزارهای ذخیره داده های انبوه پیوسته و غیر پیوسته، اسکنرها، چاپگرها و دیگر ابزارهای جانبی نمایانگر پیشرفتهای حوزه سخت افزار هستند. پیشرفتهای حاصل در نظامهای مدیریت بانک اطلاعات در طی چهار دهه گذشته نمایانگر تلاشهای بخش نرم افزاری است.
این تلاشها در بخش نرم افزار را میتوان بعنوان یک حرکت پیشرونده از ایجاد یک بانک اطلاعات ساده تا شبکه ها و بانکهای اطلاعاتی رابطه ای و سلسله مراتبی برای پاسخگویی به نیاز روزافزون سازماندهی و بازیابی اطلاعات ملاحظه نمود. بدین منظور در هر دوره، نظامهای مدیریت بانک اطلاعاتی مناسب سازگار با نرم افزار سیستم عامل و سخت افزار رایج گسترش یافته اند. در این رابطه میتوان از محصولاتی مانند، Dbase-IV, Unify, Sybase, Oracle و غیره نام برد.
داده کاوی یکی از پیشرفتهای اخیر در راستای فن آوریهای مدیریت داده هاست. داده کاوی مجموعه ای از فنون است که به شخص امکان میدهد تا ورای داده پردازی معمولی حرکت کند و به استخراج اطلاعاتی که در انبوه داده ها مخفی و یا پنهان است کمک می کند. انگیزه برای گسترش داده کاوی بطور عمده از دنیای تجارت در دهه 1990 پدید آمد. مثلا داده کاوی در حوزه بازاریابی، بدلیل پیوستگی غیرقابل انتظاری که بین پروفایل یک مشتری و الگوی خرید او ایجاد میکند اهمیتی خاص دارد.
تحلیل رکوردهای حجیم نگهداری سخت افزارهای صنعتی، داده های هواشناسی و دیدن کانال های تلوزیونی از دیگر کاربردهای آن است. در حوزه مدیریت کتابخانه کاربرد داده کاوی بعنوان فرایند ماخذ کاوی نامگذاری شده است. این مقاله به کاربردهای داده کاوی در مدیریت کتابخانه ها و موسسات آموزشی می پردازد. در ابتدا به چند سیستم سازماندهی داده ها که ارتباط نزدیکی به داده کاوی دارند می پردازد؛ سپس عناصر داده ای توصیف میشوند و درپایان چگونگی بکارگیری داده کاوی در کتابخانه ها و موسسات آموزشی مورد بحث قرار گرفته و مسائل عملی مرتبط در نظر گرفته می شوند.مفاهیم داده کاوی
مديريت ذخيره سازی و دستيابی اطلاعات
داده های اطلاعاتی به عنوان يکی از منابع حياتی سازمان شناخته می شود و بسياری از سازمان ها با اطلاعات و دانش سازمانی خود مانند ساير دارايی های ارزشمندشان برخورد می کنند .
نکته: داده اطلاعاتی (Data) به اطلاعات خام سازمان اتلاق میشود و اطلاعات (Information) به دادههای پردازش شده. همچنين داده های پردازش شده پس از طبقه بندی و آناليز به دانش سازمان (Knowledge) تبديل می گردند.
حال تصور نماييد، دسترسی به اطلاعات (Information) در شرايطی که دادهها به روش نامناسبی نگهداری شوند و يا روش ضابطه مندی جهت دستيابی به آنها وجود نداشته باشد تا چه حد مشکل است . برای رسيدن به يک سيستم اطلاعاتی مناسب، دادهها می بايست به صورتی منطقی طبقه بندی و ذخيره شوند تا استفاده از آن ها سادهتر بوده، با کارايی بيشتری تحليل شوند و سريعتر مورد استفاده قرار گيرند و در نتيجه مديريت بهتری بر آن ها اعمال شود.
ساختار بانک اطلاعاتی سازمان
داده های سازمان ها در انواع بانک های اطلاعاتی و با ساختارهای متنوعی ذخيره میگردند . طراحی و سازماندهی اين ساختارها، بکارگيری و انتقال به بانکهای اطلاعاتی پيشرفته و بهينه سازی آن ها يکی خدماتی است که توسط واحدهای فناوری اطلاعات ارايه می شود .
داده كاوي(Data Mining) چيست؟
فناوريهاي نوين اطلاعاتي و ارتباطي، و همچنين تكنولوژيهاي پشتيبان تصميم، با جمعآوري، ذخيره، ارزيابي، تفسير و تحليل، بازيابي و اشاعه اطلاعات و دانش به كاربران خاص، ميتوانند در اطلاعيابي بهموقع، صحيح و موردنياز به افراد تاثير زيادي داشتهباشند. يكي از ابزارهاي مورد استفاده در اين فناوريها، داده كاوي مي باشد. دادهکاوي شامل استفاده از ابزارهاي پيشرفته تحليل داده به منظور کشف الگوهاي معتبر، از قبل ناشناخته و روابط در مجموعه دادههاي بزرگ است. اين ابزارها، مدلهاي آماري، الگوريتمهاي رياضي و متدهاي يادگيري ماشين (الگوريتمهايي که عملکرد خود را از طريق تجربه بهصورت اتوماتيک بهبود ميدهند) ميباشد. دادهکاوي فراتر از جمعآوري و مديريت داده است، و شامل تجزيه و تحليل و پيشگويي ميشود. نام ديگر آن کشف دانش در پايگاه داده يا به اختصار KDD است .
دادهکاوي ميتواند روي دادههاي کمي، متني، يا چندرسانهاي انجامگيرد. کاربردهاي آن شامل موارد زير ميباشد :
- قوانين وابستگي: الگوهايي که در آن وجود يك آيتم دلالت بر وجود آيتم ديگر دارد،
- کلاسبندي: انتساب الگوها به يک مجموعه کوچک از کلاسهاي از قبل تعريف شده به وسيله کشف بعضي روابط بين ويژگيها،
- خوشه بندي: گروهبندي مشتريان يا مجموعه الگوهايي که ويژگيهاي مشابهي دارند،
- پيشگويي: کشف الگوها براي پيشگويي منطقي درباره آينده،
- تحليل مسير يا الگوهاي ترتيبي: الگوهايي که در آن يک رخداد منجر به وقوع رخداد ديگر ميشود.
دادهکاوي يک تکنولوژي جديد نيست ولي کاربرد آن بهطور معناداري در بخشهاي مختلف خصوصي و عمومي روبهرشد بوده و عموما صنايعي چون بانک، بيمه، پزشکي و خردهفروشي از دادهکاوي به هدف کاهش هزينهها، افزايش تحقيقات و افزايش فروش استفاده ميکنند.
مفاهيم پايه در داده کاوی
در انجام پروژه داده کاوی معمولا به کشف الگوهاي مفيد از ميان داده ها اشاره مي شود . منظور از الگوي مفيد ، مدلي در داده ها است که ارتباط ميان يک زير مجموعه از داده ها را توصيف مي کند و معتبر ، ساده ، قابل فهم و جديد است .
تعریف داده کاوی
در متون آکادميک تعاريف گوناگوني براي داده کاوي ارائه شده است . در برخي از اين تعاريف داده کاوي در حد ابزاري که کاربران را قادر به ارتباط مستقيم با حجم عظيم داده ها مي سازد معرفي گرديده است و در برخي ديگر ، تعاريف دقيقتر که درآنها به کاوش در داده ها توجه مي شود موجود است . برخي از اين تعاريف عبارتند از :
تعریف داده کاوی عبارت است از فرايند استخراج اطلاعات معتبر ، از پيش ناشناخته ، قابل فهم و قابل اعتماد از پايگاه داده هاي بزرگ و استفاده از آن در تصميم گيري در فعاليت هاي تجاري مهم.
اصطلاح داده کاوي به فرايند نيم خودکار تجزيه و تحليل پايگاه داده هاي بزرگ به منظور يافتن الگوهاي مفيد اطلاق مي شود
تعریف داده کاوی يعني جستجو در يک پايگاه داده ها براي يافتن الگوهايي ميان داده ها .
تعریف داده کاوی يعني استخراج دانش کلان ، قابل استناد و جديد از پايگاه داده ها ي بزرگ .
تعریف داده کاوی يعني تجزيه و تحليل مجموعه داده هاي قابل مشاهده براي يافتن روابط مطمئن بين داده ها .
همانگونه که در تعاريف گوناگون داده کاوي مشاهده مي شود ، تقريبا در تمامي تعاريف به مفاهيمي چون استخراج دانش ، تحليل و يافتن الگوي بين داده ها اشاره شده است .
نویسنده: جناب آقای هژبر