داده کاوی ( Data-Mining )
دادههای اطلاعاتی ( Data ) به عنوان یکی از منابع حیاطی سازمان شناخته می شود و بسیاری از سازمان ها با اطلاعات و دانش سازمانی خوب مانند سایر دارایی های ارزشمندشان برخورد می کنند.
داده اطلاعاتی ( Data ) به اطلاعات خام سازمان اطلاق می شود و اطلاعات ( Information ) به دادههای پردازش شده.
همچنین داده های پردازش شده پس از طبقه بندی و آنالیز به دانش سازمان ( Knowledge ) تبدیل می گردند.
در طول ده گذشته با پیشرفت روز افزون کاربرد پایگاه دادهها، حجم دادههای ثبت شده به طور متوسط هر ۵ سال ۲ برابر می شود. در این میان سازمان هایی موفقند که بتوانند حداقل ۷% داده هایشان را تحلیل کنند. تحقیقات انجام شده نشان داده است که سازمان ها کمتر از یک درصد داده هایشان را برای تحلیل استفاده می کنند. به عبارت دیگر در حالی که غرق در داده ها هستند تشنه دانش می باشند.
در دنیای بشدت رقابتی امروز، اطلاعات به عنوان یکی از فاکتورهای تولیدی مهم پدیدار شده هست. در نتیجه تلاش برای استخراج اطلاعات از دادهها توجه بسیاری از افراد دخیل در سنت اطلاعات و حوضه های وابسته را به خود جلب نموده است.
حجم بالای داده های دائماً در حل رشد در همه حوضه ها و نیز تنوع آنها به شکل داده متنی، عدد،گرافیک ها، نقشه ها، عکس ها،تصویر ماهوارهای و عکس های گرفته شده با اشعه ایکس نمایان گر پیچیدگی کار تبدیل دادهها به اطلاعات است. علاوه بر این، تفاوت وسیع در فرایندهای تولید داده مثل روش آنالوگ مبتنی بر کاغذ و روش دیجیتالی مبتنی بر کامپیوتر، مزید بر علت شده است. استراتژی ها و فنون متعددی برای گرد آوری، ذخیره، سازماندهی و مدیریت کارامد داده های موجود و رسیدن به نتایج معنی در به کار گرفته شده اند.
امروزه با حجم عظیمی از داده ها رو به رو هستیم، برای استفاده از آنها به ابزارهای کشف دانش نیاز داریم. داده کاوی به عنوان یک توانایی پیشرفت در تحلیل داده و کشف دانش مورد استفاده قرار می گیرد.
داده کاوی یا کشف دانش در پایگاه داده ها ( KDD )، علم نسبتا تازه ای است که با پیشرفت کشور در زمینه IT و نگاه های ویژه به دولت الکترونیک و نفوذ استفاده از سیستمهای رایانهای در سنت و ایجاد بانکهای اطلاعاتی بزرگ توسط ادارات دولتی، بانکها و بخش خصوصی نیاز به استفاده از آنها به طور عمیقی احساس میشود.
بنا بر علم دانشگاه MIT دانش نوین داده کاوی ( Data Mining ) یکی از ده دانش در حال توسعه ای است که دهه ی آینده را با انقلاب تکنولوژیکی مواجه می سازد. این تکنولوژی امروز دارای کاربرد بسیار وسیع در حوضه های مختلف است. به گونه که امروزحد و مرزی برای کاربرد این دانش در نظر نگرفته و زمینههای کاری این دانش را از ذرات کف اقیانوس تا اعماق فضا می دانند.
اغلب تجارتها به تصمیم گیری های استراتژیک و یا اتخاذ خط مشی های جدید برای خدمت رسانی بهتر به مشتریان نیاز دارند.
انگیزه برای گسترش داده کاوی به طور عمده از دنیای تجارت در ده ی ۱۹۹۰ پدید آمد.
عبارت داده کاوی شباهت به استخراج ذغال سنگ و طلا دارد. داده کاوی نیز اطلاعات را که در انبار های داده مدفون شده است، استخراج میکند.
داده کاوی با پردازش جامع داده و انجام فرایند تصمیم سازی از طریق استخراج دانش با ارزش از داده، تصمیم گیری را برای مدیران سازمان تسهیل می نماید.
داده کاوی شناسایی الگو های صحیح، بدیع، سودمند و قابل درک از دادههای موجود در یک پایگاه داده است که با استفاده از پردازش های معمولی قابل دستیابی نیستند.
داده کاوی مجموعه ای از فنون است که به شخص امکان می دهد تا برای داده پردازی معمولی حرکت کند و به استخراجِ اطلاعاتی که در انبوه دادهها مخفی یا پنهان است کمک میکند.
در واقع هدف از داده کاوی ایجاد مدل هایی برای تصمیم گیری است. این مدلها رفتارهای آینده را بر اساس تحلیلهای گذشته پیش بینی میکند.
به کار بردن داده کاوی به عنوان اهرمی برای آماده سازی داده ها بهترین موقعیت را برای بدست آوردن برتری های رقابتی ایجاد میکند.
داده کاوی یعنی کشف دانش و اطلاعات معتبر پنهان در پایگاههای داده. یا به بیان بهتر تجزیه و تحلیل ماشینی داده ها. برای پیدا کردن الگوهای مفید و تازه و قابل استناد در پایگاه دادههای بزرگ داده کاوی نامیده می شود.
داده کاوی در پایگاه دادههای کوچک نیز بسیار پر کاربرد است و از نتایج و الگوهای تولید شده به وسیله آن در تصمیم گیری های استراتژیک تجاری شرکت های کوچک نیز میتوان بهره ای فراوان برد.
داده کاوی پل ارتباطی میان علم امر، علم کامپیوتر، هوش مصنوعی، الگو شناسی، فراگیری ماشین و بازنمایی بصری داده میباشد. داده کاوی فرآیندی پیچیده جهت شناسایی الگو ها و مدل های صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده میباشد. به طریقی که این الگو ها و مدل ها برای انسان ها قابل درک باشند. داده کاوی به صورت یک محصول قابل خریداری نمی باشد، بلکه یک رشته ی علمی و فرایندی است که بایستی به سوری یک پروژه پیاده سازی شود. کاربرد داده کاوی در یک جمله را این گونه میتوان بیان کرد : “ داده کاوی اطلاعاتی می دهد که شما برای گرفتن تصمیم هوشمندانه ای در برابر مشکلات سخت شغلتان به آن نیاز دارید. “
اصولا هر جایی که داده وجود داشته باشد داده کاوی نیز معنی مییابد، از قبیل امور تجاری و ملی، امور پزشکی، زیست پزشکی، تجزیه و تحلیلهای مربوط به DNA ، کشف ناهنجاری ها و اسناد جعلی، ارتباطات از راه دور، ورزش و سرگرمی، کتابداری و اطلاع رسانی و …