داده کاوی (data mining)
به فرایند استخراج و کشف همبستگیها و الگوهای مفید از میان حجم زیادی از دادههای خام که با استفاده از الگوریتم و سازوکارهای هوشمند انجام میگیرد دیتاماینینگ یا داده کاوی میگویند، به زبان سادهتر، استخراج دانش از میان مجموعهای از دادهها را دادهکاوی مینامند.
یک مثال عملی و جالب از فرایند دادهکاوی!
اگر از سایت اشتراک ویدئوی یوتیوب استفاده کرده باشید حتما میدانید که قبل از نمایش ویدئوی اصلی یک تبلیغ چند ثانیهای به شما نمایش داده میشود، اما آیا تا به حال به محتوای این تبلیغ دقت کردهاید؟ میدانستید اگر وارد حساب کاربری گوگل خود شده باشید، بهطور صد درصد یک تبلیغ مرتبط با علاقهی خود را مشاهده خواهید کرد؟!
کاربردهای اصلی داده کاوی
همانطور که گفتیم، دادهکاوی یعنی استخراج اطلاعات مفید از مجموعهی دادههای خام و نامفهوم که این اطلاعات شامل اجزای مختلفی هستند، از جمله کاربردهای دیگر دادهکاوی عبارتند از:
- کشف الگوی میان دادهها
- پیشبینی حدودی نتایج
- بهدست آوردن اطلاعات کاربردی
- تمرکز بر روی دادههای بزرگ
فرایند انجام Data Mining
همانگونه که در نمودار پایین مشاهده میکنید، داده کاوی به صورت کلی و عمومی در ۶ مرحلهی اصلی انجام میشود، در ابتدا دادههای مورد نیاز (دادههای هدف) جمعآوری میشوند و مورد پردازش و پاکسازی قرار میگیرند، یعنی دادههای اضافه حذف شده و تنها دادههای مورد نیاز وارد سیستم میشوند.
در مرحلهی بعد الگوی میان دادهها کشف و ارزیابی و سپس الگوریتم و متدهای Data Mining بر روی دادهها انجام خواهد شد.
در نهایت نیز اطلاعات به دست آمده از فرایند داده کاوی در قالب فرمتهای قابل درک برای انسان مانند نمودار، تصویر، گزارش و… ارائه شده و دانش مورد نظر که از میان انبوه دادههای خام استخراج شدهاست در اختیار سازمان قرار خواهد گرفت.