داده کاوی (data mining)

داده کاوی (data mining)

 

به فرایند استخراج و کشف همبستگی‌ها و الگوهای مفید از میان حجم زیادی از داده‌های خام که با استفاده از الگوریتم و سازوکارهای هوشمند انجام می‌گیرد دیتاماینینگ یا داده کاوی می‌گویند، به زبان ساده‌تر، استخراج دانش از میان‌ مجموعه‌ای از داده‌ها را داده‌کاوی می‌نامند.

 

یک مثال عملی و جالب از فرایند داده‌کاوی!

 

اگر از سایت اشتراک ویدئوی یوتیوب استفاده کرده باشید حتما می‌دانید که قبل از نمایش ویدئوی اصلی یک تبلیغ چند ثانیه‌ای به شما نمایش داده می‌شود، اما آیا تا به حال به محتوای این تبلیغ دقت کرده‌اید؟ می‌دانستید اگر وارد حساب کاربری گوگل خود شده باشید، به‌طور صد درصد یک تبلیغ مرتبط با علاقه‌ی خود را مشاهده خواهید کرد؟!

 

کاربردهای اصلی داده کاوی

 

همانطور که گفتیم، داده‌کاوی یعنی استخراج اطلاعات مفید از مجموعه‌ی داده‌های خام و نامفهوم که این اطلاعات شامل اجزای مختلفی هستند، از جمله کاربردهای دیگر داده‌کاوی عبارتند از:

  • کشف الگوی میان داده‌ها
  • پیش‌بینی حدودی نتایج
  • به‌دست آوردن اطلاعات کاربردی
  • تمرکز بر روی داده‌های بزرگ

 

فرایند انجام Data Mining   

همانگونه که در نمودار پایین مشاهده می‌کنید، داده ‌کاوی به صورت کلی و عمومی در ۶ مرحله‌ی اصلی انجام می‌شود، در ابتدا داده‌های مورد نیاز (داده‌های هدف) جمع‌آوری می‌شوند و مورد پردازش و پاکسازی قرار می‌گیرند، یعنی داده‌های اضافه حذف شده و تنها داده‌های مورد نیاز وارد سیستم می‌شوند.

در مرحله‌ی بعد الگوی میان داده‌ها کشف و ارزیابی و سپس الگوریتم و متد‌های Data Mining بر روی داده‌ها انجام خواهد شد.

در نهایت نیز اطلاعات به‌ دست آمده از فرایند داده‌ کاوی در قالب فرمت‌های قابل درک برای انسان مانند نمودار، تصویر، گزارش و… ارائه شده و دانش مورد نظر که از میان انبوه داده‌های خام استخراج شده‌است در اختیار سازمان قرار خواهد گرفت.