تاریخچه داده‌کاوی

داده‌کاوی فرایندی است که در آغاز دهه 90 پا به عرصه ظهور گذاشته است و با نگرشی نو به مسأله استخراج داده ها می پردازد. در سال 1989 و 1991 کارگاه‌های کشف دانش از پایگاه‌های داده توسط تتسکی و همکارانش برگزار گردید. اصطلاح داده‌کاوی برای اولین بار توسط فیاد در اولین کنفرانس بین المللی "کشف دانش و داده کاوی" در سال 1995 مطرح گردید. از سال 1995 داده کاوی به صورت جدی وارد مباحث آمار شد و در سال 1996 اولین مجله "کشف دانش از پایگاه داده ها" منتشر شد.

داده‌کاوی چیست؟

داده­ کاوی به بررسی و تجزیه و تحلیل مقادیر عظیمی از داده­ ها به منظور کشف الگوها و قوانین پنهان و معنی دار درون داده­ ها اطلاق می ­شود. بر اساس اعلام دانشگاهMIT امروزه مرز و محدودیتی برای دانش داده‌کاوی متصور نبوده و مرز آن را از اعماق اقیانوس­ ها تا بیکران فضا می­ دانند. به عبارت دیگر کاربرد دانش داده‌کاوی در تمامی حوزه­ های برخوردار از داده بوده و تنها محدودیت دانش داده­ کاوی نبود داده است.
در حقیقت هیچ کدام از الگوریتم­ های داده ­کاوی، در ابتدا با کاربردهای تجاری در ذهن به وجود نیامدند. داده­ کاوهای تجاری از یک سری تکنیک ­های وام گرفته شده از آمار و علوم کامپیوتر استفاده می­ کنند. انتخاب مجموعه­ ای از تکنیک­ ها برای به کارگیری در موقعیت خاص بستگی به سه عامل "ماهیت عمل داده­ کاوی"، "ماهیت داده­ های موجود" و "مهارت­ ها و ترجیحات داده­ کاوان" دارد.
داده­ کاوی عمدتاً با ساختن مدل­ ها مرتبط است. یک مدل اساساً به الگوریتم یا مجموعه­ ای از قوانینی گفته می­ شود که مجموعه­ ای از ورودی­ ها را (معمولاً به شکل زمینه­ هایی در پایگاه داده­ های سازمان) با هدف یا مقصد خاصی مرتبط می ­نماید. تکنیک­ های داده­ کاوی برای مدل­سازی هستند. یک مدل تحت شرایط درست می ­تواند منجر به بینش درست شود. به طور مثال از مدل ­ها برای ایجاد امتیازها استفاده می­ شود. امتیاز، نوعی بیان یافته­ های یک مدل به صورت عددی است. از امتیازها می­ توان برای تهیه فهرستی از مشتریان از محتمل­ ترین تا کم احتمال‌ترین فرد در پاسخ به تبلیغات یک محصول جدید و یا از محتمل­ ترین تا کم احتمال­ ترین فرد برای عدم باز پرداخت وام استفاده کرد.

کاربرد‌های داده‌کاوی

داده‌کاوی توسط سازمان‌های مختلف زیادی استفاده می‌شود که پایگاه داده فعالیت سازمان را پشتیبانی می کند. ابزارهای داده‌کاوی برای کمک به مدیریت کلیه مراحل ارتباط با مشتری شامل به دست آوردن مشتریان جدید افزایش سود از طریق مشتریان موجود و حفظ کردن مشتریان مفید هستند.
با تعیین مشخصات یک مشتری خوب یک شرکت می تواند با همان مشخصات اهداف آینده خویش را پیش بینی کند. می‌تواند مشتریانی که بیشترین احتمال برای پاسخ گویی و دریافت ارائه یک خدمت جدید را دارا هستند شناسایی نماید. با پرونده‌سازی برای مشتری که یک محصول خاص را خریداری می نمایند این شرکت می تواند توجه خود را به مشتریان مشابهی که از این محصول خرید نکرده اند معطوف دارد و یا با پرونده سازی برای مشتریانی که این سازمان را ترک کرده اند یک شرکت می تواند مشتریانی را که خطر رفتن آن ها نیز وجود دارد نگه دارد. چرا که نگهداری یک مشتری بسیار کم هزینه تر از به دست آوردن یک مشتری جدید هزینه می‌برد. خرده فروش ها از داده‌کاوی برای تصمیم در مورد اینکه کدام محصول در فروشگاه‌ها درآمد زاست به منظور دسترسی به ارتقای کیفیت کار خود استفاده بیشتری می‌نمایند.
شرکت‌های ارتباط از راه دور و کارت‌های اعتباری دو شاخه بزرگ در استفاده از داده‌کاوی برای تشخیص استفاده کلاه بردارانه از خدمات آن‌ها می‌باشد. شرکت‌های بیمه و درآمد هم علاقه‌مند به استفاده از این تکنولوژی برای کاهش کلاه‌برداری هستند. در صنعت بهداشت و درمان برای شناسایی پزشکانی که بیشترین احتمال برای تجویز یک داروی جدید را دارند. در کاربردهای دارویی نواحی مفید دیگری هستند که داده‌کاوی در آن‌ها دست دارد. داده‌کاوی می تواند برای تشخیص تأثیر اعمال جراحی، آزمایش‌های دارویی و درمان استفاده شود. شرکت‌های دارویی که در حال کاوش پایگاه‌های داده بزرگی از ترکیبات شیمیایی و مواد ژنتیکی برای کشف موادی که می توانند گزینه خوبی برای ساخت به عنوان دارو باشند. شرکت هایی که در خرید و فروش های مال فعالیت می کنند، از داده کاوی برای تعیین شاخصه‌های بازار و صنعت برای تشخیص کارایی درآمد استفاده می کنند. در صنعت تولید برای پیش‌بینی میزان خرابی یک فرآیند کلیدی استفاده می‌شود. هر چند، بخش‌های کلیدی وجود دارند که مفید بودن داده‌کاوی به طور خاص اثبات شده است. این بخش‌ها شامل مدیریت ارتباط با مشتری، بازاریابی هدفی مشخص، تجزیه و تحلیل طول عمر یک مشتری و ارزیابی ریسک اعتبار مشتری می‌شود، لیکن به این‌ها محدود نمی‌شود. برخی از کاربردهای داده‌کاوی در محیط‌های واقعی به صورت دسته‌بندی شده عبارتند از:
1- خرده‌فروشی (کاربرد کلاسیک داده‌کاوی)
تعیین الگوهای خرید مشتریان، تجزیه و تحلیل سبد خرید بازار، بخش‌بندی بازار و تقسیم‌بندی مشتریان، بازاریابی برای محصولات جدید، قیمت‌گذاری محصولات و خدمات جدید، تعیین و شناسایی بازار هدف، شناسایی نارضایتی‌های مشتریان، پیش‌بینی میزان خرید مشتریان از طریق پست (فروش الکترونیکی).
2- بانک‌داری
تشخیص مشتریان ثابت، تحلیل ریسک پرداخت وام، رتبه‌بندی اعتباری، کشف کلاهبرداری، کشف تراکنش های مشکوک مالی(پول‌شویی).
3- بیمه
پیش بینی میزان خرید بیمه نامه‌های جدید توسط مشتریان، تجزیه و تحلیل دعاوی، کشف کلاهبرداری.
4- مخابرات
شناسایی مشتریان خوش‌حساب و بد‌حساب، تحلیل ویژگی‌های مشترکین.
5- صنایع برق، آب و گاز
شناسایی الگوی رفتاری مشترکین، پیش بینی میزان مصرف.
6- پزشکی
کشف ارتباط بین علائم و بیماری، تحلیل نسخه‌های پزشکی، تحلیل‌های ژنتیکی، تحلیل اطلاعات زیستی، تعیین نوع رفتار با بیماران و پیش‌بینی میزان موفقیت اعمال جراحی، تعیین میزان موفقیت روش‌های درمانی در برخورد با بیماری‌های سخت.
7- پلیس
تشخیص جرائم، تحلیل ارتباط بین جرائم مختلف، شناسایی و دسته‌بندی ویژگی‌های مجرمین، تحلیل حوادث رانندگی.
8- حوادث طبیعی
پیش‌بینی سیل، پیش‌بینی زلزله

مزایای داده کاوی

بدون شک استفاده از ابزارهای داده‌کاوی دارای مزایایی می‌باشد که به شرح زیر است:
- استفاده از انواع مختلف داده‌ها (نه تنها عددی)
- ایجاد روابط به طور اتوماتیک
- عدم نیاز به داده‌های صحیح
- عدم نیاز به فرضیه
- بر نتابیدن فرض‌های ساده‌کننده مانند فرض استقلال با فرض وابستگی احتمالی همه پدیده‌ها
- دینامیک بودن
- دوری از اشکالات حاصل از نمونه‌گیری
- آنالیز داده‌های واقعی و نه توزیع داده‌ها
- ایجاد مدل‌های کاملا واقعی

مطالب مرتبط

مراحل داده کاوی

  • تهران
  • 09350579640-09124635768
  • 01152218786
  • این آدرس ایمیل توسط spambots حفاظت می شود. برای دیدن شما نیاز به جاوا اسکریپت دارید

فعالیت های اخیر

ارسال پیام

  Mail is not sent.   Your email has been sent.
Top