Data mining( داده,, کاوی,) و Data Warehousing هردو از تکنیک های بسیار قدرتمند و مشهور آنالیز داده,, محسوب می شوند. کاربرانی که به آمارها علاقه دارند از data
mining استفاده می کنند.
در data mining تلاش بر این است که با استفاده از مدل های آماری
بتوان الگوهای مخفی در داده,, ها را پیدا کرد. کسانی که عمل data
mining انجام می دهند به
دنبال یافتن ارتباطات مفید بین عناصر داده,, ای م تفاوت, می باشند. یافتن این ارتباطات
در دنیای امروزه و برای تجارت ها بسیار ارزشمند است. اما از طرف دیگر کارشناسان داده,, ای که ابعاد مختلف یک کسب و کار را به طور مستقیم بررسی می کنند علاقه دارند
که از data warehousها استفاده نمایند.
تعریف Data Mining
Data mining همچنین با نام کشف دانش(KDD) نیز شناخته می
شود. همانطور که گفتیم data mining یکی از فیلد های علوم کامپیوتر است که به استخراج
اطلاعات مفید از داده,, های خام می پردازد. این اطلاعات مفید قبل از این که عمل data mining انجام
شود ناشناخته باقی می ماند. با توجه به این که امروزه حجم داده ها به صورت تصاعدی
رشد می کند، data mining می تواند یک ابزار بسیار مفید برای تبدیل این
انبوه داده ها به اطلاعات هوش تجاری و سایر اطلاعات مفید باشد. این درحالی است که
استخراج دستی دانش مفید و الگوهای مخفی بین داده ها در چند دهه اخیر تا حدودی غیر
ممکن محسوب می شد. از این تکنیک امروزه برای آنالیز شبکه های اجتماعی، تشخیص
کلاهبرداری و بازاریابی و بسیاری از جاهای دیگر مورد استفاده قرار می گیرد. معمولا data mining از
چهار عمل تشکیل شده است.
- Clustering
- Classification
- Regression
- Association
Clustering به تشخیص داده
های شبیه به هم و گروه بندی آنها گفته می شود. به این شکل که از داده هایی که
ساختاری ندارند گروه هایی تشکیل می شوند که هر کدام از اعضای این گروه ها با سایر
اعضای گروه ارتباط دارند. Classification به عمل پیدا کردن قوانینی که می توان بر داده های
جدید اعمال نمود، گفته می شود. classification شامل این مراحل است: پیش پردازش داده ها، طراحی
مدل ها، ارزیابی و اعتبارسنجی ویژگی ها. Regression به پیدا کردن توابعی با کمترین مقدار خطا را برای
این که مدل داده ها را تولید کنیم می گویند. Association جستجوی ارتباط بین متغیرها را گویند. Data mining اغلب
به سوالاتی مانند این سوال پاسخ می دهد که در سال آینده کدام محصول فروش بیشتری در
یک فروشگاه خواهد داشت؟
تعریف Data Warehousing
همانطور که گفته شد Data
warehousing نیز برای آنالیز
داده ها استفاده می شود ولی کاربران و اهداف م تفاوت,ی دارد. برای مثال اگر بخواهیم
فروشندگی را مثال بزنیم کاربران Data warehousing بر روی این نکته که کدام یک از خریدها بین
کاربران مشهور تر است. بنابراین نتیجه این آنالیز به کاربر امکان را می دهد که با
استفاده از تجربیات مشتریان بتوان تصمیم بهتری بگیرد. اما کسانی که عمل data mining انجام
می دهند ابتدا یک فرضیه را ارائه می کنند که مثلا مشتریان یک جنس خاص را می خرند و
داده ها را برای تست کردن فرضیه خود مورد استفاده قرار می دهند که آیا فرضیه شان
درست بوده و یا خیر. بنابراین می توان نتیجه گرفت که این دو نوع آنالیز به نظر
مشابه می آید ولی این گونه نیست. هردوی این آنالیز ها به افزایش سود با استفاده از
تاریخچه داده ها می پردازند. اما تفاوت, های کلیدی دارند. به زبان ساده data mining و data warehousing هرکدام
نوع خاصی از آنالیز و بررسی را انجام می دهند. که کاربر هرکدام از این آنالیزها
جدا می باشد. به عبارت دیگر data mining به دنبال وابستگی ها و الگوهایی آماری می گردد که
بتواند با استفاده از آن یک فرضیه ارائه دهد و با استفاده از داده ها آن فرضیه را
تست کند. اما data warehousing سوالات گسترده مقایسه ای را پاسخ می دهد و داده
ها را تجزیه می کندتا بتواند راههای بهبود آنها را در آینده تشخیص دهد.
نویسنده: مهدی
عادلی فر
منبع: انجمن
تخصصی فناوری اطلاعات ایران