تحقیق مقاله مقدمه¬ای بر داده کاوی

تعداد صفحات: 38 فرمت فایل: word کد فایل: 8985
سال: مشخص نشده مقطع: مشخص نشده دسته بندی: مهندسی فناوری اطلاعات IT
قیمت قدیم:۲۳,۰۰۰ تومان
قیمت: ۱۷,۸۰۰ تومان
دانلود فایل
  • خلاصه
  • فهرست و منابع
  • خلاصه تحقیق مقاله مقدمه¬ای بر داده کاوی

     مقدمه ای بر داده‌کاوی[1]

    در دو دهه قبل توانایی های فنی بشر در برای تولید و جمع آوری داده‌ها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب و کار، علوم، خدمات دولتی و پیشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره ای، در این تغییرات نقش مهمی دارند [‎1].

    بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات می‌کند. این رشد انفجاری در داده‌های ذخیره شده، نیاز مبرم وجود تکنولوژی های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند: داده کاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی داده کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می کنند، که این دانش به صورت ضمنی در پایگاه داده های عظیم، انباره داده[2] و دیگر مخازن بزرگ اطلاعات، ذخیره شده است. داده کاوی بطور همزمان از چندین رشته علمی بهره می برد نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه های عصبی، آمار، شناسایی الگو، سیستم های مبتنی بر دانش[3]، حصول دانش[4]، بازیابی اطلاعات[5]، محاسبات سرعت بالا[6] و بازنمایی بصری داده[7] . داده کاوی در اواخر دهه 1980 پدیدار گشته، در دهه 1990 گامهای بلندی در این شاخه از علم برداشته شده و انتظار می رود در این قرن به رشد و پیشرفت خود ادامه دهد [‎2].

    واژه های «داده کاوی» و «کشف دانش در پایگاه داده»[8] اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان یک فرآیند در شکل1-1 نشان داده شده است.

    (نمودار و تصاویر در فایل اصلی مجود است)

     کشف دانش در پایگاه داده فرایند شناسایی درست، ساده، مفید، و نهایتا الگوها و مدلهای قابل فهم در داده ها می باشد. داده کاوی، مرحله ای از فرایند کشف دانش می باشد و شامل الگوریتمهای مخصوص داده کاوی است، بطوریکه، تحت محدودیتهای مؤثر محاسباتی قابل قبول، الگوها و یا مدلها را در داده کشف می کند [‎1]. به بیان ساده تر، داده کاوی به فرایند استخراج دانش ناشناخته، درست، و بالقوه مفید از داده اطلاق می شود. تعریف دیگر اینست که، داده کاوی گونه ای از تکنیکها برای شناسایی اطلاعات و یا دانش تصمیم گیری از قطعات داده می باشد، به نحوی که با استخراج آنها، در حوزه های تصمیم گیری، پیش بینی، پیشگویی، و تخمین مورد استفاده قرار گیرند. داده ها اغلب حجیم ، اما بدون ارزش می باشند، داده به تنهایی قابل استفاده نیست، بلکه دانش نهفته در داده ها قابل استفاده می باشد. به این دلیل اغلب به داده کاوی، تحلیل داده ای ثانویه[9] گفته می شود.

     

    1-1 چه چیزی سبب پیدایش داده کاوی شده است؟

    اصلی ترین دلیلی که باعث شد داده کاوی کانون توجهات در صنعت اطلاعات قرار بگیرد، مساله در دسترس بودن حجم وسیعی از داده ها و نیاز شدید به اینکه از این داده ها اطلاعات و دانش سودمند استخراج کنیم. اطلاعات و دانش بدست آمده در کاربردهای وسیعی از مدیریت کسب و کار وکنترل تولید و تحلیل بازار تا طراحی مهندسی و تحقیقات علمی مورد استفاده قرار می گیرد.

    داده کاوی را می توان حاصل سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک سیر تکاملی در صنعت پایگاه داده می باشد، نظیر عملیات: جمع آوری داده ها وایجاد پایگاه داده، مدیریت داده و تحلیل و فهم داده ها. در شکل1-2 این روند تکاملی در پایگاه های داده نشان داده شده است ]‎3[.

     

    تکامل تکنولوژی پایگاه داده و استفاده فراوان آن در کاربردهای مختلف سبب جمع آوری حجم فراوانی داده شده است. این داده های فراوان باعث ایجاد نیاز برای ابزارهای قدرتمند برای تحلیل داده ها گشته، زیرا در حال حاضر به لحاظ داده ثروتمند هستیم ولی دچار کمبود اطلاعات می باشیم.

    ابزارهای داده کاوی داده ها را آنالیز می کنند و الگوهای دادهای را کشف می کنند که می توان از آن در کاربردهایی نظیر: تعیین استراتژی برای کسب و کار، پایگاه دانش[10] و تحقیقات علمی و پزشکی، استفاده کرد. شکاف موجود بین داده ها و اطلاعات سبب ایجاد نیاز برای ابزارهای داده کاوی شده است تا داده های بی ارزش را به دانشی ارزشمند تبدیل کنیم [‎2].

     

    به طور ساده داده کاوی به معنای استخراج یا «معدن کاری[11]» دانش از مقدار زیادی داده خام است. البته این نامگذاری برای این فرآیند تا حدی نامناسب است، زیرا به طور مثال عملیات معدن کاری برای استخراج طلا از صخره و ماسه را طلا کاوی می نامیم، نه ماسه کاوی یا صخره کاوی، بنابراین بهتر بود به این فرآیند نامی شبیه به «استخراج دانش از داده» می دادیم که متاسفانه بسیار طولانی است. «دانش کاوی» به عنوان یک عبارت کوتاهتر به عنوان جایگزین، نمی تواند بیانگر تاکید و اهمیت بر معدن کاری مقدار زیاد داده باشد. معدن کاری عبارتی است که بلافاصله انسان را به یاد فرآیندی می اندازد که به دنبال یافتن مجموعه کوچکی از قطعات ارزشمند از حجم بسیار زیادی از مواد خام هستیم ]‎2].

     

    با توجه به مطالب عنوان شده، با اینکه این فرآیند تا حدی دارای نامگذاری ناقص است ولی این نامگذاری یعنی داده کاوی بسیار عمومیت پیدا کرده است. البته اسامی دیگری نیز برای این فرآیند پیشنهاد شده که بعضا بسیاری متفاوت با واژه داده کاوی است، نظیر: استخراج دانش از پایگاه داده، استخراج دانش[12] ، آنالیز داده / الگو، باستان شناسی داده[13]، و لایروبی داده ها[14].

     

    1-2 مراحل کشف دانش

    کشف دانش دارای مراحل تکراری زیر است:

    1- پاکسازی داده ها[15] (از بین بردن نویز و ناسازگاری داده ها).

    2- یکپارچه سازی داده ها[16] (چندین منبع داده ترکیب می شوند).

    3- انتخاب داده ها[17] (داده های مرتبط با آنالیزازپایگاه داده بازیابی می شوند).

    4- تبدیل کردن داده ها[18] (تبدیل داده ها به فرمی که مناسب برای داده کاوی باشد مثل خلاصه سازی[19] و همسان سازی[20]

    5-داده کاوی (فرایند اصلی که روالهای هوشمند برای استخراج الگوها از داده ها به کار گرفته می شوند.)

    6-ارزیابی الگو[21] (برای مشخص کردن الگوهای صحیح و مورد نظربه وسیله معیارهای اندازه گیری)

    7-ارائه دانش[22] (یعنی نمایش بصری، تکنیکهای بازنمایی دانش برای ارائه دانش کشف شده به کاربر استفاده می شود)]1[ .

     

     

    (نمودار و تصاویر در فایل اصلی مجود است)

    هر مرحله داده کاوی باید با کاربر یا پایگاه دانش تعامل داشته باشد. الگوهای کشف شده به کاربر ارائه می شوند و در صورت خواست او به عنوان دانش به پایگاه دانش اضافه می شوند. توجه شود که بر طبق این دیدگاه داده کاوی تنها یک مرحله از کل فرآیند است، البته به عنوان یک مرحله اساسی که الگوهای مخفی را آشکار می سازد. با توجه به مطالب عنوان شده، دراینجا تعریفی از داده کاوی ارائه می دهیم:

    "داده کاوی عبارتست از فرآیند یافتن دانش از مقادیر عظیم داده های ذخیره شده در پایگاه داده، انباره داده ویا دیگر مخازن اطلاعات"  [‎3].

    بر اساس این دیدگاه یک سیستم داده کاوی به طور نمونه دارای اجزاء اصلی زیر است که شکل1-3 بیانگر معماری سیستم است.

     

    (نمودار و تصاویر در فایل اصلی مجود است)

    1- پایگاه داده، انباره داده یا دیگر مخازن اطلاعات: که از مجموعه ای از پایگاه داده ها، انباره داده، صفحه گسترده[23]، یا دیگر انواع مخازن اطلاعات. پاکسازی داده ها و تکنیکهای یکپارچه سازی روی این داده ها انجام می شود.

    2- سرویس دهنده پایگاه داده یا انباره داده: که مسئول بازیابی داده های مرتبط بر اساس نوع درخواست داده کاوی کاربر می باشد.

    3- پایگاه دانش: این پایگاه از دانش زمینه[24] تشکیل شده تا به جستجو کمک کند، یا برای ارزیابی الگوهای یافته شده از آن استفاده می شود.

    4- موتور داده کاوی[25] : این موتور جزء اصلی از سیستم داده کاوی است و به طور ایدآل شامل مجموعه ای از پیمانه[26] هایی نظیر توصیف[27]، تداعی[28]، کلاسبندی[29]، آنالیزخوشه ها[30]، و آنالیز تکامل وانحراف[31]، است.

    5- پیمانه ارزیابی الگو[32] : این جزء معیارهای جذابیت[33] را به کار می بندد و با پیمانهء داده کاوی تعامل می کند بدینصورت که تمرکز آن بر جستجو بین الگوهای جذاب می باشد، و از یک حد آستانه جذابیت استفاده می کند تا الگوهای کشف شده را ارزیابی کند.

    6- واسط کاربرگرافیکی[34] : این پیمانه بین کاربر و سیستم داده کاوی ارتباط برقرار می کند، به کاربر اجازه می دهد تا با سیستم داده کاوی از طریق پرس وجو[35] ارتباط برقرار کند، این جزء به کاربر اجازه می دهد تا شمای پایگاه داده یا انباره داده را مرور کرده، الگوهای یافته شده را ارزیابی کرده و الگوها را در فرمهای بصری گوناگون بازنمایی کند.

    با انجام فرآیند داده کاوی، دانش، ارتباط یا اطلاعات سطح بالا از پایگاه داده استخراج می شود و قابل مرور از دیدگاههای مختلف خواهد بود. دانش کشف شده در سیستم های تصمیم یار، کنترل فرآیند، مدیریت اطلاعات و پردازش پرس وجو[36] قابل استفاده خواهد بود [‎2].

  • فهرست و منابع تحقیق مقاله مقدمه¬ای بر داده کاوی

    فهرست:

    1 مقدمه ای بر داده‌کاوی... 3

    1-1 چه چیزی سبب پیدایش داده کاوی شده است؟. 4

    1-2 مراحل کشف دانش.... 6

    1-3 جایگاه داده کاوی در میان علوم مختلف... 11

    1-4 داده کاوی چه کارهایی نمی تواند انجام دهد؟. 12

    1-5 داده کاوی و انبار داده  ها  13

    1-6 داده کاوی و OLAP. 14

    1-7 کاربرد یادگیری ماشین و آمار در داده کاوی... 15

    2- توصیف داده ها در داده کاوی... 15

    2-1 خلاصه سازی و به تصویر در آوردن داده ها 15

    2-2 خوشه بندی 16

    2-3 تحلیل لینک... 16

    3- مدل های پیش بینی داده ها 17

    3-1 Classification. 17

    3-2 Regression. 17

    3-3 Time series. 18

    4 مدل ها و الگوریتم های داده کاوی... 18

    4-1 شبکه های عصبی 18

    4-2 Decision trees. 22

    4-3 Multivariate Adaptive Regression Splines(MARS). 24

    4-4 Rule induction. 25

    4-5 K-nearest neibour and memory-based reansoning(MBR). 26

    4-6 رگرسیون منطقی... 27

    4-7 تحلیل تفکیکی 27

    4-8 مدل افزودنی کلی (GAM). 28

    4-9 Boosting. 28

    5 سلسله مراتب انتخابها 29

     

     

    منبع:

     

    Two Crows Corporation,Introduction to Data Mining and Knowledge Discovery,1999

    David Hand, Heikki Mannila , Padhraic Smyth. Principles of Data Mining. The MIT Press . 2001.

    J.Han, and M.Kamber, "Data Mining: Concepts and Techniques", San Diego Academic Press, 2001.

    4.   Usama Fayyad, Gregory Piatetsky-Shapiro, and Padhraic Smyth.From Data Mining to Knowledge Discovery in Databases.1996

تحقیق در مورد تحقیق مقاله مقدمه¬ای بر داده کاوی, مقاله در مورد تحقیق مقاله مقدمه¬ای بر داده کاوی, تحقیق دانشجویی در مورد تحقیق مقاله مقدمه¬ای بر داده کاوی, مقاله دانشجویی در مورد تحقیق مقاله مقدمه¬ای بر داده کاوی, تحقیق درباره تحقیق مقاله مقدمه¬ای بر داده کاوی, مقاله درباره تحقیق مقاله مقدمه¬ای بر داده کاوی, تحقیقات دانش آموزی در مورد تحقیق مقاله مقدمه¬ای بر داده کاوی, مقالات دانش آموزی در مورد تحقیق مقاله مقدمه¬ای بر داده کاوی, موضوع انشا در مورد تحقیق مقاله مقدمه¬ای بر داده کاوی
ثبت سفارش
عنوان محصول
قیمت