مقالة عن تنقيب البيانات
مراحل التنقيب في البيانات
- فهم طبيعة الأعمال
- فهم البيانات
- تهيئة البيانات
- صياغة نماذج الحل وثبوتها
- التقييم وتعليل نتائج النماذج
- نشر وتوزيع النموذج
الخطوات الضرورية لفهم البيانات
- تجميع البيانات
- توصيف البيانات
- جودة البيانات وتحقيقها
- التحليل الاسترشادي للبيانات
خطوات تهيئة البيانات
- اختيار المتغيرات المتوقعة
- صياغة المتغيرات وتحويلها
- تكامل البيانات
- تصميم وتنسيق البيانات
مجالات تطبيق تنقيب البيانات في منظمات الأعمال
- التسويق
- التجزئة
- البنوك
- التأمين
- الاتصالات
- إدارة العمليات
مفهوم مخازن البيانات
هي أنظمة تستعمل تقنيات جديدة لتحديد كميات كبيرة من المعلومات غير المتشابهة بهدف استخدامها في سرعة اتخاذ القرار، وتسمى أنظمة تقريرية.
شرح مفهوم مستودعات البيانات
هي مكان للبيانات الثانوية المنظمة من التطبيقات الأخرى أو من مصادر خارجية، يتم فيها تخزين استفسارات قواعد البيانات المثلى وأدوات التقارير بسبب قدرتها على تحليل البيانات.
خصائص مستودع البيانات
- عبارة عن قواعد بيانات
- تسمح بتكامل نظام التطبيقات المتنوع
- تدعم معالجة المعلومات
مستودعات البيانات النموذجية
- خسارة كبيرة
- تتضمن عدد كبير من البيانات العاطلة
- تتضمن البيانات التي لا تتطاير
كيفية صناعة مخازن البيانات
- توحيد البيانات الواردة من مصادر متنوعة
- توزيع البيانات بحسب المواضيع والاهتمام
- الاهتمام بالبعد الزمني
- حفظ كامل البيانات من الأقدم حتى الأحدث
مفهوم المعالجة التحليلية المباشرة
هي الواجهة النهائية لمستودع البيانات وتستخدم البيانات في أشكال متعددة الأبعاد.
مفهوم المعرفة في قواعد البيانات
يشير إلى استخراج المفاهيم الضمنية غير الاعتيادية والتي لم تكن معروفة سابقاً.
مراحل استخراج البيانات
- تنقية البيانات
- توحيد البيانات
- اختيار البيانات
- نقل البيانات
- استخراج البيانات
- تقييم النموذج
- تمثيل المعرفة
الفرق بين قواعد البيانات ومستودعات البيانات
تم تصميم قواعد البيانات لمعالجة المعاملات وتخزين البيانات المهيكلة، بينما تركز مستودعات البيانات على تجميع البيانات وتحليلها لأغراض استخبارات الأعمال.
الاستخدامات الأساسية لقاعدة البيانات
- إدارة بيانات المنظمة
- معالجة المعاملات
- ضمان سلامة البيانات
أساليب استخراج البيانات الرئيسية
- قاعدة الارتباط
- العنقدة
- التصنيف
- التحليل التسلسلي
برامج التنقيب في البيانات
- SIPINA
- Tanagra
- Orange
- IP Project
- Weka
- SAS Enterprise Miner
- Oracle Data Mining
- XL Miner