+ All Categories
Home > Documents > ةفرعلما جارختساو -...

ةفرعلما جارختساو -...

Date post: 03-Sep-2019
Category:
Upload: others
View: 6 times
Download: 0 times
Share this document with a friend
15
Transcript
Page 1: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا
Page 2: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

واستخراج املعرفة Data miningالتنقيب في البيانات

. وإال ما الذي يجعلها أحد املوضوعات هو من املوضوعات بالغة ألاهمية Data miningمن املؤكد أن التنقيب في البيانات

في العالم سيعرفون أنه بتاريخ Obamaألاكثر أهمية لرئيس الواليات املتحدة أوباما ؟ فاملتتبعون لنشاط رئيس الدولة ألاكثر تحكما

من Eric Schmidtو Appleمن شركة أبل Tim Cookلقاء مع قيادات تقنية املعلومات والذين كان منهم ، كان في 3172ديسمبر 71

، !Twitter ،Microsoft ،Facebook ،Salesforce ،Netflix ،Etsy ،Dropbox ،Yahooجوجل وكذلك املدراء التنفيذيين لكل من

Zynga ،Sherpa Global ،Comcast ،LinkedInيناير 71. كما أنه في خطاب له بتاريخ شة موضوع التنقيب في البياناتناق!!! وذلك مل

ذلك يؤكد الاهتمام الذي عاود من جديد طرح املوضوع من خالل الدعوة إلى إجراء إصالحات في نظام التنقيب عن البيانات. 3172

يتم إيالءه ملوضوع التنقيب في البيانات على املستوي الدولي والعالمي.

التنقيب عن البيانات ماذا يعني

الانتشار الواسع لتقنية املعلومات وسهولة إتاحتها إلى تضخم حجم املعلومات بصورة استباقية لم يشهدها التاريخ من ىأد

للجدل، من حيث جدوى وجودها بهذه الصورة العشوائية. وعندما قبل، مما جعل من قضية البيانات الضخمة على إلانترنت مثارا

تعددة ألانواع واملصادر بججم يصل إلى املالبيانات الضخمة، فإننا نتحدث عن كميات ال يمكن تخيلها من البيانات نتحدث عن

3.1تتحدث عن IBMصفر(. كما أن شركة 71املئات من التيرابايت أو حتى البيتابايت )البيتابايت هو الرقم واحد متبوعا بـ

ى.ومات في كل مكان وفي موضوعات شت صفرا(. معل 71وينتيليون هو الرقم واحد متبوعا بـ كوينتيليون بايت من البيانات كل يوم )الك

وهنا نتساءل ما أهمية هذه البيانات في ظل وجود حقيقة تشير إلى أن املعلومات املنظمة من هذه البيانات ال تشكل إال جزء ضئيال

71يصل إلى إلى ازدياد الحاجة إلى تطوير أدوات تمتاز بالقوة لتحليل ىل الباقي. ذلك أد مة والتي تشك% مقارنه باملعلومات غير املنظ

البيانات واستخراج املعلومات واملعارف منها، فاألساليب التقليدية وإلاحصائية ال تستطيع أن تتعامل مع هذا الكم الهائل لذا

تستخدم أدوات ذكية ملعالجة هذه البيانات.

كتقنية تهدف إلى استنتاج املعرفة من كميات هائلة من البيانات، Data Miningخراج البيانات ى باستمن هنا ظهر ما يسم

تعتمد على الخوارزميات الرياضية والتي تعتبر أساس التنقيب عن البيانات وهي مستمدة من العديد من العلوم مثل علم إلاحصاء

،وعلم آلالة. وغيرها من العلوم م الخبيرة، وعلم التعرف على ألانماطوالرياضيات واملنطق وعلم التعلم، والذكاء الاصطناعي والنظ

التي تعتبر من العلوم الذكية وغير التقليدية.

( في أواخر الثمانيات وأثبت وجوده كأحد الحلول الناجحة لتحليل كميات ضخمة Data miningظهر التنقيب في البيانات )

مة يمكن استغاللها و الاستفادة من البيانات، وذلك بتحويلها من مجرد معلوم ات متراكمة وغير مفهومة )بيانات( إلى معلومات قي

منها بعد ذلك.

العقد املاض ي، في محاولة ىهتمام في ألاوساط البحثية على مدوقد اجتذبت مرحلة التنقيب في البيانات الكثير من الا

لتطوير خوارزميات قابلة للتوسع والتكيف مع كميات متزايدة من البيانات في البحث عن أنماط معرفية ذات معنى. وقد نمت حزم

من الخوارزميات والبرمجيات و بشكل كبير خالل العقد املاض ي، إلى حد أن التوسع قد جعل من الصعب على العاملين في هذا

تبع التقنيات املتاحة لحل مهمة معينة.الحقل ت

Page 3: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

ولكن ما أذهلني عند البحث عن تعريفات ملفهوم التنقيب في املعلومات، الكم الهائل من التعريفات لهذا املفهوم. فموقع

ملفهوم التنقيب في البيانات. 13يقدم IGI Globalمؤسسة تعريفات بعد املرور على جميع هذه التعريفات، تم اختيار الو تعريفا

التالية:

،بين عناصر البيانات عملية البحث داخل كميات كبيرة من البيانات للكشف عن العالقات التي لم يتم كشفها سابقا

(.KDDواملعروفة أيضا باسم اكتشاف املعرفة في قواعد البيانات )

بهدف البحث عن أنماط معرفية هي النشاط الذي يقوم باستخراج املعلومات املتواجدة في كميات كبيرة من البيانات ،

واكتشاف الحقائق الخفية الواردة في قواعد البيانات.

هي عملية تحليل البيانات لتحديد العالقات التي لم تكتشفها التحليالت السابقة من قبل. كما أنها تحليل البيانات إلقامة

عالقات وتحديد أنماط.

باستخدام ألادوات التي تبحث عن الاتجاهات أو البيانات التي ال معنى لها، تحليل البيانات املتواجدة في قواعد البيانات

، ويمكن أن تكون مفيدة.واستخراج معلومات ضمنية، لم تكن معروفة سابقا

عملية استخراج أنماط معرفية من مجموعات البيانات الكبيرة من خالل الجمع بين ألاساليب من إلاحصاءات والذكاء

.رة قواعد البياناتالاصطناعي مع إدا

( هو خطوة واحدة في اكتشاف املعرفة داخل قواعد البياناتKDD حيث تستخدم أساليب التحليل مثل: الشبكات )

Decision Treesأو شبكة القرارات Genetic Algorithmsأو الخوارزميات الجينية Neural Networksالعصبية

لتحديد ألانماط والعالقات في مجموعات البيانات. Hybrid Modelsوالتقنية والنماذج الهجينة

م جمعها باستخدام عملية اكتشاف املعرفة في قواعد البيانات عن طريق تحديد ألانماط والاتجاهات في البيانات التي ت

أو العنقدة )التجميع( Sequential analysisأو التحليل التسلسلي Classification: التصنيف طرق مختلفة مثل

clustering أو قواعد الارتباطAssociation Rule.

عملية يتم من خاللها فرز كميات كبيرة من البيانات بهدف استخالص املعلومات ذات الصلة. ويستخدم هذا املصطلح

على نحو متزايد في العلوم الستخراج املعلومات من مجموعات البيانات الهائلة الناتجة عن الطرق التجريبية والرصدية

الحديثة، والسيما في سياق الحقول البيولوجية.

عملية الاختيار، والاستكشاف، ووضع نماذج لكميات كبيرة من البيانات الكتشاف الاطراد أو العالقات املجهولة بهدف

الحصول على نتائج واضحة ومفيدة ملالك قاعدة البيانات.

البيانات الكبيرة من خالل الجمع بين التحليل إلاحصائي فرع من علوم الكمبيوتر، يهتم باستخراج أنماط من مجموعات

والذكاء الاصطناعي مع إدارة قواعد البيانات. ويعتبر استخراج البيانات كأداة ذات أهمية متزايدة من قبل رجال ألاعمال

عة من ممارسات في مجموعة واس الحديثة لتحويل البيانات إلى معلومات إلعطاء ألاعمال ميزة إعالمية. ويستخدم حاليا

، مثل التسويق، واملراقبة، والكشف عن الغش، واختيار شريك تجاري.التنميط

ويستخدم عادة مع كمية هائلة ،لهامة من كمية هائلة من البياناتفرع مهم في الصناعة والسوق، واسترجاع املعلومات ا

من البيانات غير املتجانسة، حيث استخدام أجهزة الكمبيوتر أمر .ر منهال مف ا

ما يتم إلاشارة إلى التنقيب عن البيانات بصفة عامة إلى فكرة التحقيق بعمق في جبال من في اللغة الشائعة، غالبا

ما يستخدم القليل من التقنيات للقيام بالتحقيق. في املقابل، البيانات. هذا الاستخدام غير الرسمي لهذا املصطلح عادة

إلى استخدام التقنيات الحاسوبية للكشف عن أنماط في مجموعات فإن الاستخدام الرسمي لهذا املصطلح يشير تحديدا

Page 4: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

التحقق ومجموعات ،إلاحصائية إلى الذكاء الاصطناعي البيانات الضخمة. تتنوع هذه التقنيات ما بين ألاساليب

واستخراج البيانات، وهي متنوعة ومتزايدة أكثر من أي وقت مض ى.

عملية تقنية تستخدم خوارزميات لتحليل البيانات من وجهات نظر متعددة واستخراج أنماط ذات معنى والتي يمكن

يوص ي Amazon.comاستخدامها للتنبؤ بالسلوك املستقبلي للمستخدمين. نظام تحليل سلة السوق الذي يستخدمه

بمنتجات جديدة لعمالئها على أساس مشترياتهم املاضية، وهو مثال معروف على نطاق واسع للكيفية التي يمكن أن

تستخدم التنقيب عن البيانات في مجال التسويق.

في عملية اكتشاف الارتباطات ذات املغزى، وألانماط، والاتجاهات بالنخل من خالل كميات كبيرة من البيانات املخزنة

املستودعات، وذلك باستخدام تقنيات التعرف على ألانماط وكذلك ألاساليب إلاحصائية والرياضية.

اكتشاف املعرفة في قواعد البيانات هي أنماط معرفية مفهومة يتم استخراجها من مجموعات البيانات الكبيرة املخزنة في

.Data warehousesومستودعات البيانات الضخمة Databasesقواعد البيانات

كتب 3117في عامJiawei Han &Micheline Kamber عن التنقيب عن البيانات باعتبارها جزءا

من اكتشاف رئيسا

املعرفة. التنقيب عن البيانات هو كل ش يء مرتبط باستخراج املعرفة املفيدة من كميات كبيرة من البيانات. إنه العثور

نة )املعرفة( من قدر كبير من املواد الخام )البيانات(.على مجموعة صغيرة من الشذرات الثمي

في ألاوراق ألاكاديمية والبحثية للتنقيب عن البيانات، مثل هناك مصطلحات أخرى ذات الصلة التي تستخدم أيضا

في عالم كنريف البيانات، ولحالتنقيب عن املعرفة، واستخراج املعرفة، وأنماط تحليل البيانات، وعلم آثار البيانات وت

هو أكثر شعبية. «البيانات عن التنقيب»مصطلح ألاعمال عموما

التنقيب عن البيانات هو حقل متعدد التخصصات، يستفيد من املجاالت بما في ذلك تقنية قاعدة البيانات، الذكاء

القائمة على املعرفة، الاصطناعي، والتعلم آلالي، والشبكات العصبية، وإلاحصاءات والتعرف على ألانماط، والنظم

رات، وتحليل البيانات املكانية واكتساب املعرفة، واسترجاع املعلومات، والحوسبة عالية ألاداء والصورة ومعالجة إلاشا

(، والتي تعتمد بشكل كلي على إلادراك البصري.Data Visualizationوالبيانات التصورية )

مراحل اكتشاف املعرفة

ليس بالعملية السهلة والتي قد يعتقد Knowledge Discovery in Database (KDDد البيانات )اكتشاف املعرفة في قواع

. البعض أنها تتوقف عند تجميع البيانات وإدارتها، بل نراها تمتد إلى التحليل والتوقع والتنبؤ بما سيحدث مستقبال

Knowledge Discoveryمن اكتشاف املعرفة التنقيب في البيانات يشكل جزءا

.، وهذه العملية هي ألاكثر شموال

تتضمن عملية اكتشاف املعرفة الخطوات التالية:

وهي مرحلة جمع البيانات وتشمل كشف وتحديد وتوصيف البيانات املتاحة.:Data discoveryاكتشاف البيانات .1

التي ال أهمية لها، كما يتم Noiseويتم في هذه املرحلة إزالة البيانات املزعجة :Data cleaningتصفية البيانات وتنقيتها .3

حذف البيانات املتضاربة والبيانات الغير متناسقة.

يتم في هذه املرحلة تجميع البيانات املتشابهة وذات الصلة من مصادر البيانات :Data integrationتكامل البيانات .2

املتعددة ودمجها معا.

في هذه املرحلة، يتم تحديد واسترجاع البيانات املالئمة من مجموعة البيانات. :Data selectionر البيانات اختيا .2

في هذه املرحلة يتم تحويل البيانات إلى نماذج مخصصة مالئمة إلجراءات :Data transformationتحويل البيانات .1

ع.البحث والاسترجاع بواسطة خالصة إلانجاز أو عمليات التجمي

Page 5: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

أي استخدام طرق ذكية تطبق الستخالص أنماط البيانات استخراج نماذج :Data miningالتنقيب عن البيانات .6

مفيدة قدر إلامكان.

يتم في هذه املرحلة تحديد ألانماط املهمة حقا والتي تمثل قاعدة املعرفة :Pattern evaluationتقييم النمط .1

الستخدام بعض املقاييس املهمة.

وهي املرحلة ألاخيرة من مراحل اكتشاف املعرفة في قواعد :Knowledge presentationملعرفة وتقديمها تمثيل ا .1

البيانات وهي املرحلة التي يراها املستفيد، هذه املرحلة ألاساسية تستخدم ألاسلوب املرئي ملساعدة املستفيد في فهم و

وتفسير نتائج استخراج البيانات.

لبيانات هو خطوة أساسية لتطبيق أساليب ذكية بهدف الكشف عن أنماط البيانات املثيرة لالهتمام وبالتالي التنقيب في ا

أصبح «Data mining»د أن مصطلح التنقيب عن البيانات واملخبأة في مجموعات البيانات الكبيرة. ومع ذلك، في بعض املنظمات نج

برمتها. «Knowledge Discovery»أكثر شعبية لإلشارة إلى العملية التي يتم فيها اكتشاف املعرفة

عادة ما تكون غير معروفة من ، يجب النظر إليه بعين الاعتبار و هو أن هناك أنماط جديدة قد تبرز،وهناك جانب مهم جدا

ات قادرة على البحث عن أنواع مختلفة من ألانماط، بأشكال متوازية لزيادة قبل. وبالتالي يجب أن تكون أدوات التنقيب عن البيان

أن يتم الكشف عن ألانماط في ألاجزاء الصغيرة والفرعية، والتي تعرف بالحبيبات كفاءة التنقيب عن البيانات. كما يجب أيضا

Granularitiesلول التنقيب عن البيانات الجيدة هي التي تشير ، مما يعني البحث في مستويات مختلفة من التجريد أو التفصيل. ح

إلى قدر من الثقة أو اليقين املرتبطة مع نمط اكتشافها، ألن بعض ألانماط قد ال تصلح لكافة البيانات في مجموعة البيانات أيضا

التي تم تحليلها.

استخدامات التنقيب عن البيانات

التساؤل عن الفوائد التي يمكن للمنظمات تحقيقها من استخدام التنقيب في ضوء املفهوم العام للتنقيب في البيانات يبدأ

في البيانات؟ وما هي املنظمات التي بدأت باستثمار هذه التقنية في أنشطتها؟

واحدة من القطاعات املهنية التي بدأت باالستفادة من هذا املفهوم هي الرعاية الصحية. مع النمو في السجالت الصحية

.ائلة من البيانات الرقمية للمريضاملزيد واملزيد من التسهيالت وجمع كميات ه )السجالت الصحية إلالكترونية(،ة إلالكتروني

بالتالي يمكن ملقدمي الرعاية الصحية والباحثين استخدام التنقيب عن البيانات من مخازن هائلة من البيانات لكشف أنماط

لتحسين التشخيص ونتائج الرعاية الصحية. التنبؤيةهذه املعلومات لبناء النماذج ومن ثم استخدام معرفية كانت مجهولة سابقا

مهنة أخرى استطاعت الاستفادة من التنقيب عن البيانات وهي قطاع تجارة التجزئة. من خالل تطبيق أدوات التنقيب عن

املستهلكون فيها بغزارة إلى املحالت التجارية البيانات، وسالسل البيع بالتجزئة أصبحت قادرة على اكتشاف ألايام التي يتوافد

كل هذه املعلومات ،ن املنتجات املتواجدة يذهب املالوعلى أي م ،ص بهم، وكيف ينفقون معظم أموالهموالقيام بالتسوق الخا

واملعرفة بهذه ألانماط والتي قد يكون الكثير منها غير معروف لديهم، ساعد املخططين على توجيه استثماراتهم بناء على هذه

املعلومات املكتسبة لزيادة إيراداتها في الواقع.

يمكن املضافة والذي تعطي بيانات ال التنقيب في البيانات هو إعادة رؤية للبيانات من منظور جديد ومن هنا تكون القيمة

التنقيب عن البيانات يعطي هذه القيم املضافة في مجاالت عددية إذا ما تم استخدامه. ،توقعها باألساليب التقليدية

في تدوينه قادمة سيتم مناقشة مجاالت استخدامه بصورة أوسع سواء في الطب أو الكيمياء الحيوية والتجارة واملكتبات

املكتبات(، كما سنعرف قيب عن البيانات في هذا املجال )املعلومات التي كانت الصين من الدول الرائدة في استخدام التن ومؤسسات

Page 6: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

كيف أثرت تقنية التنقيب عن البيانات في قرار املمثلة العاملية أنجلينا جولي إجراء عملية جراحية. هذا باإلضافة إلى مناقشة

استخدامها إلجراء عمليات التنقيب عن املعلومات.ألانظمة والبرمجيات التي يتم

Page 7: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

تنقيب في البياناتال

ويدوي عن معرفة من البيانات دون فرضيات مسبقة عما يمكن أن تكون هذه محوسبالتنقيب في البيانات هي عملية بحث

قة منطقية )عادة ما تكون كمية كبيرة( إليجاد عال بياناتاملعرفة. كما ويعرف التنقيب في البيانات على أنه عملية تحليل كمية

على العالقات والبيانات «Models نماذج»مفيدة لصاحب البيانات. يطلق اسم تلخص البيانات بطريقة جديدة تكون مفهومة و

امللخصة التي يتم الحصول عليها من التنقيب في البيانات. يتعامل تنقيب البيانات عادة مع بيانات يكون قد تم الحصول عليها

بغرض غير غرض التنقيب ف رال تؤثيقة التنقيب في البيانات ما( مما يعني أن طر مصرفالتعامالت في قاعدة بياناتي البيانات )مثال

على طريقة تجميع البيانات ذاتها. هذه هي أحد النواحي التي يختلف فيها التنقيب في البيانات عن ، ولهذا يشار إلى إلاحصاءمطلقا

إلى أن كمية البيانات تكون عادة كبيرة، أما في حال عملية التنقيب في البيانات على أنها عملية إحصائية ثانوية. يشير التعريف أيضا

ل استخدام الطرق إلاحصائية العادية في تحليلها.كون كمية البيانات صغيرة فيفض

ة في البيانات، وكيفية تحليل عند التعامل مع حجم كبير من البيانات تظهر مسائل جديدة مثل كيفية تحديد النقاط املميز

يتم التنقيب في البيانات في فترة زمنية معقولة وكيفية قرار ما إذا كانت أي عالقة ظاهرية تعكس حقيقة في طبيعة البيانات. عادة

من كامل البيانات حيث يكون الغرض عادة

تحليل البيانات الحالية بيانات تكون جزءا

تعميم النتائج على كامل البيانات )مثال

هو كميات البيانات اختزالملستهلكي منتج ما بغرض توقع طلبات املستهلكين املستقبلية(. من أحد أهداف تنقيب البيانات أيضا

بدون تعميم.بسيط عن كامل البيانات الكبيرة أو ضغطها بحيث تعبر بشكل

محتويات

7 أنواع التنقيب

3 الكيفية

2 أهداف التنقيب

2 وسائل التنقيب في البيانات

1 تطبيقات التنقيب في البيانات

أنواع التنقيب -1

نوعان أساسيان للتنقيب في البيانات هما: التنقيب الاستشرافي والتنقيب الوصفي. هناك

.التنقيب الاستشرافي ينتج عنه نموذج عن النظام الذي تصفه البيانات املستخدمة في التنقيب

على املعلومات املوجودة داخل البيانات املستخدمة في عملية التنقيب. أما التنقيب الوصفي فينتج عنه معلومات جديدة بناء

الكيفية -2

أهداف التنقيب

هناك ثالثة أهداف للتنقيب في البيانات:

تعليل بعض الظواهر املرئية.من أجل .7

الصحي أكثر من ر الكبيرة تهتم بالضمان من أجل التثبت من نظرية ما. مثال: التثبت من النظرية التي تقول بأن ألاس .3

ر الصغيرة عددا.ألاس

إلانفاقمن أجل تحليل البيانات للحصول على عالقات جديدة وغير متوقعة. مثال: كيف سيكون .3 العام إن كان مالزما

لعمليات خداع واسعة من قبل البطاقات الائتمانية.

Page 8: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

وسائل التنقيب في البيانات

هناك عدة وسائل مختلفة من أجل التنقيب في البيانات. اختيار الوسيلة املناسبة يعتمد على طبيعة البيانات تحت الدراسة

عملية التنقيب في البيانات باملقارنة مع سوق البيانات ومخزن البيانات. إجراءوعلى حجمها. يمكن

سائل هي:بعض من هذه الو

لنتائج والقوانين من أمثلة حية : التفكير واستخالص اCase-Based reasoning الاستدالل املبني على حاالت سابقة ­

و .قضايا تم حلها سابقا

: البحث عن منوال معين أو عالقة معينة في جزئية كبيرة من البيانات.Rule Discoveryالكشف عن قانون ­

.الظواهر املتشابه مع بعضها البعض إيجاد: Signal Processingمعالجة إلاشارات ­

على أسس تم تطويرها بناء : تطوير نماذج قابلة لتنبؤ النتائج. هذه النماذج تم Neural Nets شبكات عصبونية ­

استنباطها من عقل إلانسان.

.: تصغير البيانات الكبيرة من دون ضياع املعلوماتFractalsمنحنيات غير ثابتة ­

تطبيقات التنقيب في البيانات

ستعمل وبنجاح في الكثير من التطبيقات الحقيقة حول العالم. التطبيقات التالية ت وسائل التنقيب في البيانات ت

شمل بعضا

من ألامثلة:

: تطوير وإنشاء تقارير موجزة عن الزبائن املهمين وعن Profiling Populationsكتابة تقرير مختصر عن فئة معينة ­

بطاقات الائتمان.

ألاسواق ذات قدرات النمو القوية أو الضعيفة. إيجاد: Analysis of Business Trendتحليل النزعة التجارية ­

الزبائن من أجل منح التخفيضات لهم لسبب معين. إيجاد: Target Marketingالتسويق لفئة معينة ­

.منوال معين الستعمال الخدمات والسلع إيجاد: Usage Analysisتحليل الاستعمال ­

ثرها أك إيجاد: مقارنة استراتيجيات الحمالت مع بعضها البعض من أجل Campaign Effectivenessفعالية الحملة ­

.فعالية وتأثيرا

السلع التي تباع مع بعضها البعض. إيجادجاذبية السلعة: ­

تطبيقات التنقيب في البيانات بدأت تنمو بصورة كبيرة لألسباب التالية:

(.exponentialكمية البيانات املوجودة في مخزن البيانات وسوق البيانات تنمو بصورة أسية ) .7

يحتاج إلى أدوات متطورة من مثل التنقيب في البيانات من اجل استخالص الفائدة ومن أجل ذلك، فإن املستخدم .3

واملعرفة من هذه البيانات.

الكثير من أدوات التنقيب عن البيانات بدأت تظهر مؤخرا، وكل أداة أفضل من ألاخرى. .2

ت التي بيدها. عمليات التنقيب في املنافسة الشديدة املوجودة في السوق تدفع الشركات إلى الاستفادة القصوى من البيانا .2

.البيانات تفعل ذلك تماما

Page 9: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

(Business Intelligenceذكاء ألاعمال )

ذات مفيدةإلى معلومات ألاوليةهي عبارة عن نظريات ومنهجيه وعمليات وخصائص وتقنيات تقوم على تحويل البيانات

فرص التجارية ال. له القدرة على التعامل مع أعداد هائلة من املعلومات ملساعدة املؤسسات في تحديد وتطوير ألاعمال ألغراضمعنى

.فعالة استراتيجيةالجديدة، والاستفادة من الفرص الجديدة وتنفيذ

لعمليات ألاعمال. املهام املشتركة لتكنولوجيات ذكاء ألاعمال هي وتنبؤيهتكنولوجيات ذكاء ألاعمال توفر آراء تاريخية وحالية

.تنبؤيهوتحليالت ومعايير القياس واستخراج نص وإدارة عمليات ألاعمالواستخراج البيانات OLAPإلابالغ وتحليالت

ما تهدف إلى دعم أفضنظام دعم القرار ل ألعمال صنع القرار. ولذلك نظام ذكاء ألاعمال يمكن أن يسمى ذكاء ألاعمال غالبا

DSS.

محتويات

7 نظرة تاريخية

3 كعملية ألاعمالذكاء

2 ألاعمال كتكنولوجياذكاء

2 و تخزين البيانات ألاعمالذكاء أنظمة

1 ذكاء وتحليالت ألاعمال

6 الذكاء التنافس ي

1 مستقبل ذكاء ألاعمال

نظرة تاريخية

الذكاء على النحو التالي عرفت مصطلح ذكاء ألاعمال. لقد هانز بيتر لين ي بي إمأ ، استخدم باحث7511ر عام في مقال نش

.«لتوجيه العمل نحو الهدف املنشود للوقائع املقدمة في مثل هذا النحو املتبادلةالقدرة على القبض على العالقات »

ف ( اقترح ذكاء ألاعمال كمصطلح مظلة لوصGartner) غارتنرفي وقت الحق محلل مجموعة 7515هوارد دريسنير في عام

7551لم يكن هذا حتى أواخر عام .«ام الواقع القائم على نظم الدعمالقرار باستخد اتخاذمفاهيم وأساليب لتحسين عملية »

حيث أن هذا الاستخدام أصبح منتشر على نطاق واسع.

كعملية ألاعمالذكاء

هي عملية مستمرة أي أن املؤسسة تجمع بشكل مستمر، تسج ل وتحل

ألهداف معينة وتستخدم النتائج في ل بيانات وفقا

املؤسسة. أداءالقرار لتحسين اتخاذعملية

ل كتكنولوجياذكاء ألاعما

،ي املؤسسات. بالعموم هي العملياتشكل فلومات تعطي ذكاء ألاعمال مضمون و هي مجموعة من التقنيات في تكنولوجيا املع

أكثر ذكاء للمؤسسات. أداءالتقنيات التي تنتج عنها املعايير و الاستراتيجيات، الثقافة، ألادوات، الهيكلة،

Page 10: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

و تخزين البيانات ألاعمالذكاء أنظمة

أنحاءتواجه املؤسسات في جميع ما تستخدم العالم تحد

يات حقيقية في استخدام البيانات املتوفرة في دعم القرار. كثيرا

. ومع ذلك، ليس كل مخازن البيانات مستخدمة لذكاء ألاعمال وال مخزن البياناتتطبيقات ذكاء ألاعمال البيانات التي تم جمعها من

تتطلب مخزن بيانات. وأهم هذه التحديات في استخراج املؤشرات التجارية تتلخص في ما يلي: ذكاء ألاعمالجميع تطبيقات

.وغير املترابطة مع بعضها البعضتخزين البيانات في ملفات و قواعد بيانات متعددة ­

متكاملة عن بيانات املؤسسة.ددة املصادر لتوفير رؤية موحدة و ربط البيانات املتع ­

و الخطة املوضوعة من واقع البيانات و املؤشرات. الاستراتيجياتالقدرة على متابعة تنفيذ ­

ت التحليل و ت لغاياجودة البيانا ­ التاريخية منها. خصوصا

ربط ذلك بقواعد من خالل الرسومات البيانية و إحصائيةرض و التصميم املناسب لكل مؤشر و عدم استخدام الع ­

البيانات.

ذكاء وتحليالت ألاعمال

قسم إلى الاستعالم وإلابالغ جادل بأن ذكاء ألاعمال يجب أن توماس دافنبورت وتحليل ألاعمال. ، أداة تنبيهاتOLAPوت

د الحلول ملشاكلها.ف احتياجات ألاعمال وتحد و عبارة عن فرع من املعرفة التي تعر تحليل ألاعمال هما تشمل الحلول غالبا

والشخص الذي يقوم بهذه املهمة يسمى ظام، وكما أنها يمكن أن تتكون من تحسينات عملية أو تغيرات تنظيمية.عنصر تطوير الن

.محلل ألاعمال

تكنولوجيا املعلومات التجارية محللوألاعمال الذين يعملون فقط على تطوير أنظمة البرمجيات يمكن أن يطلق عليهم محللو

ألانظمة. محللوالتقنيون أو ألاعمال محللوأو

التنافس ي الذكاء

ما تستخدم كمرادف .للذكاء التنافس يمصطلح ذكاء ألاعمال غالبا

مستقبل ذكاء ألاعمال

:عمالذه التطورات في سوق ذكاء ألا تتوقع ه 3115ورقة غارتنر عام

شركه عاملية سوف 1111في املائة من أعلى 21، أكثر من 3173بسبب فقر املعلومات والعمليات وألادوات، خالل عام ­

القرارات الثاقبة عن التغييرات الكبيرة في أعمالهم وأسواقهم. اتخاذتفشل بانتظام في

ة من مجموع امليزانية لذكاء ألاعمال.في املائ 21، سوف تحكم وحدات ألاعمال ما ال يقل عن 3173بحلول عام ­

البرمجيات د مستلم عن طريق تطبيق تحليلي محد من املنظمات سيكون لديها صناعه في املائة 31، 3171بحلول عام ­

كعنصر داعم مللف ذكاء ألاعمال. كخدمة

درات ذكاء مع منصة ق البرامج الاجتماعيةمنتج جديد الذي يجمع بين سوف يبرز كفئة قرار تعاوني اتخاذ، 3115في عام ­

ألاعمال.

طب 3173بحلول عام ­تطبيق مزجالل ردئ على عمليات ألاعمال سوف ترسل من خ ةق، ثلث التطبيقات التحليلية امل

الحبيبات.

Page 11: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

Business Intelligence Tools أدوات ذكاء ألاعمال

تملك أغلب املؤسسات كميات كبيرة من البيانات موزعة ضمن مخازن بيانات متنوعة، مثل قواعد البيانات، ووثائق بصيغ

يقات بأنواع مختلفة وغيرها من املستودعات في مختلف فروع وأقسام املؤسسة. إن وجود تطب PDFو Word Excel مختلفة مثل

في غاية الصعوبة يجعل استخراج .املعلومات وتحليلها أمرا

BIر الذي يشار له باملختص ،Business Intelligence» لذكاء ألاعما»يعني التعبير ، مجمل ألادوات وألانظمة التي تؤدي دورا

في عملياتتحليلها بهدف و التخطيط الاستراتيجي للمؤسسة. يسمح ذكاء ألاعمال للمؤسسة بتجميع البيانات وتخزينها رئيسيا

ر هذه ألانظمة وألادوات ذكاء ظهوتقسيم السوق وأبحاث مثل فرز الزبائن ودعمهم مجاالت يف ألاعمال املساعدة على اتخاذ القرار. ت

.والجرد املنتجات والتحليل إلاحصائي وتحليل التوزيع وعائديةالسوق

ذكاء ألاعمال، معددين أنواعها وشارحين باختصار بعض تطبيقات سنتطرق في هذا املقال إلى ألادوات املستخدمة في بناء

.هذه ألادوات من كل نوع

أنواع أدوات ذكاء ألاعمال -أ

ات وبناء التقارير. تقرأ ألادواتوعرض البيان إن أدوات ذكاء ألاعمال هي برمجيات تطبيقية مصممة لتحليلالبيانات عادة

ضمن :الرئيسية يمكن تصنيف أدوات ذكاء ألاعمال في عدد من الفئاتمستودعات ومخازن البيانات. املخزنة سلفا

Spreadsheets.ل برمجيات الجداو ­

. Reporting Softwareبرمجيات توليد التقارير ­

.OLAP برمجيات التحليل آلاني ­

.Dashboard لوحات القيادة ­

.Data Mining في البيانات التنقيب ­

.Decision Process هندسة القرارات ­

.Process Mining في إلاجراءات التنقيب ­

.Business Performance Management إدارة أداء ألاعمال ­

.Local Information Systems نظم املعلومات املحلية ­

أو كطقم أدوات أو كجزء من أنظمة تخطيط موارد ةكأدوات منفصلتباع هذه ألادوات، ما عدا برمجيات الجداول،

.رمجيات مخصصةأو كمكونات لب ERP املؤسسات

.مصادر رمازهاحيث رخصة الاستخدام وفتح سنتحدث فيما يلي عن بعض هذه املنتجات، مصنفين إياها من

منتجات مفتوحة املصدر مجانية -ب

Eclipse BIRT مشروع .1

املعتمدة على الوب، للتطبيقات Eclipse لتوليد تقارير، وهو مفتوح املصدر ومعتمد على إكليبس هو نظام BIRT بيرت

على إكليبس، يحوي بيرت مكونين رئيسيين: مصمم .J2EE.وتقنية Java وخاصة تلك املعتمدة على جافا تشغيل ومكون تقارير معتمدا

runtime للرسوم البيانية يسمح بإضافة املخططات والرسوم إلى يمكن إضافته إلى مخدم التطبيقات. كما يقدم بيرت محركا

.التطبيقات

Page 12: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

،واملخططات Listsاللوائح أنواعها: من نذكر التطبيقات إلى التقارير من العديد إضافة تبير باستخدام يمكن

Chartsواملصفوفات، Crosstabsوالوثائق والرسائل والتقارير املركبة من مجمل هذه ألانواع،.

Jasper Soft ألاداة .2

برمجيات خاصة بتوليد التقارير املصدر، تتضمن سوفت لذكاء ألاعمال هي برمجيات مفتوحة إن طقم أدوات جاسبر

ومكاملة البيانات، وهي متوفرة كحزمة برمجية متكاملة أو كتطبيقات منفصلة يمكن والتحليل Dashboards ولوحات القياس

.تنصيبها وحدها ثم دعمها بالتطبيقات ألاخرى مستقبال

بحيث يمكن ريبورتس جاسبر .ة البرمجيات لتناسب عملهللمستخدم مواءم يتوفر الرماز ألاساس ي لهذه البرمجيات مجانا

Jasper Reports التقارير إلى التطبيقات وهو مكتبة إعداد تقارير مفتوحة املصدر مكتوبة بلغة جافا تسمح بتصدير هو أحد هذه

ئالعديد من الصيغ، وي ى تطبيقات الوب، بحيث تولد محتو ة لجافا ومنهامكن دمجها في التطبيقات املهي . هنالك أيضا

ديناميكيا

.الخاصة بأوراكل PL/SQL توسعة تسمح باستخدام

هي من النوع على LGPL رخصة النظام املفتوح حاليا

عدد من البرمجيات التجارية املطورة اعتمادا

جاسبر وهنالك أيضا

.ريبورتس

Rapid Miner ألاداة .3

تسمح إلجراء الاختبارات في مجال تعلم آلالة والتنقيب في البيانات، فهيمفتوحة املصدر هو بيئة Rapid Miner ماينر رابيد

ماينر ، ويمكن بناء هذه ألاخيرة باستخدام واجهة رابيدXML ببناء عدد ضخم من املؤثرات )الخطوات التحليلية( ضمن توصيف

ستخدم .اناتماينر في مجال ألابحاث والعالم الحقيقي للتنقيب في البي رابيد البيانية. ت

AGPL تحت الرخصة وهي توزع 2001 النسخة ألاولى عام طورت وحدة الذكاء الصنعي في جامعة دورتموند ألامريكية

م يعمل على خدام لغة البرمجة جافا، وهو من ثمطور باست املشروع .3112 عام املشروع منذ Source Forge ويستضيف املوقع

.أغلب نظم التشغيل املعروفة

التنقيب في البيانات، مثل أشجار القرارات والخرائط الذاتية ماينر نذكر املجموعة الواسعة من خوارزميات من ميزات رابيد

ألابعاد واملكعبات البيانية البيانية املعقدة واملتطورة، مثل ألاشكال الشجرية والنقاط املبعثرة الثالثية التنظيم، وكذلك ألاشكال

.مثل مقبس تحليل النصوص plugins قابساملتداخلة، إضافة إلى العديد من امل

Spago BI ألاداة .4

تكامل لذكاء ألاعمال مطورة كلي هي منصة Spago BI سباغو بي آي ملفهوم البرمجيات الحرة ا

عتبر وفقا

املفتوحة املصدر. ت

مثل إعداد البيانات، سباغو بي آي منصة، ألنها تحقق كافة متطلبات ذكاء ألاعمال من ناحيتي تحليل وإدارةفهي تقدم وظائف

أدوات والتنقيب في البيانات ولوحات القياس والاستفسارات املخصصة. ولديها MOLAP التقارير والتحليل املتعدد ألابعادأيضا

وإدارة النسخ إضافة إلى دعم عمل مدير النظام من ناحية صيانة الوثائق التحليلية ETL الستخراج وتحويل وتحميل البيانات

املصدر وحرة هي مفتوحة Spago BI سباغو بي آي .التحكم بتدفق ألاعمالو مجتزءات تجارية. وال يوجد منها نسخ متعددة أو كليا

منتجات مفتوحة املصدر تجارية -ج

Paloألاداة .7

ويستخدم MOLAP قواعد بيانات متعدد ألابعاد هي مخدم Palo بالوكأداة لذكاء ألاعمال في مجال الضبط وإدارة عادة

مفهوم البيانات املتعددة ألابعاد وإضافة إلى Spreadsheetاستخدام مشابهة لبرمجيات الجداول امليزانيات، وذلك عبر واجهة

كبرمجيات مغلقةبالو متاح كبرمجيات مفتوحة املصدر وكذلك .واحد يسمح بالو لعدة مستخدمين بالتشارك في مخزن بيانات

Page 13: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

الخاصة PalOO Ca وإلاضافة Palo for Excel باألكسل الخاص يتمتع بالو بعدد من إلاضافات املفتوحة املصدر مثل بالو .املصدر

NET.و ++C/Cو PHPبالو في أنظمة أخرى عبر مكتبات خاصة بجافا و يمكن دمج Open Office org. بأوبن أوفيس

Pentaho ألاداة .3

من إمكانات ذكاء ألاعمال الخاص بذكاء Pentaho أدوات بينتاهويوفر طقم كامال

ألاعمال التي تتضمن الاستفسار طيفا

ETL وتكامل البيانات وتقنية الاستخراج/التحويل/التحميل Dashboards وتوليد التقارير والتحليل التفاعلي ولوحات القياس

من أهم برمجيات ذكاء ألاعمال املفتوحة املصدر. يتألف طقم ذكاء ألاعمال جعلتهاوالتنقيب في البيانات، إضافة إلى كونها منصة ل

Pentaho Analysis ومحلل Pentaho Reporting يمكن انتقاؤها كحزمة واحدة أو مفردة وهي: مولد التقارير بينتاهو من عدة أجزاء

.Pentaho Data Mining وأداة التنقيب في البيانات Pentaho Dashboards القياس ولوحات

منتجات تجارية حرة -د

Freereporting.com البرمجية .1

على الوب، وهو مطو هي برنامج Freereporting.com إن فريريبورتينج Logi ر من قبللتقارير ذكاء ألاعمال يدار اعتمادا

XML ومتاح بدون تكلفة تحت الرخصة OEM .البرنامج وهنالك نسخة تجارية كاملة ميزات أساسية في النسخة املجانية تقدم

بيانية، وتسمح تستخدم واجهة التخاطب. املواصفات املعتمدة على الوب في النسخة املجانية تقارير جدولية ومخططات ورسوما

، بتجميع البيانات ووضعها في صفحات وترتيبها مع إمكان التغلغل في البيانات. أما ميزاتمثل لوحات ذكاء ألاعمال ألاكثر تطورا

.التجارية النسخة في متاحة املجانية ولكنها النسخة في متاحة غير فهي التفاعلي، البيانات ومعاين التحليل وشبكة القياس

Style Intelligence ألاداة .2

تطبيقات ذكاء ألاعمال املعتمدة على الوب. تملك آينتسوفت InetSoft Technology آينتسوفت تكنولوجيتطور شركة منتجا

هو ستايل إنتليجنسومعاينة البيانات، وتقارير متعددة تركز على ذكاء ألاعمال العملياتي، بإصدارات Style Intelligence وحيدا

.تقارير قابل للتضمين ألاعمال ومحرك

الشركة إن ، ثمScorecards والتحليل املرئي وبطاقات التسجيل يشمل التطبيق أدوات لتوليد التقارير ولوحات القياس

.توفر البرمجيات كخدمات

تعتمد رخصة آينتسوفت على وحدة .ولغة جافا SOAPو XML منتجات آينتسوفت على املعايير املفتوحة مثل تعتمد

من .املستخدم املعالجة بدال

Micro Strategy ألاداة .2

وإعداد تقارير الشركات والتحليل آلاني، مطورة لبرمجيات ذكاء ألاعمال هي شركة Micro Strategyستراتيجي كرو شركة مي

وقواعد بيانات متعددة ألابعاد ROLAP عالئقية برمجياتها أدوات إلعداد التقارير وتحليل البيانات املخزنة في قواعد بيانات إذ توفر

MOLAP ملفات نصية أو حتى في.

ستراتيجي تدعى مايكرو iPad وآيباد iPhone ولديها نسخة خاصة بآي فون Micro strategy 9 آخر نسخة من برمجياتها هي

كبرمجيات تجارية حرة تسمح بتطوير التقارير Micro Strategy Reporting التقارير موبايل. تقدم الشركة طقم برمجيات إعداد

التشغيلية والتحليلية

منتجات تجارية -ه

، هنالك العديد منمنتجات ذكاء ألاعمال التجارية واملغلقة املصدر. ولكثرة هذه إضافة إلى املنتجات املذكورة سابقا

.هذه ألادوات املشهورة بعض ملحة إلىاملنتجات، سنعرض

Page 14: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

IBM Cognos ألاداة .1

من إمكانات ذكاء ألاعمال: توليد التقارير والتحليل من أي بي إم Cognos من البرمجية كونيوس 1توفر النسخة كامال

طيفا

.وبطاقات التسجيل على بنية خدمات موجهة واحدة Dashboards ولوحات القياس

SQL Server Analysis Services ألاداة .2

فقد SQL Server هي جزء من مخدم قواعد البيانات Microsoft Analysis Services إن خدمات التحليل من مايكروسوفت

من الخدمات ضمن مخدم ضمنتهذه بذكاء ألاعمال ومستودعات البيانات. تتضمنتتعلق SQL Server مايكروسوفت عددا

والتنقيب في البيانات. تتخذ خدمات تحليل OLAP الخدمات التكامل والتحليل، وتتضمن ألاخيرة إمكانات معالجة التحليل آلاني

من النقاش بين مايكروسوفت موقفا

ROLAPعاد واملتعدد ألاب MOLAP كافة النكهات من ، فهي توفرROLAP و MOLAP حياديا

.الهجين HOLAPالعالئقي و

SAS Institute أدوات .3

النظام يسمح .SAS Institute متكامل من املنتجات البرمجية املطورة من قبل معهد ساس هو نظام SAS إن النظام ساس

التقارير والرسوم البيانية إضافة إلى توليد للمبرمجين بعمليات مثل إدخال البيانات واستخراجها ومعالجتها والتنقيب فيها،

.القرار وبحوث العمليات وغيرها والتحليل إلاحصائي وتخطيط ألاعمال ودعم

Oracle Business Intelligence Suite Enterprise Edition ألاداة .4

Oracle Business Intelligence Enterprise Edition 11g من إصدار ذكاء ألاعمال للمؤسسات من أوراكل 11g النسخة إن

(OBIEE) من ميزات توليد التقارير وتحليل البيانات هي منصة كامال

وبطاقات التسجيل شاملة لذكاء ألاعمال التي توفر مجاال

.ولوحات القياس والتحليل املخصص والتحليل آلاني

Bime COA Solutions ComArch

CyberQuery Data Applied Decision Support Panel

Dimensional Insight HP Neoview IBM Applix

IBM Cognos IBM SPSS

IDV Solutions Visual Fusion InetSoft Informatica

Information Builders InfoZoom Izenda

Jreport Klipfolio Dashboard LogoXML

Microsoft SQL Server Reporting

Services

Microsoft SQL Server Analysis

Services

Microsoft PerfomancePoint

Server 2007

Microsoft Proclarity MicroStrategy m-Power

Oracle Corporation Hyperion Solutions Corporation Oracle Business Intelligence Suite

Enterprise Edition

Panorama Software Pentaho Pervasive DataRush

Pilot Software, Inc PRELYTIS Qliktech

SAP Business Information

Warehouse Business Objects OutlookSoft

Page 15: ةفرعلما جارختساو - std.ena.gov.lbstd.ena.gov.lb/Files/Samples/DataMiningAndForcasting.pdf · عقٿٰف ٮٿټفয়ا اذټل تافڊرعتلا ٷٯ لئاټلا

SAS Institute Siebel Systems Sportfire(now Tibco)

StarSoft Sybasse IQ Tableau Software

Teradata Thomson Data Analyzer XLCubed


Recommended