البيانات الضخمة. .« بترول» القرن الـ21

LoghetAlasr - - شبكاتاجتماعية - د. محمد الجندى

ف �ي المقال الس �ابق تحدثنا عن البيانات الضخم �ة أو Data Big وتطرقنا إلى أه �م تعريفاته �ا الأساس �ية أم �ا في مقالن �ا هذا فس �وف نتن �اول خصائص هذه البيان �ات الضخم �ة وم �ا ال �ذي يجعلن �ا نطلق عل �ى نوعية م �ن البيان �ات دون غيرها "بيانات ضخمة"؟

البيانات الضخمة لها مميزات وخصائص نس �تطيع عن طريقها أن نميزها وهن �اك الكثير من النظريات التي تهتم بتعريف هذه الخصائص لكننا س �وف نتط �رق إلى أهمها ولنب �دأ بنموذج Laney Dougوهو أح �د أهم المحللين في ش �ركة Gartnerحي �ث افترض Dougفي ورق �ة بحث ع �ام 2001 أن البيانات الضخم �ة تنم �و بش �كل ثلاثي الأبع �اد أو في نم �وذج ثلاثي الأبع �اد Model 3D والذي عرف ايضا ب� Vs3ثم قام بتقس �يم هذا النموذج إلى 3 عناصر لتعريف خصائص البيانات الضخمة وهي كما بالشكل التالي:

العنص �ر الأول من هذه العناصر وهو ال� Volumeويعبر عن الحجم الضخم للبيانات وكما ذكرنا في مقالنا السابق أننا ننتج يوميا حوالي 2.5 كوينتيليون باي �ت م �ن المعلومات. العنصر الثان �ي وهو ال�Velocityويعبر عن س �رعة تغير ه �ذه البيان �ات والت �ي تحت �اج إلى تقني �ات متط �ورة للتعامل مع هذه الس �رعة المتغي �رة لتحليله �ا وفهرس �تها مث �ل Hadoop Apacheوغي �ره. أم �ا العنصر الأخي �ر وه �و ال�Varietyفيعب �ر ع �ن تن �وع مصادر ه �ذه البيانات م �ن محتوى ش �بكات تواص �ل اجتماع �ي وفيدي �و رقم �ي وملف �ات صوتي �ة واش �ارت GPS وهواتف ذكية وإشارات من أجهزة أخرى متصلة بالإنترنت ترسل بيانات غير مهيكلة وغير مفهرسة وهي من الأشياء التي خلقت تحديا كبيرًا حتى لقدرات شبكة الإنترنت.

لك �ن في الآون �ة الأخيرة ومع التغير الكبير في حج �م البيانات وتنوعها كانت هن �اك حاج �ة ملح �ة لادخال عناص �ر أخرى له �ذا النم �وذج كم �ا فعلت بعض المؤسس �ات وحت �ى الجامع �ات وأضافت عنص �ر ال� � Veracityوال �ذي يعبر عن م �دى دقة ه �ذه البيانات وم �دى الاعتماد عليه �ا في اتخاذ الق �رارات, ويعتمد هذا العنصر تحديدا على مصدر البيانات الضخمة في تحديد مدى دقة هذه البيانات من عدمه.

ول �م يتوقف الأم �ر على هذا العنص �ر الاخير فهناك اتجاه �ات لاضافة المزيد م �ن ال�Vsلنم �وذج البيان �ات الضخم �ة مث �ل ال� �Value أو قيمة ه �ذه البيانات وأيض �ا Variability أو قابلي �ة التغير والتي قد تكون عام �لًا مربكًا للكثير من محللي البيانات.

لكنن �ا لا نري �د التط �رق إل �ى المزي �د م �ن إش �كاليات التعريف �ات والخصائ �ص للبيان �ات الضخم �ة, م �ا يهمن �ا ه �و أن يتع �رف الق �ارئ العزي �ز على أساس �يات البيانات الضخمة والتي ستخلق فرصا كبيرة وأيضا تحديات كبرى.

والآن بع �د أن ب �دأت تطبيق �ات البيان �ات الضخم �ة تنتش �ر ف �ي قطاع �ات كثي �رة م �ن الصح �ة للتعليم والأس �واق المالي �ة والطاق �ة والإعلام وحت �ى الأمن والاس �تخبارات, أصب �ح لدين �ا تس �اؤلات ملح �ة, ه �ل لدين �ا ع �دد كاف م �ن المتخصصين في تحليل هذا النوع من البيانات؟ وهل لدينا من هم على دراية بتكنولوجي �ا تحليل البيانات الضخمة في القطاعات المختلفة؟ باختصار هل لدينا "علماء للبيانات" أو Scientists Data؟

م �ن وجهة نظ �ري المتواضع �ة البيان �ات الضخمة ق �د تكون "بت �رول" القرن الواح �د والعش �رين واذا كان الكيميائيون والفيزيائيون قد س �اهموا في تطور القرن العشرين, فالقرن الحالي سيعتمد كثيرًا على علماء البيانات.

Newspapers in Arabic

Newspapers from Egypt

© PressReader. All rights reserved.