7 اتجاهات البيانات الضخمة الناشئة
في مقال نُشر عام 2005 بعنوان “ما هو الويب 2.0؟” ، استخدم Tim O’Reilly لأول مرة مصطلح “Big Data” للإشارة إلى مجموعة كبيرة من البيانات التي يكاد يكون من المستحيل إدارتها ومعالجتها باستخدام أدوات ذكاء الأعمال التقليدية. بلغ استخدام هذا المصطلح ذروته بين عامي 2013 و 2015 ، بل ووجد مكانًا في قاموس أكسفورد في عام 2013. كانت شركة Gartner تتعقب البيانات الضخمة باعتبارها تقنية ناشئة لسنوات عديدة ، لكنها أزلتها من تلك القائمة في عام 2015 ، بحجة أنها أصبحت جزء من العديد من التقنيات الناشئة المختلفة مثل التعلم الآلي والتحليلات المتقدمة.
بالنظر إلى هذا السياق ، ما الذي يلوح في الأفق بالنسبة للبيانات الضخمة في عام 2020؟ عند دراسة اتجاهات البيانات الضخمة ، نرى تطورات جديدة ستؤدي إلى تحسينات جوهرية في القدرات والسرعة والفهم وتحسين التكلفة.
ما هي اتجاهات البيانات الضخمة للمستقبل وكيف ستؤثر على الشركات والحكومات؟ دعونا نلقي نظرة أدناه:
سوف تحقق تحليلات بيانات إنترنت الأشياء خطوات واسعة
على مدى السنوات القليلة الماضية ، تزايد اعتماد تقنية إنترنت الأشياء (IoT) في العديد من القطاعات مثل التصنيع والزراعة والمرافق والرعاية الصحية والحوكمة. تقوم الأجهزة المتصلة بجمع كميات كبيرة من البيانات ، وعادة ما يتم تخزينها في بحيرات البيانات. هذه بالتأكيد بيانات ضخمة ، تتزايد باستمرار من حيث الحجم والتنوع والسرعة.
تجمع مستشعرات إنترنت الأشياء بيانات غير متجانسة من العديد من المصادر المختلفة مثل قنوات الفيديو والمواقع الجغرافية وملفات السجل وقراءات المعدات. ستظهر القيمة الحقيقية لأنظمة إنترنت الأشياء عندما يمكن اتخاذ القرارات بناءً على الرؤى والاتجاهات التي تكشف عنها البيانات. حتى الآن ، جعلت الطبيعة غير المهيكلة للبيانات وحجمها الكبير من الصعب جدًا معالجتها وتحليلها.
من الآن فصاعدًا ، من الواضح أنه ستكون هناك تطورات مهمة في قدرتنا على تحليل بيانات إنترنت الأشياء في جميع المجالات الثلاثة – التخزين ومعالجة التدفق ومنصات التحليل.
سوف تجعل التوائم الرقمية تحليلات أكثر قوة ممكنة
التوأم الرقمي هو تمثيل رقمي لكائن مادي أو نظام. تم إنشاء التوائم الرقمية للمباني والمصانع وحتى المدن. نشأت هذه الفكرة في وكالة ناسا ، حيث تم استخدام نماذج بالحجم الطبيعي لكبسولات الفضاء لنمذجة وتشخيص المشاكل المحتملة في المدار.
يتلقى التوأم الرقمي بيانات حول الكائن الفعلي من المستشعرات ويحاكي الكائن في الوقت الفعلي. يمكن استخدام التوأم الرقمي المستند إلى نموذج أولي تم إنشاؤه قبل تصنيع المنتج الفعلي لتحسين تصميم المنتج النهائي.
تتيح التوائم الرقمية التحليلات التنبؤية وسيناريوهات ماذا لو ، مما يساعد على تحسين الأنظمة لتحقيق أقصى قدر من الكفاءة. تولد التوائم الرقمية للأنظمة الكبيرة والمعقدة ، مثل سفن المصانع ، كميات كبيرة من البيانات للبيانات الضخمة. يتمثل أحد اتجاهات البيانات الضخمة التي سنراها في دمج الذكاء الاصطناعي وتحليلات البيانات الضخمة وإنترنت الأشياء والتحليلات التنبؤية من أجل الاستفادة المثلى من البيانات الناتجة عن التوائم الرقمية.
يتم استخدام التوائم الرقمية بالفعل في قطاعات مختلفة ، بما في ذلك النفط والغاز والرعاية الصحية وسباق الفورمولا 1 وإدارة المدن الذكية والزراعة.
سيتم استخراج البيانات المظلمة للحصول على رؤى
في حين أن العديد من المؤسسات تستثمر في التكنولوجيا لالتقاط البيانات ، فمن المقدر أن 60-73 في المائة من بيانات المؤسسة لا يتم استخدامها. من المحتمل ألا تكون المنظمة على دراية بالبيانات التي يتم جمعها. مع أجهزة استشعار إنترنت الأشياء التي تجمع البيانات في كل لحظة ، يمكننا أن نفترض بأمان أن النسبة المئوية للبيانات التي لا يتم تسخيرها بشكل فعال ستزداد أكثر.
يشار إلى هذه البيانات غير المستخدمة عادة باسم “البيانات المظلمة”. تعرفه شركة Gartner بأنه “تقوم مؤسسات أصول المعلومات بجمعها ومعالجتها وتخزينها أثناء أنشطة الأعمال العادية ، ولكنها تفشل عمومًا في استخدامها لأغراض أخرى”.
قد يتم جمع “البيانات المظلمة” وتخزينها لأغراض الامتثال فقط ، أو ربما يتم إنشاؤها بواسطة أنظمة أو أجهزة استشعار بدون وجود خطة لمزيد من المعالجة والتحليل. يعد عدم استخدام البيانات أو قلة استخدامها بمثابة خسارة في التكلفة والفرصة ، حيث إنه يكلف المال لتخزين كميات كبيرة من البيانات وتضيع الرؤى المحتملة المكتسبة من تلك البيانات.
بعض الأمثلة على البيانات المظلمة التي يمكن أن تكشف عن رؤى تجارية قيمة هي ملفات سجل مواقع الويب ، والتي تساعدنا على فهم سلوك الزائر ؛ التسجيلات الصوتية لمركز الاتصال ، والتي تشير إلى ثقة المستهلك ؛ وبيانات الموقع الجغرافي للجوّال التي تكشف عن أنماط حركة المرور.
سنرى المنظمات أصبحت أكثر وعياً بقيمة الأعمال للبيانات وتتخذ إجراءات محددة لتحليلات البيانات المظلمة. إن توفر أجهزة وبرامج أكثر قوة سيمكن من معالجة البيانات الضخمة التي لا تزال “مظلمة”. يقدر الخبراء أن الشركات التي تواكب هذا الاتجاه في البيانات الضخمة وتنقب بشكل فعال في البيانات المظلمة ستحقق مكاسب إنتاجية كبيرة مقارنة بنظيراتها.
التخزين البارد على السحابة سيقود
مزيد من تحسين التكلفة
التخزين البارد هو مصطلح تم استخدامه لطرق تخزين البيانات التي لم تعد قيد الاستخدام النشط ولا تحتاج إلى الوصول إليها بشكل متكرر. تحتفظ المنظمات بهذه البيانات إما بسبب المتطلبات القانونية أو الاعتقاد بأنها قد تحتاج إلى الوصول إليها في المستقبل. تقليديا ، تم استخدام خيارات التخزين منخفضة التكلفة ، مثل الشريط ، للتخزين البارد حتى بدأ مزودو التخزين السحابي أيضًا في تقديم خيارات التخزين البارد.
توفر العروض الأكثر حداثة ، مثل خدمة التخزين البارد من Google ، تخزينًا اقتصاديًا للغاية بالإضافة إلى سرعة الوصول دون زمن انتقال يبلغ مللي ثانية. هذا هو اتجاه البيانات الضخمة الذي سيمكن المؤسسات من زيادة تحسين تكاليف تخزين البيانات وتحويل استثماراتها إلى تحليلات ورؤى أكثر فعالية.
ستعمل الحوسبة المتطورة على تحسين سرعة الأنظمة الكبيرة
تعد الحوسبة المتطورة طريقة جديدة للتعامل مع الحوسبة والتخزين للأنظمة ذات الانتشار الجغرافي الكبير ، مثل السيارات ذاتية القيادة أو كاميرات الدوائر التلفزيونية المغلقة أو أنظمة مراقبة النقل.
تعمل الحوسبة المتطورة على اللامركزية في تخزين البيانات ومعالجتها ، مما يجعلها أقرب إلى الأجهزة التي يتم فيها جمع البيانات. الهدف هو أن البيانات ، خاصة تلك المطلوبة في الوقت الفعلي ، لا تتسبب في حدوث مشكلات تتعلق بوقت الاستجابة والتي تعيق أداء النظام. هناك أيضًا ميزة توفير التكلفة للحوسبة المتطورة ، حيث تتم المعالجة محليًا ويتم تقليل كمية البيانات التي يجب معالجتها في موقع مركزي.
تعد الحوسبة المتطورة اتجاهًا للبيانات الضخمة من شأنها تحسين سرعة الأنظمة الكبيرة والمعقدة والمشتتة جغرافيًا. للحوسبة المتطورة تطبيقات قوية في إدارة الشبكة الذكية ، والمراقبة عن بعد لعمليات النفط والغاز ، وإدارة حركة المرور ، على سبيل المثال لا الحصر.
ستعمل التحليلات المعززة على تحسين إدارة البيانات
علماء البيانات هم من المهنيين المطلوبين للغاية. ومع ذلك ، يقضي معظمهم 80٪ من وقتهم في جمع البيانات وإعدادها و 20٪ فقط في اكتشاف الرؤى. تهدف التحليلات المعززة إلى تغيير ذلك عن طريق أتمتة عمليات جمع البيانات وإعدادها ، مما يوفر 80٪ من الوقت لعلماء البيانات.
تستخدم التحليلات المعززة تقنيات إحصائية ولغوية لتحسين أداء إدارة البيانات ، من تحليل البيانات إلى مشاركة البيانات وذكاء الأعمال.
تستخدم برامج تحليل البيانات مع التحليلات المعززة التعلم الآلي ومعالجة اللغات الطبيعية لفهم البيانات وتفسيرها. هذا هو اتجاه البيانات الضخمة الذي من شأنه تحسين إدارة البيانات وجعل التحليلات أكثر فعالية.
ستعمل تحليلات الرسم البياني على تعزيز فهمنا للعلاقات داخل البيانات
مع الحجم المتزايد باستمرار للبيانات المولدة والرغبة في فهم المزيد والمزيد من الظواهر المعقدة ، لا تستطيع الأساليب التحليلية التقليدية تلبية متطلبات البيانات الضخمة في المستقبل. تحليلات الرسم البياني عبارة عن نهج جديد يساعد في فهم الاتصالات بين نقاط البيانات وتحديد مجموعات نقاط البيانات ذات الصلة بناءً على التأثير وتكرار التفاعل والاحتمال.
تساعدنا تحليلات الرسم البياني في استكشاف العلاقات بين الكيانات ، مثل الشركات أو الأشخاص. يتم تعيين الكيانات والعلاقات على هيئة رسوم بيانية تتكون من عقد وحواف وخصائص.
تساعد تحليلات الرسم البياني في العثور على أنماط بين العلاقات بين العقد ، والتي قد تكون مرهقة للغاية مع الأساليب التحليلية التقليدية. بعض التطبيقات التي تُستخدم فيها تحليلات الرسم البياني حاليًا هي تحليل شبكات التواصل الاجتماعي ، واكتشاف الاحتيال ، وتحسين تحميل النظام.