A member of staff poses for a photograph in a projection of live data feeds taken from Twitter, Instagram and Transport for London, as he stands in the 'London Situation Room,' a n artwork created in collaboration with Future Cities Catapult & Tekja, during a photocall to promote the Big Bang Data exhibition at Somerset House in London on December 2, 2015. Justin Tallis/Stringer

إدارة المخاطر الكبيرة للبيانات الضخمة

نيويورك – في السنوات 15 الماضية، شهدنا انفجارا في كمية البيانات الرقمية المتاحة - من الإنترنت ووسائل الإعلام الاجتماعية، والمعدات العلمية، والهواتف الذكية، وكاميرات المراقبة، إلى العديد من المصادر الأخرى - وفي تكنولوجيا الكمبيوتر المستخدمة. ومما لا شك فيه أن "البيانات الضخمة"، كما هو معروف، تقدم التطورات العلمية والتكنولوجية والطبية الهامة. لكن البيانات الضخمة أيضا تشكل خطرا جسيما إذا ما استُخدمت أو تم التعامل معها بشكل سيئ.

وبالفعل، فقد اعتمدت الابتكارات الرئيسية مثل محركات البحث على الإنترنت، والترجمة الآلية، ووسم الصورة على تطبيق تقنيات التعلم الآلي لمجموعات البيانات الضخمة. وفي المستقبل القريب، يمكن للبيانات الضخمة أن تحسن إلى حد كبير السياسات الحكومية وبرامج الرعاية الاجتماعية، والمنح الدراسية.

لكن وجود المزيد من البيانات ليس بديلا عن وجود بيانات عالية الجودة. على سبيل المثال، يوضح مقال نُشر مؤخرا في مجلة "نيتشر" أن استطلاعات الرأي الانتخابية في الولايات المتحدة تكافح من أجل الحصول على عينات تمثيلية من السكان، لأنه مسموح لها قانونا بالاتصال فقط بالهواتف الأرضية، في حين يعتمد الأمريكيون بشكل متزايد على الهواتف المحمولة. وبينما يمكن للمرء أن يجد آراء سياسية لا تحصى حول وسائل الإعلام الاجتماعية، فهذه لا تمثل الناخبين على نحو موثوق. في الواقع، فاٍن حصة كبيرة من التغريدات والمشاركات على الفيسبوك حول السياسة مولدة بالحاسوب.

https://prosyn.org/UkU8jzZar