إن أي مقال يقرأه المرء اليوم في أي مجلة علمية لابد أن يتطرق إلى معاناتنا من نقص هائل في علماء البيانات؛ كما أن بحثاً شهيراً أجرته مؤسسة "ماكنزي وشركاؤه" للأبحاث، أشار إلى أن العديد من المؤسسات الأميركية تفتقر إلى الموظفين المؤهلين لاستخراج المعلومات المعقدة اللازمة للأبحاث، كما تفتقر إلى البُنى والحوافز التي تمكن من استخدام البيانات في صناعة قرارات صائبة والاشتغال عليها. والشيء الذي يبدو غائباً عن كل تلك المناقشات والحوارات هو ذلك الحوار عن الكيفية التي يمكن بها الالتفاف على عنق الزجاجة المتعلق بهذا الموضوع، وجعل البيانات المهمة متاحة لقادة مؤسسات الأعمال. لقد فعلنا ذلك من قبل في صناعة البرمجيات، ونستطيع فعله مرة ثانية. ولإنجاز هذا الهدف قد يكون من المفيد فهم دور علماء البيانات في توفيرها والتعامل معها. ففي الوقت الراهن نجد أن البيانات الضخمة هي البوتقة الخاصة ببنى وأدوات البيانات مثل Hadoop وNoSQL وhive . ففي هذه البيئة الفائقة التقنية، يكون دور علماء البيانات مماثلاً لدور حراس البوابات، أو الوسطاء بين تلك المنظومات المتقدمة وبين الأفراد الذين يديرون العمل والمشاريع، أو من يمكن تسميتهم "خبراء النطاقات". ورغم أنه يصعب التعميم عند شرح هذا الموضوع، فإنه يمكن القول بأن الأدوار الرئيسية الثلاثة التي يقوم بها علماء البيانات في المشروعات المختلفة هي: تصميم بنية البيانات، والتعليم الآلي، ومعالجة المواد والتطبيقات التحليلية. ورغم الأهمية البالغة لتلك الأدوار، فالحقيقة هي أن كل شركة تحتاج في الواقع إلى فريق بيانات على درجة كبيرة من التخصص، من النوع الذي نجده في مؤسسات، مثل جوجل وفيسبوك. ويكون الحل في مثل هذه الحالة، هو إيجاد منتجات وتقديم حلول "مناسبة للهدف"، تتمتع بالقدرة على إزالة أكبر كم ممكن من التعقيد الفني، بحيث يغدو من الممكن وضع قوة البيانات المعقدة في أيدي مستخدمي المشروع. ولمزيد من التوضيح يمكننا في هذا السياق تذكر "ثورة إدارة محتوى الويب" عند مطلع القرن الحالي. ففي ذلك الوقت كانت المواقع الشخصية هي الموضة السائدة، بينما كان "خبراء النطاق" يضيعون أوقاتهم عبثاً في محاولات غير مجدية لإنجاز أشياء غير قابلة للتحقق. وقد نتج عن ذلك ظهور عنق زجاجة في تقنية المعلومات. فكل جزء من أجزاء أي محتوى كان لابد أن يخضع لجدولة أوتشفير معقد من قبل "نخبة تقنية المعلومات". كيف أمكن حل تلك المسألة؟ كل ما فعله القائمون على حلها في ذلك الوقت هو أنهم قاموا بتعميم وتجريد الاحتياجات الأساسية، ومن ثم وضعها في منظومات إدارة محتوى الويب على نحو يجعل استخدامها ميسراً لغير التقنيين. قد يكون من المفيد إجراء مزيد من التنقيب في الأدوار الثلاثة لعلماء البيانات في عالم اليوم: - بنية البيانات: مفتاح تقليص التعقيد في تلك البيانات، هو تضييق النطاق الذي تستخدم فيه. ومن المعروف أن أي مشروع تجاري يهتم بمعرفة سلوك المستهلكين، وارتباطاتهم، واهتماماتهم، ومشترياتهم، ومعلوماتهم الاجتماعية، كما أن كل مشروع لديه كتالوج، أو أرشيف لكل مستخدم على حدة. -التعليم الآلي: إننا بحاجة إلى خبراء البيانات في مجال التعليم الآلي … أليس كذلك؟ حسناً، قد يكون ذلك صحيحاً إذا ما كان لدى كل مشروع احتياجات محددة في هذا المجال. لكن البيانات المعقدة المستمدة من أجهزة تقديم التوصيات ومنظومات التشخيص التي تعمل على المواءمة بين الاحتياجات والرغبات الشخصية، يمكن الاستغناء عنها. -التحليليات (الأدوات والتطبيقات التحليلية): رغم ذلك، يجب عدم إنكار أنه لم يكن من السهولة بمكان في ذلك الحين تعويم التحليلات والاستبصارات التقنية الأكثر قيمة، عبر الاستعانة بالكم المتاح من البيانات. فهناك طريقة لتقديم عدسات خاصة بكل نطاق من النطاقات، تسمح لخبراء الأعمال بالتجريب على نحو قريب الشبه بما يفعله علماء البيانات. ويبدو حل هذه المشكلة هو الأكثر سهولة، حيث توجد تشكيلة من المنتجات التحليلية الخاصة بكل نطاق من النطاقات، مطروحة في الأسواق. لكن المشكلة هي أن تلك المنتجات لا تزال أكثر تقييداً، وأقل توافراً لخبراء النطاق مما يجب أن تكون عليه في الواقع. ورغم أنه توجد بالقطع منتجات أكثر "صداقة"، إلا أننا نحتاج أيضاً إلى أن نضع في اعتبارنا تلك الطريقة التي تتعلم بها الأجهزة من النتائج التي توفرها الأدوات والتطبيقات التحليلية. وتمثل هذه الطريقة حلقة التغذية المرتدة الحرجة التي قد يرغب خبراء الأعمال في إجراء تعديلات عليها من وقت لآخر، لتعظيم الفائدة المستمدة منها. إلا أن هذه الحلول لن تكون قادرة على حل كل المشكلات التي تعترضنا في أي وقت. لكن مما لا شك فيه أن تطبيق الحلول التقنية لطائفة أكثر اتساعاً من الموضوعات المتعلقة بالبيانات سوف يؤدي إلى تخفيف الضغط الذي يمثله عنق الزجاجة الذي يواجهه العلماء، والذي سبقت الإشارة إليه. بعد كل ذلك، ربما ندخل ذات يوم فصلاً جديداً من البيانات المعقدة يمكن لكل واحد منا أن يتعلم فيه من الآخر، بل ويمكن أن يحدث هذا في الوقت نفسه الذي تتمكن فيه البيانات المعقدة من حل قدر من المشكلات أكبر من الذي تخلقه. سكوت بريف كاتب أميركي متخصص في شؤون العلوم والتقنية ينشر بترتيب خاص مع خدمة "واشنطن بوست وبلومبيرج نيوز سيرفس"