البيانات المفتوحة (Open Data)

يشهد العالم تحولاً عالمياً كبيراً تيسره التكنولوجيا ووسائط الإعلام الرقمية، وتغذيه البيانات والمعلومات، وينطوي هذا التحول على إمكانات هائلة لتشجيع إجراء بحوث أكثر شفافية، ومساءلة، وكفاءة، واستجابة، وفعالية، ولا تُنشر سوى نسبة ضئيلة جداً من البيانات الأصلية في المجلات التقليدية، وعلى الرغم من السياسات القائمة بشأن أرشفة البيانات، فإن بيانات الممارسة اليوم تُخزن في المقام الأول في ملفات خاصة، وليس في مستودعات مؤسسية آمنة، لا يتمكن احد من الوصول لها أو الاطلاع عليها (وفي كثير من الأحيان حتى الباحث الذي أصدر البيانات)،

ويُشكّل هذا النقص في مشاركة البيانات (Data Sharing) عقبةً أمام البحوث الدولية (سواء أكانت أكاديمية، أو حكومية، أو تجارية) لسببين رئيسين هما:

  1. من الصعب أو من المستحيل عموماً إعادة إنتاج دراسة (Reproduce) دون البيانات الأصلية.

  2. و لا يمكن للباحثين الآخرين إعادة استخدام البيانات أو إدماجها في أعمال جديدة إذا لم يتمكنوا من الوصول إليها.

وبناءاً على ذلك، هناك ثورة عالمية جارية في مجال البيانات تسعى إلى تعزيز التعاون وإنشاء وتوسيع برامج بحوث فعالة تَتَّسم بالكفاءة. وعليها فإن البيانات المفتوحة ضرورية لتحقيق هذه الأهداف، أي أن تكون متاحة مجاناً على الإنترنت. ويُسمح لأي مستخدم بتنزيلها أو نسخها أو تحليلها أو معالجتها أو إعادة استخدامها لأي غرض آخر مع حواجز مالية، وقانونية، وتقنية أقل.

وهذا يمثل تحولاً حقيقياً في كيفية عمل البحوث. حيث بدأ المموّلون في مطالبة الباحثين بإتاحة بياناتهم وتقديم خطط إدارة البيانات خطط إدارة البيانات كجزء من مقترحات المشروع، وفي الوقت الراهن، كثيراً ما يتعيَّن على أي شخص يرغب في استخدام بيانات من أحد الباحثين أن يتصل بذلك الباحث وأن يقدم طلباً، وإذا كان الوصول إلى البيانات مقيداً، لأسباب أمنية على سبيل المثال، فينبغي توضيح مبررات ذلك، وإذا كان الوصول إلى البيانات مقيداً، لأسباب أمنية على سبيل المثال، فينبغي توضيح مبررات ذلك، ثم إن وحرية الوصول إلى البيانات واستخدامها فيما بعد، يُعد ذا قيمة كبيرة للمجتمع والاقتصاد، ولذلك ينبغي أن تكون تلك البيانات مفتوحة بشكل تلقائي وألا تكون مغلقة إلا عند الضرورة.

يمكنك العثور على المزيد حول الخطوات العملية لجعل بياناتك متاحة في القسم الذي يصف خطوات مشاركة البيانات في الفصل الفرعي: مشاركة وأرشفة البيانات.

عوائق مشاركة البيانات (Data Sharing)

يجد العديد من الأكاديميين أن مشاركة البيانات أمر صعب. وأوضحت الدراسات الاستقصائيّة الأخيرة [] التي أُجريت بين الباحثين تسرد الأسباب التالية:

  • تنظيم البيانات بطريقة قابلة للعرض ومفيدة يُعدّ أمراً صعباً (كما ذكر 46 في المائة من الأشخاص).

  • الباحثون غير متيقِّنين من حقوق النشر والتأليف والترخيص (كما ذكر 37 في المائة من الأشخاص).

  • كما انه لا يعرف الباحثون أي مستودع يمكن استخدامه لأنواع مختلفة من البيانات (كما ذكر 33 في المائة).

وهذه تحديات ثقافية يمكن التصدي لها في الممارسة المتغيرة التي تمضي قدماً. بَيد أن هناك أيضاً أسباباً قانونية أو أخلاقية أو تعاقدية تحول أحياناً دون إتاحة البيانات للجمهور بكاملها أو حتى أجزاء منها، بَيد أن هناك أيضاً أسباباً قانونية أو أخلاقية أو تعاقدية تحول أحياناً دون إتاحة البيانات للجمهور بكاملها أو حتى أجزاء منها،

الخصوصية و حماية البيانات (Data Protection)

تنطوي العديد من مجالات البحث على العمل بالبيانات الشخصية الحساسة، علماً بأن البحوث الطبية هي أوضح مثال على ذلك. ويجب حماية الأفراد من إعادة تحديد هُوِيَّتهم عن طريق بياناتهم المستخدمة في البحوث، وقد يكون إخفاء هُوِيَّة البيانات كافياً في بعض الحالات، ولكن ضمان عدم إمكانية إعادة تحديد الهُوِيَّة يُصبح صعباً بصورة متزايدة وذلك بسبب التقدم التقني، ونُموّ الطاقة الحاسوبية، - ومن المفارقات العجيبة - نُموّ البيانات المفتوحة، فعلى سبيل المثال، قد يكون من الممكن تحديد الهُوِيَّة عن طريق التنقيب في البيانات التي يمكن الوصول إليها وما يسمى بأشباه المُعرفات، وهي مجموعة من الخصائص (المشتركة) المحددة ــ في تركيبها ــ بحيث يمكن استخدامها للتعرف على الأفراد،

وقد يظَل الحفاظ على الخصوصية ممكناً إذا تم توفير مجموعات بيانات جزئية أو عامة. على سبيل المثال، من الممكن أن تُقَدِّم نطاقات عُمرية بدلاً من تاريخ الميلاد أو أول رقمين فقط من الرموز البريدية، وقد يكون من الممكن أيضاً توفير البيانات في شكل يُتيح للباحثين الاستفسار عنها مع إبقاء البيانات نفسها مغلقة، على سبيل المثال، قد يكون المستخدم قادراً على إرسال استفسار لاسترداد متوسط مجموعة البيانات، ولكن لا يمكنه الوصول إلى أي من نِقَاط البيانات الفردية،

وتنطوي العديد من مجالات التخصصات العلمية على العمل بالبيانات الشخصية الحساسة، وتُنظَّم إدارتها تنظيماً جيّداً في تشريعات حماية البيانات (في أوروبا من خلال التنفيذ الوطني للقواعد العامة لحماية البيانات) والإجراءات الأخلاقية كما هي راسخة في معظم مؤسسات البحث [].

إخفاء الهُوِيَّة (Anonymisation)

يجب حماية الأفراد من إعادة تحديد هُوِيَّتهم عن طريق بياناتهم قد يكون إخفاء الهُوِيَّة (Anonymisation) البيانات كافياً في بعض الحالات، ولكن ضمان عدم إمكانية إعادة تحديد الهُوِيَّة يُصبح صعباً بصورة متزايدة، وقد يكون ذلك مستحيلاً بسبب التقدم التقني، ونُموّ الطاقة الحاسوبية، - ومن المفارقات العجيبة - نُموّ البيانات المفتوحة،

فعلى سبيل المثال، قد يكون من الممكن تحديد الهُوِيَّة عن طريق التنقيب في البيانات (data-mining) التي يمكن الوصول إليها وما يسمى بأشباه المُعرفات، وهي مجموعة من الخصائص (المشتركة) المحددة ــ في تركيبها ــ بحيث يمكن استخدامها للتعرف على الأفراد، والحفاظ على الخصوصية قد يظّل ممكناً إذا تم توفير مجموعات بيانات جزئية أو عامة، مثل الفئات العمرية بدلاً من تاريخ الميلاد أو أول رقمين فقط من الرموز البريدية، وقد يكون من الممكن أيضاً توفير البيانات في شكل يُتيح للباحثين الاستفسار عنها مع إبقاء البيانات نفسها مغلقة، على سبيل المثال، قد يكون المستخدم قادراً على إرسال استفسار لاسترداد متوسط مجموعة البيانات، ولكن لا يمكنه الوصول إلى أي من نِقَاط البيانات الفردية. وهناك طريقة أخرى لتوفير البيانات المخفية الهُوِيَّة وهي توفير (synthetic data) البيانات التركيبية، البيانات التي تم إنشاؤها لتَعكس ظروف وخصائص البيانات الأوليَّة، دون أن تتضمن أي معلومات شخصية.

البيانات الوطنيَّة والتجاريَّة الحسَّاسة

في كثير من الحالات، يكون من المفهوم أن الشركات لا ترغَب في نشر الكثير من بياناتها، ويذهب المنطق إلى أنه إذا تم الكشف عن معلومات حسّاسة تجارياً لشركة ما، فإن ذلك من شأنه أن يضّر بالمصالح التجارية للشركة ويُقوِّض قدرتها التنافسية، ويستند ذلك إلى الاعتقاد بأن الابتكار في الأسواق التنافسيّة لن يحدث إلا بقدر من الحماية للمعلومات، وإذا ما أنفقت الشركة وقتاً وأموالاً لتطوير شيء جديد، تُعلن تفاصيله بعد ذلك. ثم يستطيع منافسوها نسخه بسهولة دون أن يضطروا إلى استثمار نفس الموارد، والنتيجة أنه لن يبتكر أحد في المقام الأول، وعلى نحو مماثل، وفيما يتعلق بمخاوف السلامة العامة، فإن الحكومات غالبًا ما تكون غير مستعدة لنشر البيانات التي تتعلق بقضايا مثل الأمن القومي. وفي مثل هذه الحالات، قد لا يكون من الممكن جَعل البيانات مفتوحة، أو قد يكون من الممكن فقط مشاركة مجموعات البيانات الجزئية / المحجوبة،

الفصل: تم تنسيق هذا الفصل لـ مجموعة دراسة البيانات تورينج (turing-dsg