درجة ثقة المجتمعموثّق
بروتوكول Story لم يعد موجودًا. تحيا مؤسسة DATA — وإعادة التسمية ليست مجرد تغيير شكلي. لقد أعادت المنظمة تموضعها بالكامل، مبتعدة عن هويتها السابقة لتصبح مزودًا لمجموعات البيانات القابلة للترخيص، مستهدفة بشكل مباشر شركات الذكاء الاصطناعي التي نفدت لديها البيانات المتاحة على الإنترنت.
إنها خطوة حادة، وربما لا يكون التوقيت مصادفة. تطوير الذكاء الاصطناعي يسير بوتيرة سريعة منذ سنوات، والنماذج التي تدعم هذا التقدم تحتاج إلى كميات هائلة من البيانات للتدريب. لفترة من الوقت، بدا الإنترنت المفتوح بلا حدود. لكنه لم يكن كذلك. المختبرات الكبرى للذكاء الاصطناعي اعترفت بهدوء بأنها وصلت إلى حواجز — لا توجد بيانات جديدة، نظيفة، ومنظمة بما يكفي لدفع أداء النماذج قدمًا. النهج القديم المتمثل في الزحف إلى كل زاوية من زوايا الويب يواجه مشاكل قانونية، ومشاكل جودة، وبساطة النفاد. يبدو أن مؤسسة DATA تراهن على أن هذا النقص سيصبح فرصة عمل هيكلية، وليس مجرد عثرة مؤقتة.
ليست رهانًا صغيرًا.
من بروتوكول Story إلى مؤسسة DATA
يمثل الانتقال من بروتوكول Story إلى مؤسسة DATA تحولًا استراتيجيًا متعمدًا. كان بروتوكول Story قد بنى اسمه حول البنية التحتية للملكية الفكرية للمحتوى الرقمي — مثل الترخيص على السلسلة، وحقوق المبدعين، وكل ذلك النظام البيئي. تحتفظ مؤسسة DATA بالمنطق الأساسي للوصول المنظم والمرخص إلى المحتوى لكنها توجهه إلى عميل مختلف: شركات الذكاء الاصطناعي التي تحتاج إلى بيانات تدريب يمكنها استخدامها دون تعرض قانوني.
هذا الجزء الأخير مهم جدًا. واحدة من أقبح المعارك في مجال التكنولوجيا الآن تدور حول ما إذا كان لشركات الذكاء الاصطناعي الحق في التدريب على البيانات التي جُمعت دون إذن صريح. تتراكم الدعاوى القضائية. الناشرون غاضبون. البعض أبرم صفقات؛ الكثير لم يفعل. عرض مؤسسة DATA هو أساسًا: إليكم بيانات يمكنكم ترخيصها بشكل نظيف، استخدموها، ولا تقلقوا بشأن الدعاوى القضائية. بالنسبة للمستشار القانوني في شركة ناشئة متوسطة الحجم في مجال الذكاء الاصطناعي، ربما يكون هذا عرضًا ذا قيمة مقنعة.
تخطط المنظمة لتنفيذ نموذج ترخيص يسمح لشركات الذكاء الاصطناعي بالوصول إلى مجموعات بياناتها واستخدامها. الشروط المحددة؟ لم تُكشف بعد. لم يتم الإعلان عن أي هيكل تسعير، ولم يُعلن عن أي عملاء محددين، ولا تزال شكل الاتفاقيات غامضة. المراقبون في الصناعة ينتظرون.
لماذا أزمة بيانات الذكاء الاصطناعي حقيقية
من الجدير التوقف للحظة. مشكلة ندرة البيانات ليست نظرية — إنها تظهر في الأبحاث وفي اقتصاديات تدريب النماذج. مجموعات البيانات عالية الجودة، المتنوعة، والموسومة بشكل جيد، من الصعب حقًا العثور عليها بالحجم الذي تتطلبه النماذج اللغوية الكبيرة الحديثة والأنظمة متعددة الوسائط. ظهرت البيانات الاصطناعية كإجابة جزئية، لكنها تواجه مشاكلها الخاصة: النماذج المدربة بشكل كبير على البيانات الاصطناعية يمكن أن تنحرف، تلتقط آثارًا، أو تصبح غريبة بطرق يصعب تشخيصها.
لذلك هناك طلب حقيقي على ما تحاول مؤسسة DATA بيعه. السؤال هو ما إذا كان بإمكانهم بالفعل تقديمه على نطاق واسع، وما إذا كانت شروط الترخيص ستكون تنافسية بما يكفي لتختار شركات الذكاء الاصطناعي الدفع بدلاً من الاستمرار في جمع البيانات وتحمل المخاطر القانونية.
هذا غير واضح بعد.
والمنظر التنافسي ليس فارغًا. لقد كانت هناك جهات أخرى تدور حول مساحة البيانات المرخصة لفترة من الوقت — منصات المحتوى، والمنظمات الإخبارية، وسماسرة البيانات المتخصصين. البعض أبرم صفقات كبيرة مع مختبرات الذكاء الاصطناعي الكبرى بالفعل. تدخل مؤسسة DATA سوقًا يتشكل بسرعة، مع لاعبين راسخين وكثير من الأموال المتداولة.
ما الذي يأتي بعد ذلك لمؤسسة DATA
الخطوة التالية للمنظمة ربما تتضمن التحديد. الآن، إعادة التسمية موجودة، والتموضع واضح، لكن العملاء المحتملين لا يمكنهم حقًا تقييم العرض دون معرفة ما هي البيانات الموجودة بالفعل في الكتالوج، وما هي الأسعار، وما هي الضمانات القانونية التي تأتي مع الترخيص. تلك التفاصيل قادمة — أو ينبغي أن تكون كذلك، لأن النافذة لتكون مبكرًا في هذا السوق لن تبقى مفتوحة إلى الأبد.
بالنسبة لصناعة الذكاء الاصطناعي الأوسع، فإن تحول مؤسسة DATA هو نوع من الإشارة. إنها نقطة بيانات أخرى — بلا تلاعب في الكلمات — أن عصر جمع البيانات من الإنترنت بشكل حر يقترب من نهايته. الشركات التي ستكتشف خطوط بيانات نظيفة، قابلة للتوسع، وقانونية مبكرًا ستحظى بميزة حقيقية. أما تلك التي لن تفعل، فستواصل خوض الدعاوى القضائية وشرح لمجالس إدارتها لماذا تستمر تكاليف التدريب في الارتفاع.
بروتوكول Story بنى شيئًا ذو قيمة بنيوية حقيقية. ما إذا كان بإمكان مؤسسة DATA ترجمة ذلك إلى عمل ترخيص بيانات بالحجم الذي تحتاجه شركات الذكاء الاصطناعي هو تحدٍ مختلف تمامًا. إعادة التسمية هي الجزء السهل. توقيع أول عشرة عملاء من الشركات أصعب. توقيع العميل المائة أصعب بكثير.
شروط الترخيص المحددة وتفاصيل الشراكة لا تزال غير معلنة حتى الآن.
الأسئلة الشائعة
ما الذي تقدمه مؤسسة DATA فعليًا لشركات الذكاء الاصطناعي؟
تقدم مؤسسة DATA مجموعات بيانات قابلة للترخيص لشركات الذكاء الاصطناعي التي استنفدت البيانات المتاحة على الإنترنت، مما يضع نفسها كبديل منظم لجمع البيانات من الويب المفتوح.
لماذا أعادت بروتوكول Story تسمية نفسها إلى مؤسسة DATA؟
أعادت بروتوكول Story تسمية نفسها إلى مؤسسة DATA لتحويل تركيزها نحو تلبية احتياجات البيانات المتزايدة لشركات الذكاء الاصطناعي، منتقلة من هويتها السابقة كبنية تحتية للملكية الفكرية إلى أن تصبح موردًا مخصصًا لترخيص البيانات.





