المؤلف: دانييل باراباندر، المستشار العام والشريك في Variant Fund؛ تم إعداده بواسطة: 0xjs@金财经
النقاط الرئيسية لهذه المقالة
في الوقت الحالي، يهيمن عدد قليل من شركات التكنولوجيا على تطوير الذكاء الاصطناعي الأساسي، وهو في حالة مغلقة وغير تنافسية.
يعد تطوير البرمجيات مفتوحة المصدر خيارًا آخر، ولكن لا يمكن تطوير الذكاء الاصطناعي الأساسي كمشروع برمجي تقليدي مفتوح المصدر (مثل Linux) لأنه يحتوي على "مشكلات في الموارد" ومفتوح المصدر. المساهمات يُطلب من المشاركين أيضًا التبرع بتكاليف الحوسبة والبيانات بما يتجاوز إمكانياتهم الشخصية.
يعمل التشفير على حل مشكلة الموارد من خلال تحفيز موفري الموارد على المساهمة في مشاريع الذكاء الاصطناعي الأساسية مفتوحة المصدر من خلال الملكية.
يمكن أن يدعم الذكاء الاصطناعي مفتوح المصدر مع التشفير نماذج أكبر ويحفز المزيد من الابتكار، مما يؤدي إلى تحسين الذكاء الاصطناعي.
مقدمة
أظهر استطلاع أجراه مركز بيو للأبحاث عام 2024 أن 64% من الأمريكيين يعتقدون أن وسائل التواصل الاجتماعي كان لها تأثير تأثير سلبي وليس إيجابي على الولايات المتحدة، حيث قال 78% إن شركات وسائل التواصل الاجتماعي لديها الكثير من القوة والتأثير في سياسة اليوم، وقال 83% إن المنصات من المحتمل أو من المحتمل جدًا أن تفرض رقابة متعمدة على الآراء السياسية التي لا يتفقون معها. يعد النفور من منصات التواصل الاجتماعي إحدى القضايا القليلة التي توحد الأمريكيين.
إذا نظرنا إلى التقدم الذي أحرزته تجارب وسائل التواصل الاجتماعي على مدار العشرين عامًا الماضية، يبدو أنه من المحتم أن ينتهي بنا الأمر إلى حيث نحن الآن. تعلمون جميعا القصة. في البداية، جذبت مجموعة من شركات التكنولوجيا الكبرى الاهتمام، والأهم من ذلك، بيانات المستخدم. وبينما كان من المأمول في البداية أن يتم نشر البيانات للعامة، سرعان ما عكست الشركات مسارها وأغلقت الوصول بعد استخدام البيانات لإنشاء تأثيرات شبكة غير قابلة للكسر. وقد أدى هذا بشكل أساسي إلى الوضع الحالي، حيث توجد أقل من اثنتي عشرة شركة كبيرة لوسائل التواصل الاجتماعي التكنولوجية مثل إقطاعيات إقطاعية صغيرة في احتكار القلة، مع عدم وجود حافز للتغيير لأن الوضع الراهن مربح للغاية. إنه مغلق وغير تنافسي.
بالنظر إلى ما تتجه إليه تجارب الذكاء الاصطناعي حاليًا، أشعر وكأنني أشاهد الفيلم نفسه مرارًا وتكرارًا، ولكن هذه المرة أصبح الأمر أكثر تعقيدًا. قامت مجموعة من شركات التكنولوجيا الكبرى بتجميع وحدات معالجة الرسومات والبيانات لبناء نماذج الذكاء الاصطناعي الأساسية ومنعت الوصول إلى تلك النماذج. لم يعد من الممكن للداخلين الجدد (الذين لم يجمعوا مليارات الدولارات) بناء إصدارات منافسة لأن حواجز الدخول مرتفعة للغاية - فالنفقات الرأسمالية الحسابية لمجرد التدريب المسبق على النموذج الأساسي تبلغ مليارات الدولارات، ومن تستخدم شركات وسائل التواصل الاجتماعي التي استفادت من الطفرة التكنولوجية الأخيرة سيطرتها على بيانات المستخدم الخاصة لبناء نماذج لا يستطيع المنافسون القيام بها. نحن منخرطون بشكل كامل في إعادة إنشاء ما قمنا به في وسائل التواصل الاجتماعي في الذكاء الاصطناعي: كوننا منغلقين وغير تنافسيين. إذا واصلنا السير على هذا المسار من الذكاء الاصطناعي المغلق، فسوف تتمتع حفنة من شركات التكنولوجيا بسيطرة غير مقيدة على الوصول إلى المعلومات والفرص.
الذكاء الاصطناعي مفتوح المصدر و"مشكلة الموارد"
إذا كنا لا نريد عالمًا مغلقًا للذكاء الاصطناعي، فما هي البدائل المتاحة لنا؟ الجواب الواضح هو بناء النموذج الأساسي كمشروع برمجي مفتوح المصدر. لدينا أمثلة لا حصر لها من المشاريع مفتوحة المصدر التي تبني البرامج الأساسية التي نعتمد عليها كل يوم. إذا أظهر Linux أن شيئًا أساسيًا مثل نظام التشغيل يمكن بناؤه مفتوح المصدر، فما الفرق الذي ستحدثه LLM؟
لسوء الحظ، تعاني نماذج الذكاء الاصطناعي الأساسية من قيود تجعلها مختلفة عن البرامج التقليدية، مما يعيق بشدة قدرتها على البقاء كمشاريع برمجيات تقليدية مفتوحة المصدر. وعلى وجه التحديد، تتطلب نماذج الذكاء الاصطناعي الأساسية نفسها موارد حاسوبية وبيانات تتجاوز قدرات أي فرد. والنتيجة هي أنه، على عكس مشاريع البرمجيات التقليدية مفتوحة المصدر التي تعتمد على تبرع الأشخاص بوقتهم (وهي مشكلة صعبة بالفعل)، يتطلب الذكاء الاصطناعي مفتوح المصدر أيضًا من الأشخاص التبرع بالموارد في شكل حوسبة وبيانات. هذه هي "مشكلة الموارد" للذكاء الاصطناعي مفتوح المصدر.
لفهم مشكلة الموارد بشكل أفضل، دعونا نلقي نظرة على نموذج LLaMa الخاص بـ Meta. تختلف Meta عن منافسيها (OpenAI وGoogle وما إلى ذلك) من حيث أنها لا تخفي النموذج خلف واجهة برمجة التطبيقات المدفوعة، ولكنها بدلاً من ذلك تجعل أوزان LLaMa متاحة بشكل مفتوح لأي شخص لاستخدامها مجانًا (مع بعض القيود). تمثل هذه الأوزان ما تعلمه النموذج من Meta أثناء تدريبه وهو مطلوب لتشغيل النموذج. مع وجود الأوزان في مكانها الصحيح، يمكن لأي شخص ضبط النموذج أو استخدام مخرجات النموذج كمدخل لنموذج جديد.
على الرغم من أن Meta تستحق الثناء لنشر أوزان LLaMa، إلا أنها ليست مشروعًا برمجيًا مفتوح المصدر حقيقيًا. تقوم Meta بتدريب النموذج بشكل خاص باستخدام حساباتها وبياناتها وقراراتها الخاصة، وتقرر من جانب واحد متى تجعل النموذج متاحًا للعالم. لا تدعو Meta الباحثين/المطورين المستقلين للمشاركة في المجتمع لأن أعضاء المجتمع الفرديين لا يستطيعون تحمل تكاليف الموارد الحاسوبية أو البيانات اللازمة لتدريب النماذج أو إعادة تدريبها - عشرات الآلاف من وحدات معالجة الرسومات عالية الذاكرة، ومراكز البيانات لإيوائها، ومرافق البنية التحتية الضخمة للتبريد. وتريليونات من رموز بيانات التدريب. وكما جاء في تقرير مؤشر الذكاء الاصطناعي لعام 2024 الصادر عن جامعة ستانفورد، فإن "ارتفاع تكلفة التدريب أدى فعليًا إلى استبعاد الجامعات (مراكز أبحاث الذكاء الاصطناعي تقليديًا) من تطوير نماذجها التأسيسية المتطورة الخاصة بها". تبلغ قيمة GPT-4 100 مليون دولار أمريكي، وقد لا تشمل النفقات الرأسمالية؛ زادت النفقات الرأسمالية لشركة Meta بمقدار 2.1 مليار دولار أمريكي على أساس سنوي (الربع الثاني من عام 2024 مقابل الربع الثاني من عام 2023)، وذلك بشكل أساسي من التدريب وتدريب الذكاء الاصطناعي. الاستثمارات في الخادم ومركز البيانات والبنية التحتية للشبكة المرتبطة بالنموذج. ولذلك، في حين أن المساهمين في مجتمع LLaMa قد يكون لديهم القدرة التقنية على المساهمة والتكرار في بنية النموذج الأساسي، إلا أنهم ما زالوا يفتقرون إلى الوسائل اللازمة للقيام بذلك.
باختصار، على عكس مشاريع البرمجيات مفتوحة المصدر التقليدية، التي تتطلب فقط من المساهمين المساهمة بالوقت، يُطلب من المساهمين في مشاريع الذكاء الاصطناعي مفتوحة المصدر المساهمة بالوقت وتكاليف كبيرة في شكل حسابات وبيانات. إن الاعتماد على حسن النية والعمل التطوعي لتحفيز العدد الكافي من الأطراف لتوفير هذه الموارد أمر غير واقعي. إنهم بحاجة إلى المزيد من الحوافز. ولعل أفضل مثال مضاد لفضائل حسن النية والعمل التطوعي في تطوير الذكاء الاصطناعي مفتوح المصدر هو نجاح 176B Parametric Open Source LLM، والذي شارك فيه 1000 باحث متطوع من أكثر من 70 دولة وأكثر من 250 مؤسسة. في حين أن هذا يعد بالتأكيد إنجازًا مثيرًا للإعجاب (وهو إنجاز أؤيده بالكامل)، فقد استغرق تنسيق عملية تدريب واحدة عامًا وحصل على تمويل قدره 3 ملايين يورو من وكالة أبحاث فرنسية (ولم تشمل هذه التكلفة تمويل النفقات الرأسمالية لجهاز كمبيوتر فائق السرعة). تدريب النموذج، أحد هذه النماذج متاح بالفعل لمؤسسة فرنسية). إن عملية التنسيق والاعتماد على المنح الجديدة لتكرارها على BLOOM مرهقة للغاية وبيروقراطية بحيث لا تتناسب مع وتيرة مختبرات التكنولوجيا الكبيرة. على الرغم من مرور أكثر من عامين على إصدار BLOOM، إلا أنني لا أعرف ما إذا كانت المجموعة قد أنتجت أي نماذج متابعة.
لجعل الذكاء الاصطناعي مفتوح المصدر ممكنًا، نحتاج إلى تحفيز مقدمي الموارد للمساهمة بحساباتهم وبياناتهم دون مطالبة المساهمين مفتوحي المصدر بتحمل التكلفة.
لماذا يمكن لشركة Crypto حل مشكلة الموارد الخاصة بالذكاء الاصطناعي مفتوح المصدر
يتمثل التقدم الذي حققته شركة Crypto في استخدام الملكية لإنشاء مشاريع برمجية مفتوحة المصدر بتكاليف موارد عالية ممكنة. تحل العملات المشفرة مشكلة الموارد المتأصلة في الذكاء الاصطناعي مفتوح المصدر من خلال تحفيز موفري الموارد المضاربة مع إمكانية تحقيق مكاسب إيجابية للشبكة، بدلاً من مطالبة المساهمين مفتوحي المصدر بدفع التكاليف الأولية لتوفير هذه الموارد.
لإثبات ذلك، لا تنظر إلى أبعد من مشروع العملة المشفرة الأصلي Bitcoin. البيتكوين هو مشروع برمجي مفتوح المصدر، الكود الذي يقوم بتشغيله مفتوح بالكامل وهو كذلك منذ يوم بدء المشروع. لكن الكود في حد ذاته ليس بمثابة الخلطة السرية؛ فليس هناك فائدة كبيرة في تنزيل برنامج عقدة Bitcoin وتشغيله لإنشاء blockchain موجود فقط على جهاز الكمبيوتر المحلي الخاص بك. يكون البرنامج مفيدًا فقط عندما يكون حساب عدد الكتل الملغومة كبيرًا بما يكفي لتجاوز قوة الحوسبة لأي مساهم واحد. وبهذه الطريقة فقط يمكن تحقيق القيمة المضافة للبرنامج: الاحتفاظ بدفتر أستاذ لا يتحكم فيه أحد. مثل Foundation Open Source AI، تمثل Bitcoin مشروعًا برمجيًا مفتوح المصدر يتطلب موارد تتجاوز قدرات أي مساهم منفرد. قد يحتاجون إلى هذه الحوسبة لأسباب مختلفة - Bitcoin لجعل الشبكة مقاومة للعبث، والذكاء الاصطناعي المؤسسي لتكرار النماذج - ولكن النقطة الأوسع هي أن كلاهما يتطلب موارد تتجاوز احتياجات أي مساهم واحد للعمل كبرنامج مفتوح المصدر قابل للتطبيق مشروع.
إن الخدعة السحرية التي تستخدمها Bitcoin، أو أي شبكة تشفير، لتحفيز المشاركين على المساهمة بالموارد في مشاريع البرمجيات مفتوحة المصدر، هي توفير ملكية الشبكة في شكل رموز مميزة. وكما كتب جيسي في ورقته التأسيسية لشركة Variant في عام 2020، فإن الملكية تحفز مزودي الموارد على المساهمة بالموارد في المشروع مقابل الجانب الإيجابي المحتمل للشبكة. وهذا مشابه لكيفية استخدام رأس المال المجهد لإطلاق شركة ناشئة - من خلال دفع أجور الموظفين الأوائل (مثل المؤسسين) في المقام الأول من خلال ملكية الشركة، يمكن للشركة الناشئة التغلب على مشاكل بدء التشغيل من خلال الوصول إلى القوى العاملة التي لا يمكن تحمل تكاليفها لولا ذلك. تعمل شركة Crypto على توسيع مفهوم المساواة في الجهد ليشمل مقدمي الموارد، وليس فقط أولئك الذين يتبرعون بوقتهم. على هذا النحو، تركز Variant على الاستثمار في المشاريع التي تعزز الملكية لبناء تأثيرات الشبكة، مثل Uniswap وMorpho وWorld.
إذا أردنا أن نجعل الذكاء الاصطناعي مفتوح المصدر ممكنًا، فإن الملكية من خلال التشفير هي الحل لمشاكل الموارد التي تواجهها. يتمتع الباحثون بحرية المساهمة بأفكار تصميم النماذج الخاصة بهم في مشاريع مفتوحة المصدر لأن الموارد اللازمة لتنفيذ أفكارهم سيتم توفيرها من قبل موفري الحوسبة والبيانات مقابل ملكيتهم للمشروع، بدلاً من مطالبة هؤلاء الباحثين بدفع رسوم باهظة التكاليف الأولية . يمكن أن تتخذ الملكية العديد من الأشكال المختلفة في الذكاء الاصطناعي مفتوح المصدر، ولكن أكثر ما يثير حماستي هو ملكية النماذج نفسها، مثل النهج الذي اقترحته شركة Pluralis.
يطلق Pluralis على هذا النهج اسم نموذج البروتوكول، حيث يمكن لموفر الحوسبة المساهمة بموارد الحوسبة لتدريب نموذج محدد مفتوح المصدر والحصول على ملكية إيرادات الاستدلال المستقبلية لهذا النموذج. نظرًا لأن الملكية تنتمي إلى نموذج محدد، وتعتمد قيمة الملكية على إيرادات الاستدلال، فإن موفر الحوسبة لديه حافز لاختيار أفضل نموذج بدلاً من الغش في التدريب (نظرًا لأن توفير تدريب غير مفيد يقلل من القيمة المتوقعة لإيرادات الاستدلال المستقبلية) . يصبح السؤال بعد ذلك: كيفية فرض الملكية على Pluralis إذا كانت الأوزان بحاجة إلى إرسالها إلى مزود الحوسبة للتدريب؟ الجواب هو أن نموذج التوازي يستخدم لتوزيع أجزاء النموذج بين العمال، مما يسمح باستغلال خاصية رئيسية للشبكات العصبية: القدرة على المساهمة في تدريب نموذج أكبر مع رؤية جزء صغير فقط من الأوزان الإجمالية، وبالتالي ضمان اكتمال مجموعة من الأوزان لا تزال غير قابلة للاستخراج. وبما أن العديد من النماذج المختلفة يتم تدريبها على Pluralis، فسيكون لدى المدرب العديد من مجموعات الأوزان المختلفة، مما يجعل إعادة إنشاء النموذج أمرًا صعبًا للغاية. هذا هو المفهوم الأساسي لنماذج البروتوكول: فهي قابلة للتدريب ويمكن استخدامها، ولكن لا يمكن استخلاصها من البروتوكول (دون استخدام أي قوة حاسوبية أكثر مما هو مطلوب لتدريب النموذج من الصفر). يعالج هذا المخاوف التي غالبًا ما يثيرها منتقدو الذكاء الاصطناعي مفتوح المصدر، وهي أن منافسي الذكاء الاصطناعي المغلق سوف يستوليون على ثمار عمل المشاريع المفتوحة.
منظور حول سبب سوء الذكاء الاصطناعي المغلق. ولكن في عالم أصبحت فيه تجاربنا عبر الإنترنت قدرية، أخشى أن هذا قد لا يعني شيئًا بالنسبة لمعظم القراء. لذا في النهاية أريد أن أعطي سببين مفادها أن الذكاء الاصطناعي مفتوح المصدر المدعوم بالعملات المشفرة سيؤدي في الواقع إلى ذكاء اصطناعي أفضل.
أولاً وقبل كل شيء، سيسمح لنا الجمع بين التشفير والذكاء الاصطناعي مفتوح المصدر بالوصول إلى المستوى التالي من النماذج الأساسية لأنه سينسق موارد أكثر من الذكاء الاصطناعي المغلق. يُظهر بحثنا الحالي أن المزيد من الموارد في شكل حوسبة وبيانات يعني نماذج أفضل، ولهذا السبب غالبًا ما تصبح النماذج الأساسية أكبر وأكبر. تُظهر لنا عملة البيتكوين ما يمكن للبرامج مفتوحة المصدر بالإضافة إلى التشفير أن تفتحه من حيث قوة الحوسبة. إنها أكبر وأقوى شبكة حوسبة في العالم، وهي أكبر من سحابات شركات التكنولوجيا الكبرى. التشفير يحول المنافسة المعزولة إلى منافسة تعاونية. يتم تحفيز مقدمي الموارد للمساهمة بمواردهم لحل مشكلة جماعية بدلاً من اكتناز مواردهم لحل هذه المشكلة بشكل فردي (وبشكل زائد عن الحاجة). سيكون الذكاء الاصطناعي مفتوح المصدر الذي يستخدم التشفير قادرًا على الاستفادة من الحوسبة والبيانات الجماعية في العالم لبناء أحجام نماذج تتجاوز بكثير ما هو ممكن مع الذكاء الاصطناعي المغلق. لقد أثبتت شركات مثل Hyperbolic قوة الاستفادة من موارد الحوسبة الجماعية، مما يسمح لأي شخص بتأجير وحدات معالجة الرسومات بسعر أقل في سوقها المفتوحة.
ثانيًا، سيؤدي الجمع بين التشفير والذكاء الاصطناعي مفتوح المصدر إلى تحفيز المزيد من الابتكار. وهذا لأنه إذا تمكنا من التغلب على مشكلات الموارد، فيمكننا العودة إلى طبيعة المصدر المفتوح التكرارية والمبتكرة للغاية لأبحاث التعلم الآلي. قبل تقديم ماجستير إدارة الأعمال الأساسي مؤخرًا، كان باحثو التعلم الآلي يطلقون نماذجهم ومخططاتهم علنًا لتكرارها لعقود من الزمن. تستخدم هذه النماذج عادةً مجموعات بيانات مفتوحة أكثر محدودية ولها متطلبات حسابية يمكن التحكم فيها، مما يعني أنه يمكن لأي شخص التكرار عليها. ومن خلال هذا التكرار أحرزنا تقدمًا في نمذجة التسلسل، مثل RNNs وLSTMs وآليات الانتباه، والتي مكنت بنية نموذج "Transformer" التي تعتمد عليها LLMs الأساسية الحالية. لكن كل ذلك تغير مع إطلاق GPT-3 (الذي عكس اتجاه GPT-2 مفتوح المصدر) والنجاح الكبير الذي حققه ChatGPT. وذلك لأن OpenAI أثبت أنه إذا قمت بتوفير ما يكفي من الحوسبة والبيانات على نماذج ضخمة، فيمكنك بناء ماجستير في القانون يبدو أنه يفهم اللغة البشرية. أدى هذا إلى خلق مشكلات في الموارد جعلت الأبحاث الأكاديمية غير قادرة على تحمل الأسعار المرتفعة، وتسببت في توقف مختبرات شركات التكنولوجيا الكبيرة إلى حد كبير عن إطلاق بنياتها النموذجية علنًا للحفاظ على ميزة تنافسية. إن الوضع الحالي المتمثل في الاعتماد بشكل أساسي على المختبرات الفردية سيحد من قدرتنا على تجاوز حدود التكنولوجيا الحديثة. سيعني الذكاء الاصطناعي مفتوح المصدر الذي يتم تمكينه عن طريق التشفير أن الباحثين سيتمكنون مرة أخرى من مواصلة هذه العملية التكرارية على النماذج المتطورة لاكتشاف "المحول التالي".