ابق على اطلاع مع التحديثات المجانية
ببساطة الاشتراك في الذكاء الاصطناعي Myft Digest – يتم تسليمها مباشرة إلى صندوق الوارد الخاص بك.
تقول Openai إنها وجدت دليلًا على أن شركة Deepseek التي تفيد بأنها شركة Deepseek ، وهي شركة Intelligence Starting الصينية ، قد استخدمت نماذج الملكية الأمريكية لتدريب منافسها المفتوح المصدر ، حيث تنمو المخاوف على خرق محتمل للملكية الفكرية.
أخبرت شركة ChatGpt Maker التي تتخذ من سان فرانسيسكو مقراً لها لصحيفة Financial Times أنها شهدت بعض الأدلة على “التقطير” ، وهي تقنية يستخدمها المطورون للحصول على أداء أفضل على نماذج أصغر باستخدام مخرجات من نماذج أكبر وأكثر قدرة. هذا يسمح لهم بتحقيق نتائج مماثلة في مهام محددة بتكلفة أقل بكثير.
ورفض Openai التعليق بشكل أكبر على تفاصيل أدلةها. لا يمكن لمستخدمي حالة الخدمة “نسخ” أي من خدماتها أو “استخدام الإخراج لتطوير النماذج التي تتنافس مع Openai”.
لقد فاجأ إصدار Deepseek لنموذج التفكير R1 الأسواق ، وكذلك المستثمرين وشركات التكنولوجيا في وادي السيليكون ، بسبب أدائها المثير للإعجاب في المهام المعرفية. حققت نماذجها المدمجة على تصنيفات عالية ونتائج مماثلة لقيادة النماذج الأمريكية. انخفضت الأسهم في NVIDIA بنسبة 17 في المائة يوم الاثنين ، حيث قضت 589 مليار دولار من قيمتها السوقية ، على المخاوف من أن الاستثمارات الكبيرة في أجهزة AI باهظة الثمن قد لا تكون هناك حاجة إليها. تعافوا بنسبة 9 في المائة يوم الثلاثاء.
قال شخص قريب من Openai إن التقطير كان ممارسة شائعة في الصناعة وأبرز أن الشركة تقدم للمطورين طريقة للقيام بذلك باستخدام منصتها الخاصة ، لكنه قال: “المشكلة هي عندما تفعل ذلك لإنشاء نموذج خاص بك أغراضك الخاصة. “
أجرت Microsoft و Openai تحقيقات في الحسابات التي يُعتقد أنها خريف Deepseek الأخير الذي كان يستخدم واجهة برمجة تطبيق Openai ، أو API ، وحظروا وصولهم إلى الشك في التقطير الذي ينتهك شروط الخدمة ، وشخص آخر يتمتع بمعرفة مباشرة ، وكما هو أول ما تم الإبلاغ عنه. بقلم بلومبرج.
ورفضت Microsoft التعليق ولم ترد Openai على الفور على هذه التفاصيل. لم يرد Deepseek على الفور على طلب للتعليق.
في وقت سابق ، قال الرئيس دونالد ترامب من الذكاء الاصطناعى و Crypto tsar David Sacks “من الممكن” حدوث سرقة IP.
“هناك تقنية في الذكاء الاصطناعى تسمى التقطير. . . عندما يتعلم أحد النماذج من نموذج آخر (و) نوع من تمتص المعرفة من نموذج الوالدين “، أخبر Sacks Fox News يوم الثلاثاء.
وأضاف ساكس: “هناك أدلة جوهرية على أن ما فعله ديبسيك هنا هو أنهم قاموا بتقطير المعرفة من نماذج Openai ، ولا أعتقد أن Openai سعيدًا جدًا بهذا” ، على الرغم من أنه لم يقدم دليلًا.
قالت Deepseek إنها تستخدم فقط 2048 بطاقة رسومات NVIDIA H800 و 5.6 مليون دولار لتدريب طراز V3 الخاص بها مع 671 مليار معلمات ، وهو جزء من ما إنفاقه Openai و Google لتدريب الطرز ذات الحجم المماثل. أشار بعض الخبراء إلى كيفية توليد النموذج الذي أوضح الاستجابات التي أشارت إلى أنه تم تدريبها على المخرجات من GPT-4 من Openai ، والتي من شأنها أن تنتهك شروط الخدمة.
يقول المطلعون على الصناعة أنه في الواقع ، من الممارسات الشائعة لمختبرات الذكاء الاصطناعى ، سواء في الصين أو الولايات المتحدة ، استخدام المخرجات من الشركات الرائدة مثل Openai.
استثمر قادة الصناعة مثل Openai في توظيف أشخاص لتعليم نماذجهم كيفية إنتاج الردود التي تبدو أكثر إنسانية. هذا مكلف ومكثف في العمال ، ويقول المطلعون على الصناعة إنه من الشائع للاعبين الصغار أن يتخلصوا من عملهم.
وقال ريتويك غوبتا ، مرشح الدكتوراه في منظمة العفو الدولية في جامعة كاليفورنيا ، بيركلي ، “إنها ممارسة شائعة للغاية بالنسبة للشركات الناشئة والأكاديميين لاستخدام المخرجات من LLMs التجارية المحاذاة البشرية ، مثل Chatgpt ، لتدريب نموذج آخر”.
هذا يعني أنك تحصل على خطوة التعليقات البشرية مجانًا. ليس من المستغرب بالنسبة لي أن ديبسيك من المفترض أن يفعل الشيء نفسه. إذا كانوا ، فإن إيقاف هذه الممارسة على وجه التحديد قد يكون أمرًا صعبًا “.
تبرز هذه الممارسة أيضًا صعوبة الشركات الحدودية في الذكاء الاصطناعي في كيفية الدفاع عن حافةها التقنية عندما تتمكن المجموعات الأخرى من التخلص من نماذجها.
استوعبت الشركات الصينية الدروس بسرعة من نظرائها في الولايات المتحدة مع ابتكار النهج لزيادة عددها المحدود من الرقائق ، مما يجعل من أرخص تدريب وتشغيل النماذج.
وأضاف Openai في بيان “نعلم أن الشركات التي تعتمد على (الصين)-وغيرها-تحاول باستمرار تمييز نماذج قيادة شركات AI الأمريكية”.
“نحن ننخرط في تدابير مضادة لحماية عنوان IP الخاص بنا ، بما في ذلك عملية دقيقة يتم من خلالها إدراج القدرات الحدودية في النماذج التي تم إصدارها ، ونؤمن بأننا نتقدم إلى الأمام أنه من المهم للغاية أننا نعمل عن كثب مع حكومة الولايات المتحدة لحماية أفضل ما يمكن أن تكون قادرًا نماذج من الجهود التي بذلتها الخصوم والمنافسين لأخذ التكنولوجيا الأمريكية. “
تقاتل Openai حاليًا مزاعم عن انتهاك حقوق الطبع والنشر الخاصة بها من الصحف ومبدعي المحتوى ، بما في ذلك الدعاوى القضائية من صحيفة نيويورك تايمز والمؤلفين البارزين ، الذين يتهمون الشركة بتدريب نماذجهم على مقالاتهم وكتبهم دون إذن.