تواجه شركة آبل، عملاق التكنولوجيا العالمي، اتهامات خطيرة تتعلق باستخدامها لمحتوى منصة يوتيوب لتدريب نماذج الذكاء الاصطناعي الخاصة بها دون الحصول على إذن من صناع المحتوى أو تعويضهم. هذه الاتهامات أدت إلى رفع دعوى قضائية جماعية، مما يسلط الضوء على الجدل المتزايد حول أخلاقيات جمع البيانات لتدريب الذكاء الاصطناعي وحقوق الملكية الفكرية في العصر الرقمي.
خلفية القضية: مجموعة بيانات "The Pile" و"YouTube Subtitles"
تتركز الاتهامات حول استخدام آبل، وشركات أخرى مثل Nvidia وAnthropic وSalesforce، لمجموعة بيانات تُعرف باسم "The Pile"، والتي تحتوي على جزء فرعي يسمى "YouTube Subtitles" . هذه المجموعة، التي أنشأتها منظمة EleutherAI غير الربحية، تتكون من نصوص ترجمات (subtitles) مأخوذة من آلاف مقاطع فيديو يوتيوب. ورغم أن EleutherAI تهدف إلى خفض حواجز تطوير الذكاء الاصطناعي، إلا أن استخدام هذه البيانات من قبل شركات عملاقة أثار تساؤلات حول مدى قانونية وأخلاقية هذا الاستخدام.
وفقًا للتحقيقات، تم سحب نصوص ترجمات من 173,536 مقطع فيديو على يوتيوب، من أكثر من 48,000 قناة، واستُخدمت لتدريب نماذج الذكاء الاصطناعي . وقد شملت هذه المقاطع قنوات تعليمية شهيرة مثل Khan Academy وMIT وHarvard، بالإضافة إلى قنوات إخبارية ومنصات إعلامية كبرى مثل The Wall Street Journal وNPR وBBC. كما تضمنت قنوات لنجوم يوتيوب مثل MrBeast وMarques Brownlee وJacksepticeye وPewDiePie .
الدعوى القضائية الجماعية ضد آبل
في أبريل 2026، رفعت ثلاث قنوات يوتيوب دعوى قضائية جماعية مقترحة ضد آبل في المحكمة الجزئية الأمريكية للمنطقة الشمالية من كاليفورنيا . المدعون هم Ted Entertainment، المالكون لقنوات h3h3Productions، بالإضافة إلى قناتي الغولف MrShortGameGolf وGolfholics .
تتهم الدعوى آبل بانتهاك قانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية (DMCA) من خلال تجاوز إجراءات الحماية الخاصة بيوتيوب لجمع مقاطع الفيديو. ويزعم المدعون أن آبل استخدمت أدوات وتقنيات، مثل أجهزة الكمبيوتر ذات عناوين IP المتغيرة، لجمع البيانات بشكل غير قانوني .
وتشير الدعوى إلى أن آبل استخدمت هذه البيانات لتدريب نموذجها للذكاء الاصطناعي "Apple AI Video"، مستشهدة بورقة بحثية أكاديمية من باحثي آبل تكشف عن تدريب النموذج باستخدام مجموعة بيانات "Panda-70M"، والتي وصفت بأنها تتكون بالكامل من مقاطع فيديو يوتيوب تم جمعها عن طريق السحب (scraping) .
يطالب المدعون في الدعوى القضائية بتعويضات قصوى، وأمر قضائي يمنع آبل من مواصلة الانتهاك، ورسوم المحاماة، وتكاليف أخرى، بالإضافة إلى إعلان بأن آبل تعمدت التحايل على أنظمة حماية حقوق الطبع والنشر .
وجهة نظر صناع المحتوى
يعبر العديد من صناع المحتوى عن غضبهم وشعورهم بالسرقة. صرح ديفيد باكمان، مقدم برنامج "The David Pakman Show"، الذي تم استخدام ما يقرب من 160 من مقاطع الفيديو الخاصة به، بأنه لم يطلب منه أحد الإذن باستخدام محتواه. وأكد باكمان أنه إذا كانت شركات الذكاء الاصطناعي تحقق أرباحًا، فيجب تعويضه عن استخدام بياناته، خاصة وأن هذا المحتوى هو مصدر رزقه .
وصف ديف ويسكوس، الرئيس التنفيذي لـ Nebula (خدمة بث يمتلكها جزئيًا صناع المحتوى)، هذا الاستخدام بأنه "سرقة" و"عدم احترام" لعمل المبدعين، خاصة وأن الذكاء الاصطناعي التوليدي قد يحل محل الفنانين في المستقبل .
موقف يوتيوب والشركات الأخرى
تنص شروط خدمة يوتيوب على حظر الوصول إلى مقاطع الفيديو الخاصة بها "بوسائل آلية" . ومع ذلك، فإن جوجل، المالكة ليوتيوب، صرحت في وقت سابق لصحيفة The New York Times بأن استخدامها لمقاطع الفيديو لتدريب نماذجها كان مسموحًا به بموجب اتفاقيات مع منشئي المحتوى .
آبل ليست الشركة الوحيدة المتهمة في هذا الصدد. فقد كشفت التحقيقات أن شركات أخرى مثل OpenAI وMeta وNvidia واجهت اتهامات مماثلة باستخدام محتوى يوتيوب أو بيانات محمية بحقوق الطبع والنشر لتدريب نماذجها . وقد أثارت هذه القضايا جدلاً واسعًا حول مفهوم "الاستخدام العادل" في سياق تدريب الذكاء الاصطناعي.
