لماذا تُعدّ جودة البيانات التي تتضمن تدخلاً بشرياً وأصول البيانات الجاهزة للمحاكاة أمراً لا غنى عنه في الذكاء الاصطناعي ذي الأهمية البالغة للسلامة؟
TELUS Corporation TU | 12.42 | +0.32% |
- تفشل أتمتة التعليقات التوضيحية في الحالات الحرجة المتعلقة بالسلامة حيث يكون الحكم البشري هو الإشارة الموثوقة الوحيدة
- بينما نضجت برامج المركبات ذاتية القيادة من خلال تكوينات أجهزة الاستشعار الموحدة وبنية تحتية لجمع البيانات بشكل مستمر، تواجه برامج الروبوتات نقصًا أكبر بكثير في البيانات المصنفة، مدفوعًا بمجموعات أجهزة الاستشعار غير المتجانسة، وجمع البيانات بشكل متقطع، وغياب معايير تصنيف مقبولة عالميًا.
- تعتمد عمليات التعليق بجودة الإنتاج على انضباط القوى العاملة الذي يحافظ على الاتساق عبر آلاف المعلقين وملايين إطارات المستشعرات
- بالنسبة لفرق المؤسسات التي تعمل على بناء برامج المركبات ذاتية القيادة والروبوتات، يجب أن يشمل تقييم شركاء بيانات الذكاء الاصطناعي شهادات الامتثال، بما في ذلك ISO 27001 وSOC 2 وTISAX.
فانكوفر، كولومبيا البريطانية، 16 أبريل 2026 (جلوب نيوزواير) - غالبًا ما تُعزى أسباب فشل برامج الذكاء الاصطناعي الفيزيائي في بيئة الإنتاج إلى طبقة البيانات. وبحلول أبريل 2026، تباينت بيانات الذكاء الاصطناعي الفيزيائي بشكل حاد حسب نوع البرنامج. فقد شهدت برامج المركبات ذاتية القيادة تطورًا ملحوظًا، مع توحيد تكوينات المستشعرات، وبنية تحتية لجمع البيانات بشكل مستمر، ومعايير تصنيف معتمدة، مما أدى إلى إنتاج مليارات الإطارات المصنفة عبر البرامج الرائدة. أما برامج الروبوتات، فتواجه وضعًا مختلفًا تمامًا: فمجموعات المستشعرات غير المتجانسة، وجمع البيانات بشكل متقطع، وغياب معايير تصنيف مقبولة عالميًا، كل ذلك جعل هذا المجال متخلفًا بشكل كبير، حتى مع تسارع الطلب. وتختلف عواقب فشل التصنيف اختلافًا جذريًا عن مجرد خطأ بسيط في تطبيق ذكاء اصطناعي للمستهلك. فوجود جسم مصنف بشكل خاطئ في سحابة نقاط ليدار يمثل خللًا محتملًا في السلامة. وتتشارك عمليات التصنيف الناجحة في بيئة الإنتاج ست خصائص يسهل إغفالها في المرحلة التجريبية. قامت شركة TELUS Digital ، الرائدة عالمياً في حلول بيانات الذكاء الاصطناعي لبرامج المركبات والروبوتات، بالعمل على جميع هذه البرامج الستة.
يقول ستيف نيمزر، المدير الأول لأبحاث وابتكارات الذكاء الاصطناعي في شركة TELUS Digital: "يمكن إضفاء لمسة من الفخامة على المشاريع التجريبية من خلال عمليات يدوية وأفراد مختارين بعناية، فهي تثبت جدواها. أما عمليات التعليق على مستوى الإنتاج فتُنفذ عبر فرق متنوعة، وعلى نطاق واسع، مع الالتزام بالانضباط اللازم لضمان الاتساق، مما يثبت إمكانية تكرارها. ويكمن الفرق بين المشاريع التجريبية والإنتاج في القدرة على إدارة قوى عاملة واسعة النطاق دون التضحية بالجودة."
حقائق أساسية:
- يضم مجتمع الذكاء الاصطناعي التابع لشركة TELUS Digital أكثر من مليون متخصص في تحليل البيانات واللغويات المدربين في ست قارات.
- تُقدّم شركة TELUS Digital أكثر من ملياري ملصق سنويًا بأكثر من 500 لغة للتعليقات التوضيحية
- تشمل متطلبات الامتثال بالغة الأهمية للسلامة لشركاء بيانات الذكاء الاصطناعي معايير ISO 27001 وTISAX وISO 31700-1 وHITRUST وSOC 2 وGDPR/CCPA
- تدعم منصة Ground Truth Studio من TELUS Digital دمج الكاميرات مع تقنية الليدار، وتقسيم سحابة النقاط ثلاثية الأبعاد، واكتشاف المسارات في المشاهد ثنائية وثلاثية الأبعاد.
ما الذي يميز التعليقات التوضيحية الحساسة للسلامة؟
تواجه فرق المؤسسات التي تعمل على تطوير المركبات ذاتية القيادة والروبوتات تحديات لا يفرضها تطوير الذكاء الاصطناعي للمستهلكين. وتُعدّ جودة البيانات المُعلّمة في الذكاء الاصطناعي المادي مثالًا على هذا التحدي، فهي ليست مجرد متغير ثانوي. فالأفعال الخاطئة في البيئة المادية لها عواقب وخيمة. يجب أن يتطابق المشاة المُحددون في سحابة نقاط الليدار بدقة مع نفس المشاة في إطار الكاميرا وإشارة الرادار. وتؤدي حالات عدم التناسق بين الوسائط المتعددة إلى نماذج إدراكية تُولّد قراءات متضاربة للمشهد نفسه. في المركبات ذاتية القيادة، يُشكّل هذا التضارب خطرًا على السلامة. أما في سياق الروبوتات، فيؤدي إلى عدم القدرة على التصرف أو إلى تصرف خاطئ.
تعكس النقاط التالية أفضل الممارسات في مجال التعليقات التوضيحية الجاهزة للإنتاج على نطاق بالغ الأهمية للسلامة:
1. الحكم البشري على حدود الأتمتة
تُجيد أنظمة التعليق الآلي التعامل مع كميات كبيرة من البيانات المتكررة، لكنها تواجه صعوبة في التعامل مع الحالات الشاذة أو الغامضة. في سيناريوهات العالم الحقيقي، يكون الغموض مرتفعًا وتكون تكلفة الخطأ غير مقبولة.
يقول نيمزر: "يواجه التشغيل الآلي المُعَلَّم عقبةً في الحالات الحرجة المتعلقة بالسلامة، حيث يكون الغموض شديدًا. على سبيل المثال، يُعدّ تفسير إيماءة حارس عبور المشاة أكثر تعقيدًا بكثير من تحديد إشارة التوقف. لا تسعى عمليات التعليق على نطاق واسع إلى الاستغناء عن التقدير البشري. تقوم الأنظمة الآلية بتحديد الحالات ذات درجة عدم اليقين العالية (باستخدام عتبات الثقة، وإشارات عدم الاتفاق، وما إلى ذلك)، ويقوم خبراء التعليق البشريون بحلّها باستخدام أطر عمل منظمة لاتخاذ القرارات".
صُممت مسارات التعليق التوضيحي للإنتاج في مجال الذكاء الاصطناعي الفيزيائي لتكون سريعة الاستجابة. فعندما تواجه الأنظمة الآلية حالاتٍ بالغة التعقيد لا تستطيع حلها بشكلٍ موثوق، تُحال هذه الحالات إلى خبراء بشريين. ويحافظ المسار على كفاءته من خلال السماح للأتمتة بمعالجة المشكلات البسيطة، مع تركيز الجهد البشري تحديدًا حيثما تدعو الحاجة إلى التقييم.
2. الاتساق بين الوسائط المتعددة عبر الليدار والرادار والكاميرا
تُنتج منصات التعليق التي تتعامل حصريًا مع نوع أو نوعين من أجهزة الاستشعار، أو التي تعتبر دمج البيانات خطوة ثانوية، بيانات تدريب غير متناسقة تنتشر في مجموعة البيانات. بالنسبة لبرامج المركبات ذاتية القيادة من المستوى الرابع فما فوق، حيث يجب أن تعمل منظومة الإدراك بكفاءة عالية على سرعات الطرق السريعة في جميع الظروف الجوية والمناطق الجغرافية، يُشكل عدم التناسق بين الوسائط المختلفة خطرًا مباشرًا على البرنامج.
يُعدّ الانحراف الزمني أحد أكثر مصادر عدم التطابق شيوعًا. فحتى فجوة زمنية قدرها 50 مللي ثانية بين لقطات المستشعر تعني أن أحد المشاة الذي تم رصده في الإطار N في بث الكاميرا قد يظهر في الإطار N+2 في بيانات الليدار، مما يُنشئ جسمًا وهميًا لا يملك نموذج الإدراك طريقة موثوقة لتمييزه. عند سرعات الطرق السريعة، تُترجم هذه الفجوة مباشرةً إلى خطأ في التصنيف ينتشر خلال عملية التدريب. تعالج عمليات التعليق التوضيحي عالية الجودة هذه المشكلة من خلال عمليات فحص آلية للتطابق الزمني، تضمن أن كل جسم مُصنّف في بيانات الكاميرا له تصنيف مُطابق مُعتمد في بيانات الليدار والرادار. بالنسبة لفرق المركبات ذاتية القيادة في المؤسسات، يُعدّ هذا أحد أنماط الفشل التي يعرفها شركاء التعليق التوضيحي ذوو الخبرة، والتي لا تُصمّم منصات التصنيف العامة لاكتشافها.
يتطلب تدريب المركبات والروبوتات ذاتية القيادة تصنيف البيانات من مستشعرات متعددة، مع تصنيف كل عنصر بشكل متسق عبر جميعها في آن واحد. صُمم برنامج Ground Truth Studio من TELUS Digital خصيصًا لهذا المستوى من التعقيد. فهو يدعم دمج بيانات الكاميرا مع بيانات الليدار، وتقسيم سحابة النقاط ثلاثية الأبعاد، والتوافق مع مستشعرات الليدار الصلبة واللاسلكية، بالإضافة إلى استيفاء العناصر تلقائيًا لتصنيف الفيديو على نطاق واسع.
3. جاهزية خط أنابيب المحاكاة لتطوير النموذج العالمي
تُعدّ البيانات الاصطناعية المُولّدة في بيئات مثل NVIDIA ISAAC-Sim فعّالة لتدريب أنظمة الذكاء الاصطناعي المُجسّدة. مع ذلك، تواجه النماذج المُدرّبة في بيئة المحاكاة فقط فجوةً جوهريةً في الفيزياء عند تطبيقها في العالم الحقيقي. تستخدم العديد من بيئات المحاكاة تقريبات مُبسّطة، مثل نقاط التلامس، ونماذج الاحتكاك الخطية، وافتراضات الأسطح المستقرة، للحفاظ على كفاءة الحساب. التلامس في العالم الحقيقي غير خطي بطبيعته: تتشوه المواد تحت تأثير الحمل، ويتغير الاحتكاك مع السرعة، وتتحول حالات التلامس بشكل غير متوقع بين الالتصاق والانزلاق. وتزيد الحطام، وعدم انتظام السطح، والديناميكيات البيئية العشوائية من تعقيد هذا الأمر. نتيجةً لذلك، تصبح عمليات الإمساك الناجحة في المحاكاة غير مستقرة عند التطبيق، وتنهار الحركة التي تبدو موثوقة في ظل ظروف مُتحكّم بها أمام التباين الفيزيائي الحقيقي. لا يوجد حاليًا أي مُحاكي يُحاكي هذه السلوكيات بالدقة المطلوبة لأنظمة الذكاء الاصطناعي الفيزيائية الجاهزة للإنتاج.
يقول نيمزر: "يكمن التوازن المطلوب في استخدام البيانات الاصطناعية لسد ثغرات البيانات المحددة، مع ترسيخ التدريب على بيانات العالم الحقيقي التي تُرسخ النموذج في نطاق التباين الطويل في العالم الحقيقي. لا يمكن للبيانات الاصطناعية أن تُعلّم النماذج عن عيوب المستشعرات أو الظروف المعاكسة التي ستواجهها في بيئة الإنتاج".
تحتاج مسارات البيانات الجاهزة للمحاكاة إلى أكثر من مجرد توليد اصطناعي. فهي تحتاج إلى تعليقات بشرية ضمن العملية لالتقاط ما تغفله المحاكاة، وأنظمة جودة للحفاظ على اتساق كلا نوعي البيانات.
4. قوة عاملة على نطاق الإنتاج تتمتع بخبرة في المجال
لا يُمثل التمييز بين عملية التعليق على نطاق تجريبي ونطاق إنتاجي مشكلة تقنية في جوهرها. يُمكن إدارة المشاريع التجريبية بإشراف يدوي وفريق من المعلقين المُختارين بعناية. أما البرامج الإنتاجية فتتطلب أنظمة تعلم نشطة، وسير عمل توافقي للتعليق، ومراجعة جودة متعددة المراحل، وبنية تحتية لضمان تطبيق إرشادات التعليق بشكل متسق على آلاف المعلقين الذين يعملون على ملايين إطارات بيانات المستشعرات.
في برامج الذكاء الاصطناعي الفيزيائي، تُحسّن الخبرة المتخصصة لدى مُصنّفي البيانات جودة البيانات بشكل مباشر. فالفريق الذي يفهم التقنية الأساسية (المستشعرات، وعلم الحركة، ومتطلبات السلامة والمخاطر) يُنتج بيانات تدريب أفضل لأنه يُدرك أهمية كل تصنيف.
5. تتبع مسار البيانات وإمكانية الوصول إليها من مدخلات المستشعر الخام إلى المخرجات المصنفة
تتطلب عمليات البيانات ذات الجودة الإنتاجية لبرامج الذكاء الاصطناعي ذات الأهمية البالغة للسلامة إمكانية التتبع الكامل.
يقول نيمزر: "إن تتبع مسار البيانات ليس مجرد ميزة إضافية في تطبيقات الذكاء الاصطناعي الحساسة للسلامة. يجب أن تكون قادراً على الإجابة بسرعة على أسئلة مثل: ما هي البيانات التي تم تدريب هذا النموذج عليها تحديداً؟ ما هي معايير الجودة التي استوفاها؟ ولماذا فشل في هذه الحالة تحديداً؟ كل ذلك دون الحاجة إلى بحث يدوي مطول. إذا كنت مضطراً للبحث في السجلات، فأنت غير مستعد للعمل في بيئة إنتاجية حساسة للسلامة."
تشمل عملية تتبع البيانات والتحكم في الإصدارات في مسار التعليقات التوضيحية ما يلي:
- سجلات الاستهلاك
- سجلات المعالجة المسبقة
- إصدار إرشادات التعليقات التوضيحية
- سجلات ضمان الجودة
- وثائق التسليم
6. شهادات الامتثال المتوافقة مع متطلبات البرنامج
تتطلب برامج الذكاء الاصطناعي ذات الأهمية البالغة للسلامة في تطبيقات السيارات والروبوتات والتطبيقات الصناعية متطلبات امتثال قد لا يتمكن موردو خدمات التعليقات التوضيحية العامة من تلبيتها. تشمل الشهادات الأساسية لشركاء خدمات بيانات الذكاء الاصطناعي في هذه البرامج ما يلي:
- معيار ISO 27001 لإدارة أمن المعلومات
- TISAX لمعالجة البيانات الخاصة بالسيارات
- معيار ISO 31700-1 للخصوصية بالتصميم
- HITRUST للتطبيقات ذات الصلة بالرعاية الصحية
- SOC 2 النوع 2 لضوابط تنظيم الخدمات
- اللائحة العامة لحماية البيانات (GDPR) وقانون خصوصية المستهلك في كاليفورنيا (CCPA/CPRA) للامتثال لخصوصية البيانات.
ما الذي توضحه المعايير لفرق المشتريات؟
يجب على فرق المشتريات معالجة جميع الاعتبارات الستة في آنٍ واحد، إذ أن أي قصور في أي مجال منها سيتفاقم أثناء تدريب النموذج. ورغم تطور برامج المركبات ذاتية القيادة من حيث حجم مجموعات البيانات المشروحة، إلا أن فجوة بيانات الروبوتات لا تزال كبيرة، وسيتم سدها مع تطور عمليات جمع البيانات ومعايير الشرح. إن بناء عمليات البيانات على أنظمة عالية الجودة مصممة للتعامل مع هذا الحجم منذ البداية سيساعد البرامج على الوصول إلى مرحلة الإنتاج في وقت أقرب.
التعليمات :
س: ما الذي يجب أن نبحث عنه في خدمات التعليق التي تتضمن تدخلاً بشرياً لنظام الذكاء الاصطناعي متعدد الوسائط؟
ج: بالنسبة للبرامج متعددة المستشعرات، يُعد دعم التعليقات التوضيحية الأصلية عبر الوسائط المتعددة، بما في ذلك الليدار والرادار ودمج الكاميرا مع الليدار، شرطًا أساسيًا. وتُحدد الخبرة المتخصصة في وسائط الاستشعار ذات الصلة مدى صلاحية بيانات التدريب عند النشر.
س: ما الذي يتطلبه جمع بيانات الحالات الاستثنائية للذكاء الاصطناعي ذي الأهمية البالغة للسلامة حقًا؟
أ: تجمع البيانات الواقعية معلوماتٍ عن تشوهات المستشعرات والتباينات غير المتوقعة التي لا تستطيع المحاكاة محاكاتها. أما البيانات الاصطناعية فتغطي سيناريوهات نادرة الحدوث يصعب جمعها على نطاق واسع، بما في ذلك مناطق الإنشاءات وتفاعلات مركبات الطوارئ. لذا، كلا النوعين من البيانات ضروريان. إضافةً إلى ذلك، تتطلب مجموعات بيانات الحالات الاستثنائية نفس معايير الجودة ومتطلبات سجل التدقيق المطبقة على بيانات التدريب الأساسية.
س: ما هي إمكانيات التعليق التي تهم أكثر بالنسبة لتطبيقات الروبوتات المعقدة؟
أ: يُعدّ الدعم الأصلي لمربعات الإحاطة ثلاثية الأبعاد، والتجزئة الدلالية، والتجزئة الشاملة، وتصنيف التسلسل الزمني عبر بيانات المستشعرات المدمجة نقطة البداية. كما يُنصح بالتحقق من مدخلات مستشعرات القوة والعزم، وبيانات الحالة والفعل والسلوك المستخدمة في تدريب نموذج اللغة المرئية والفعل، قبل اختيار الشريك.
س: ما الذي يميز عملية إضافة التعليقات الجاهزة للإنتاج عن تلك التي تتعطل عند التوسع؟
أ: تعتمد البرامج التجريبية على الإشراف اليدوي وفرق مختارة بعناية، بينما تحتاج برامج الإنتاج إلى أنظمة تعلم نشطة ومراجعة جودة متعددة المراحل. عندما يفشل نموذج ما، يجب أن يكون الفريق قادرًا على تتبع تلك الحالة إلى بيانات التدريب بسرعة، دون الحاجة إلى إعادة بناء سجل التدقيق من الصفر.
س: ما هي شهادات الامتثال التي يجب أن يحملها شريك بيانات الذكاء الاصطناعي للتطبيقات بالغة الأهمية للسلامة؟
ج: تُعدّ شهادات ISO 27001 وTISAX وSOC 2 Type 2 وGDPR وCCPA من الشهادات الأساسية التي يُنصح بمراجعتها قبل اختيار الشريك. يجب على البرامج التي تعمل بموجب قانون الذكاء الاصطناعي للاتحاد الأوروبي للأنظمة عالية المخاطر التأكد مما إذا كان الشركاء يحتفظون بسجلات تدقيق موثقة وتتبع مصدر البيانات كمتطلبات تشغيلية فعّالة.
نبذة عن شركة تيلوس الرقمية
تُقدّم TELUS Digital، وهي شركة تابعة مملوكة بالكامل لشركة TELUS Corporation (المدرجة في بورصة تورنتو تحت الرمز T وفي بورصة نيويورك تحت الرمز TU)، تجارب فريدة ومستدامة للعملاء والموظفين، وتُساهم في إحداث تحولات رقمية مستقبلية تُحقق قيمة مضافة لعملائنا. نحن العلامة التجارية التي تقف وراء العلامات التجارية الأخرى. يضم فريقنا العالمي نخبة من الخبراء التقنيين المتحمسين، الذين يُمثلون سفراءً متحمسين لمنتجات وخدمات عملائنا، ويُكرسون جهودهم للارتقاء بتجربة عملائهم، وحلّ تحديات أعمالهم، والحدّ من المخاطر، ودفع عجلة الابتكار المستمر. تشمل محفظة خدماتنا المتكاملة والشاملة إدارة تجربة العملاء، والحلول الرقمية، مثل الحلول السحابية، والأتمتة المدعومة بالذكاء الاصطناعي، وخدمات التصميم الرقمي للواجهات الأمامية والاستشارات، وحلول الذكاء الاصطناعي والبيانات، بما في ذلك رؤية الكمبيوتر، وخدمات الثقة والسلامة والأمن. Fuel iX ™ هي منصة TELUS Digital الخاصة ومجموعة منتجاتها التي تُمكّن العملاء من إدارة ومراقبة وصيانة الذكاء الاصطناعي التوليدي على مستوى المؤسسة، حيث تُقدّم إمكانيات ذكاء اصطناعي قياسية وأدوات تطوير تطبيقات مُخصصة لإنشاء حلول مؤسسية مُصممة خصيصًا.
انطلاقاً من هدفنا النبيل، تستفيد TELUS Digital من التكنولوجيا والإبداع البشري والتعاطف لخدمة عملائنا وبناء مجتمعات مزدهرة وشاملة في المناطق التي نعمل بها حول العالم. وانطلاقاً من مبادئنا التي تُعلي من شأن الإنسانية ، نتبنى نهجاً مسؤولاً تجاه التقنيات التحويلية التي نطورها وننشرها، وذلك من خلال دراسة ومعالجة الآثار الأوسع نطاقاً لأعمالنا بشكل استباقي. للمزيد من المعلومات، تفضلوا بزيارة: telusdigital.com .
للتواصل: سارة إيفانز، شريكة ورئيسة قسم العلاقات العامة في شركة زين ميديا، sarah@zenmedia.com
