chatGPT يبدو غبي أحيانا.. هل هذا بسبب اللغة العربية أم عنصرية الشركة؟

يمكن وصف برنامج "ChatGPT باللغة العربية" بأنه غير فعال، وكأنه موظف أرشيف كسول، في ضوء الجدل القائم حول تأخر تطوير التقنية الذكية باللغة العربية، والتساؤل حول ما إذا كانت هذه المشكلة تنجم عن خصائص اللغة العربية ذاتها

أم من قِبَل الشركات المنتجة لتلك التقنية. يخشى البعض أن تترك بعض اللغات خارج نطاق التقدم في مجال الذكاء الاصطناعي، وبالتالي تصبح هذه اللغات مهمشة وغير مهمة في المعركة الدائرة لتحقيق تقدم تكنولوجي.

تحدث الأدوات المتاحة في الذكاء الاصطناعي في يومنا الحاضر ثورة في صناعة المحتوى والبحث والاتصال، إلا أنها تكشف عن فجوة لغوية كبيرة تضع المتحدثين باللغة العربية في وضع ضعيف مقارنةً بنظرائهم الذين يتحدثون الإنجليزية، وفقًا لتقرير نشره موقع البريطاني. وبمحاولة إستخدام برنامج ChatGPT باللغة العربية والإنجليزية، فإن النتائج المتحققة تكون محدودة أو عالية الجودة بحسب اللغة المستخدمة.

ففي نتائجه الإنجليزية، بدا برنامج ChatGPT شبيهاً بباحث في سنواته الأولى: مجتهداً ومجدّاً يولي اهتماماً خاصاً للتفاصيل والتراكيب والدقة.

أما في نتائج ChatGPT العربي، فبدا تجسيداً للصورة النمطية لموظف أرشيف كسول لا يريد أن يرهق نفسه بالبحث عن المراجع الصحيحة أو الانتباه إلى تراكيبه اللغوية وهو يقول لا مبالياً: "هذا كل ما لدي، هيا انصرف".

- السبب قلة التدريبات والبيانات

فأداة مثل ChatGPT العربي لا تزال بحاجة إلى تدريب على كمية هائلة من البيانات العربية المتنوعة والقيّمة. فعدم توفر البيانات يجعل النتائج العربية التي تخرج بها الأداة عاجزة عن تمييز الفروق الدقيقة والعمق اللازمين لإنشاء محتوى عالي الجودة.

وقد يقول كثيرون: "لكن المشكلة أن اللغة العربية معقدة، ومن الصعب فهم قواعدها اللغوية ونحوها ومفرداتها".

ويمكن الرد على هؤلاء بالقول: "البشرية أمكنها إرسال رجل إلى القمر، ولا يمكنها تعليم برنامج ذكاء اصطناعي قواعد اللغة العربية؟".

كما أن مسألة تعقيد اللغات مسألة نسبية، عليها خلاف، ومن المرجح أن العربية ليست أعقد من كل اللغات الرئيسية الكبرى مثل الصينية والروسية والهندية الألمانية.

فجوة رقمية

زيادة على الشعور بالإحباط، فالمستخدمون الناطقون بالعربية لأدوات الذكاء الاصطناعي يواجهون عواقب وخيمة لهذا الانقسام اللغوي. ويأتي على قمة هذه العواقب الوصول المحدود إلى المعلومات، وذلك لأن الجزء الأكبر من هذه المراجع والبيانات الضخمة التي تفحصها هذه الأدوات لتوليد نتائجها متاحة باللغة الإنجليزية بصفة رئيسية.

وهذا التضارب يعيق قدرة المستخدمين الناطقين بالعربية على الاستفادة من الذكاء الاصطناعي للتطوير على المستوى المهني والشخصي ويرسخ الفجوة الرقمية بتداعيات طويلة الأمد.

اللجوء للترجمة قد يفاقم المشكلة!

وقد يقترح البعض بدلاً من استخدام ChatGPT العربي، إدخال الأوامر باللغة الإنجليزية، والحصول على النتائج بتلك اللغة، ثم ترجمتها إلى العربية. لكن حتى هذا الحل تنتج عنه مشكلة أخرى هي الترجمة.

فجودة أدوات الترجمة من الإنجليزية إلى العربية المتاحة على الإنترنت، مثل جوجل ترانسليت، منخفضة أيضاً، وقد تتسبب في عواقب وخيمة لمن لا يتقن اللغة المصدر، لأنه لن يتمكن من فهم الأخطاء في الترجمة.

- ادوات الذكاء الاصطناعي عاجزة عن تنظيم اتجاه الكتابة بالعربية

ومن التداعيات الأخرى لتدهور نسخة الذكاء الاصطناعي العربية الفرص الضائعة. فالعديد من الصحفيين وصناع المحتوى العاملين باللغة العربية يملكون المهارات اللازمة لإنتاج محتوى عالي الجودة، لكن الكفاءة المحدودة لجزء كبير من أدوات الذكاء الاصطناعي العربية يشكل عقبة كبيرة أمامهم.

فمثلاً، لا تزال بعض أدوات صناعة الفيديو التي تعتمد على الذكاء الاصطناعي عاجزة عن تنظيم اتجاه الكتابة باللغة العربية بشكل صحيح.

وتخيل الإحباط الشديد الذي قد يشعر به كل صحفي أو صانع محتوى حين يرغب في أن يبدأ عنوان المقال برقم، ليتفاجأ بأن الكلمات متداخلة ومقلوبة ويصبح العنوان غير مفهوم.

والفرص الضائعة تعني قدرة أقل على استخدام هذه الأدوات لإنشاء محتوى عالي الجودة، وقدرة أقل على المساهمة في نمو وتطوير نظام صناعة المحتوى العربي.

وهذه الفرص تهم الأفراد وكذلك الشركات والمؤسسات. فالجودة الرديئة لأدوات الذكاء الاصطناعي في نسختها العربية

تعني أنه سيتعين على المحترفين ورجال الأعمال مواصلة كفاحهم في سياق المنافسة غير العادلة التي تميز السوق العالمية.

أما سوء التفاهم الثقافي فهو جانب آخر من أوجه قصور أدوات الذكاء الاصطناعي في نسختها العربية من حيث فهم الخصوصيات والحساسيات الثقافية. فهذه الروبوتات

المدربة على كمية محدودة من البيانات مقارنة بنظيراتها من اللغات الأخرى، قد تميل إلى إنشاء محتوى غير لائق ثقافياً، وهذا يزيد من شعور المستخدم بالإقصاء ويقلل من ثقته في البرنامج.

وهذا لا يُقصد به الخصوصيات الثقافية للمجموعات الناطقة بالعربية مقابل المجموعات التي تتحدث لغات أخرى، وإنما المجموعات المحددة والمختلفة داخل دائرة المجتمعات الناطقة بالعربية نفسها.

- الحل ..

ماذا يعني سد فجوة الذكاء الاصطناعي اللغوية؟ إنه يعني وجود إرادة حقيقية للاستثمار في تدريب هذه الأدوات على بيانات عربية ضخمة ومتنوعة. فالبيانات الضخمة عالية الجودة هي وحدها القادرة على تحسين أداء الذكاء الاصطناعي.

وسد الفجوة سيتطلب أيضاً تطوير أدوات بحث مدعومة بالذكاء الاصطناعي قادرة على فهم أكبر وأكثر دقة للغة العربية. ولو اعترفنا بأن اللغة العربية صعبة ومعقدة، فالحل الوحيد يكمن في تطوير أدوات بحثية متطورة قادرة على فهم تعقيداتها ومتغيراتها.

- الهدف هو الوصول إلى 400 مليون مستخدم عربي!

وأخيراً، يمكن سد الفجوة اللغوية في الذكاء الاصطناعي بجهود مشتركة بين مطوري الذكاء الاصطناعي واللغويين والخبراء في هذا المجال. وهذه الجهود المتضافرة بين الأوساط الأكاديمية وصناعة التكنولوجيا والمستفيدين هي وحدها ما يضمن وصول المستخدمين بالعربية إلى نفس المحتوى القيّم الذي يصل إليه الناطقون بالإنجليزية.

وربما يتساءل مطورو أدوات الذكاء الاصطناعي مثل ChatGPT: "ولم علينا تدريب أداتنا على بيانات أكبر وأفضل باللغة العربية؟ ما الفائدة من ذلك؟".

والإجابة المباشرة على هذا السؤال قد تكون: عدد الناطقين بالعربية، والذي يبلغ عددهم قرابة 400 مليون شخص، يجعل من العربية سوقاً قوياً من المهم الاستثمار فيه.

لكن ذكاء مطوري الذكاء الاصطناعي لن يرضى إلا بإجابة أعمق بكثير.

تقول مسؤولة التكنولوجيا في شركة OpenAI، مطورة ChatGPT: "التكنولوجيا تشكلنا، ونحن نشكلها".

والنسخة العربية من برنامج ChatGPT تثير شعوراً بالقلق إزاء أن المجتمع الذي سيشكله لن يكون عاجزاً فقط عن دخول مجتمع ما بعد المعلومات، وإنما سيكون عاجزاً أيضاً عن مجرد الوصول إلى هذه المعلومات.

وفكرة أن مسؤولة التكنولوجيا مناصرة لتنظيم وحوكمة الذكاء الاصطناعي مرحب بها. ولكن هل تشمل هذه الحوكمة التي تقصدها مبدأ تكافؤ الفرص؟.

وتكافؤ الفرص يعني أن جميع البشر في جميع أنحاء العالم يمكنهم الاستفادة من الذكاء الاصطناعي واستخدامه لخدمتهم.