جوجل تتحدى الذكاء الاصطناعي بترجمة صوتية تحاكي المترجم البشري

هناء احمد
الأحد، 14 يونيه 2026 07:59 ص

أعلنت جوجل رسميًا عن إطلاق أحدث نماذج الذكاء الاصطناعي لديها لترجمة الكلام في الوقت الفعلي Gemini 3.5 Live Translate، الذي يوفّر ترجمة فورية صوتية شبه لحظية بين أكثر من 70 لغة ، حيث تعد هذه التقنية بتجربة تواصل أكثر سلاسة لغير الناطقين باللغة، بفضل قدرتها على الترجمة الفورية أثناء حديث المستخدمين، بدلًا من انتظار انتهاء الجملة كما في أنظمة الترجمة السابقة، وقالت الشركة، إن النموذج الجديد صُمم لتقديم ترجمة صوتية تحافظ على نبرة المتحدث الأصلية وإيقاع الحديث وطبقة الصوت، ما يجعل المحادثات المترجمة أقرب إلى التواصل البشري الطبيعي.

يتميّز Gemini 3.5 Live Translate بقدرته على اكتشاف اللغات تلقائياً دون حاجة إلى إعدادات يدوية، إلى جانب دعم الترجمة المستمرة أثناء الحديث، بدلاً من انتظار انتهاء المتحدث قبل بدء الترجمة كما هي الحال في الأنظمة التقليدية ، وأوضحت جوجل أن النموذج يوازن بين سرعة الاستجابة وجودة الترجمة، ما يسمح بتقديم صوت مترجم بانسيابية ودون فواصل مزعجة، مع تأخير لا يتجاوز بضع ثوانٍ فقط عن المتحدث الأصلي طوال الجلسة.

بدأت الشركة طرح Gemini 3.5 Live Translate عبر مجموعة من خدماتها ومنتجاتها المختلفة، إذ أصبح متاحاً للمطورين ضمن مرحلة المعاينة العامة عبر Gemini Live API وGoogle AI Studio، كما يصل إلى الشركات عبر خدمة Google Meet في مرحلة المعاينة الخاصة خلال يونيو الجاري، إضافة إلى توفيره للمستخدمين من خلال تطبيق جوجل ترانسليت على نظامي Android وiOS ، وترى جوجل أن النموذج الجديد يمكن أن يفتح المجال أمام استخدامات متعددة، تشمل الترجمة الفورية للمكالمات والاجتماعات والدروس والبث المباشر، فضلاً عن دعم البيئات متعددة اللغات التي تتطلب تواصلاً لحظياً ودقيقاً.

وفي إطار توسيع نطاق استخدام التقنية، أشارت الشركة إلى أن منصات مثل Agora وLiveKit وPipecat وVision Agents بدأت بالفعل في دمج Gemini Live API داخل خدماتها لتسهيل تطوير تطبيقات الترجمة الصوتية الفورية، فيما تتولى تلك المنصات إدارة البنية التحتية الخاصة ببث الوسائط في الزمن الحقيقي، بما يسمح للمطورين بالتركيز على تحسين تجربة المستخدم.

وكشفت شركة Grab عن اختبار النموذج الجديد بهدف دعم التواصل متعدد اللغات بين السائقين والركاب أثناء عمليات التوصيل، خاصة أن مستخدمي التطبيق يجرون أكثر من 10 ملايين مكالمة صوتية شهرياً عبر المنصة ، ومن المقرر أن تبدأ الشركة طرح الميزة لعدد من عملاء Google Workspace للأعمال، خلال الشهر الجاري، قبل توسيع نطاق الإطلاق، في وقت لاحق من العام الجاري

وفي تطبيق Google Translate، بدأت الشركة أيضاً طرح وضع "الاستماع" الجديد لمستخدمي Android، والذي يسمح بالاستماع إلى الترجمة مباشرة عبر سماعة الهاتف الداخلية، من خلال رفع الهاتف إلى الأذن كما في المكالمات التقليدية، وهو ما تقول Google إنه يوفّر طريقة أكثر خصوصية وسرعة للاستماع إلى الترجمة، خاصة في الحالات التي لا تتوفر فيها سماعات الرأس ، وأكدت الشركة أن جميع المقاطع الصوتية المُولدة عبر نماذجها تحمل علامات مائية رقمية باستخدام تقنية SynthID، بهدف تسهيل اكتشاف المحتوى المُنشأ بالذكاء الاصطناعي والمساعدة في الحد من التضليل المعلوماتي والمحتوى المزيف.

جوجل الذكاء الاصطناعي ترجمة صوتية