جوجل تتحدى الذكاء الاصطناعي بترجمة صوتية تحاكي المترجم البشري

أعلنت جوجل رسميًا عن إطلاق أحدث نماذج الذكاء الاصطناعي لديها لترجمة الكلام في الوقت الفعلي Gemini 3.5 Live Translate، الذي يوفّر ترجمة فورية صوتية شبه لحظية بين أكثر من 70 لغة ، حيث تعد هذه التقنية بتجربة تواصل أكثر سلاسة لغير الناطقين باللغة، بفضل قدرتها على الترجمة الفورية أثناء حديث المستخدمين، بدلًا من انتظار انتهاء الجملة كما في أنظمة الترجمة السابقة، وقالت الشركة، إن النموذج الجديد صُمم لتقديم ترجمة صوتية تحافظ على نبرة المتحدث الأصلية وإيقاع الحديث وطبقة الصوت، ما يجعل المحادثات المترجمة أقرب إلى التواصل البشري الطبيعي.

يتميّز Gemini 3.5 Live Translate بقدرته على اكتشاف اللغات تلقائياً دون حاجة إلى إعدادات يدوية، إلى جانب دعم الترجمة المستمرة أثناء الحديث، بدلاً من انتظار انتهاء المتحدث قبل بدء الترجمة كما هي الحال في الأنظمة التقليدية ، وأوضحت جوجل أن النموذج يوازن بين سرعة الاستجابة وجودة الترجمة، ما يسمح بتقديم صوت مترجم بانسيابية ودون فواصل مزعجة، مع تأخير لا يتجاوز بضع ثوانٍ فقط عن المتحدث الأصلي طوال الجلسة.

بدأت الشركة طرح Gemini 3.5 Live Translate عبر مجموعة من خدماتها ومنتجاتها المختلفة، إذ أصبح متاحاً للمطورين ضمن مرحلة المعاينة العامة عبر Gemini Live API وGoogle AI Studio، كما يصل إلى الشركات عبر خدمة Google Meet في مرحلة المعاينة الخاصة خلال يونيو الجاري، إضافة إلى توفيره للمستخدمين من خلال تطبيق جوجل ترانسليت على نظامي Android وiOS ، وترى جوجل أن النموذج الجديد يمكن أن يفتح المجال أمام استخدامات متعددة، تشمل الترجمة الفورية للمكالمات والاجتماعات والدروس والبث المباشر، فضلاً عن دعم البيئات متعددة اللغات التي تتطلب تواصلاً لحظياً ودقيقاً.

وفي إطار توسيع نطاق استخدام التقنية، أشارت الشركة إلى أن منصات مثل Agora وLiveKit  وPipecat وVision Agents  بدأت بالفعل في دمج Gemini Live API داخل خدماتها لتسهيل تطوير تطبيقات الترجمة الصوتية الفورية، فيما تتولى تلك المنصات إدارة البنية التحتية الخاصة ببث الوسائط في الزمن الحقيقي، بما يسمح للمطورين بالتركيز على تحسين تجربة المستخدم.

وكشفت شركة Grab عن اختبار النموذج الجديد بهدف دعم التواصل متعدد اللغات بين السائقين والركاب أثناء عمليات التوصيل، خاصة أن مستخدمي التطبيق يجرون أكثر من 10 ملايين مكالمة صوتية شهرياً عبر المنصة ، ومن المقرر أن تبدأ الشركة طرح الميزة لعدد من عملاء Google Workspace للأعمال، خلال الشهر الجاري، قبل توسيع نطاق الإطلاق، في وقت لاحق من العام الجاري

وفي تطبيق Google Translate، بدأت الشركة أيضاً طرح وضع "الاستماع" الجديد لمستخدمي Android، والذي يسمح بالاستماع إلى الترجمة مباشرة عبر سماعة الهاتف الداخلية، من خلال رفع الهاتف إلى الأذن كما في المكالمات التقليدية، وهو ما تقول Google إنه يوفّر طريقة أكثر خصوصية وسرعة للاستماع إلى الترجمة، خاصة في الحالات التي لا تتوفر فيها سماعات الرأس ، وأكدت الشركة أن جميع المقاطع الصوتية المُولدة عبر نماذجها تحمل علامات مائية رقمية باستخدام تقنية  SynthID، بهدف تسهيل اكتشاف المحتوى المُنشأ بالذكاء الاصطناعي والمساعدة في الحد من التضليل المعلوماتي والمحتوى المزيف.

هناء احمد

هناء احمد

محرر بالموقع الموحد للهيئة الوطنية للإعلام

أخبار ذات صلة

جوجل تمنح خيارإلغاء إدراج المواقع في نتائج الذكاء الاصطناعي
معظم الشباب يؤيدون العلاقة بينهم وبين الذكاء الاصطناعي
الذكاء الاصطناعي
عيون اصنطاعية
أوبن إيه آي
ميزة جديدة في تطبيقات "جوجل "
جوجل
شات جي بي تي

المزيد من علوم وتكنولوجيا

دراسة تكشف امكانية تحسين القدرات الذهنية رغم التقدم في السن

أظهرت دراسة حديثة أن صحة الدماغ يمكن أن تتحسن في أي عمر، مما يتحدى الاعتقاد السائد بأن صحة العقل تتراجع...

المنصات الرقمية وتدمير الصحة النفسية للمراهقين

كشفت دراسة أسترالية حديثة صدرت عن معهد "موردوخ لأبحاث الأطفال" (MCRI) أن قضاء ساعتين أو أكثر يومياً على منصات التواصل...

ارتباط وثيق بين بكتيريا الأمعاء وصحة القلب لمرضى انقطاع النفس النومي

توصل باحثون إلى اكتشاف علمي جديد يكشف عن وجود ارتباط غير متوقع بين بكتيريا الأمعاء وانقطاع النفس الانسدادي النومي وأمراض...

دراسة تؤكد الإسراف في تناول الفاكهه ضار بالصحة

ينصح الخبراء بتقييم قيمة تناول كثرة المنتجات الغذائية، للتأكيد على أن حتى الفواكه والثمار المفيدة قد تصبح ضارة عند الإفراط...