أطلق باحثون مستقلون مشروعاً مفتوح المصدر جديداً على منصة GitHub تحت اسم Voicebox، يتيح للمطورين منصة شفافة لإنتاج أصوات اصطناعية عالية الجودة، في خطوة يُتوقع أن تُعيد تشكيل مستقبل تقنيات تحويل النص إلى كلام.
والمشروع يعتمد على بنية معيارية تسمح بتدريب النماذج الصوتية، وتخصيصها، ونشرها بلغات متعددة، مع دعم التحكم في النبرة، والإيقاع، والعاطفة؛ بما يوفر أصواتاً أكثر واقعية يمكن استخدامها في التعليم، وإتاحة الوصول لذوي الاحتياجات الخاصة، والإنتاج الإعلامي الإبداعي.
وعلى خلاف المحركات التجارية المغلقة، يوفر Voicebox الشفرة الكاملة، وخطوات التدريب بشكل موثق، مما يتيح للباحثين مراجعة النتائج وإعادة إنتاجها ، ويرى خبراء أن هذه الخطوة قد تضع معياراً جديداً لتطوير تقنيات الصوت الاصطناعي بشكل أخلاقي، من خلال التركيز على الشفافية، والموافقة في استخدام البيانات الصوتية.
لكن محللين في الصناعة حذروا من أن إتاحة هذه التقنية بشكل مفتوح قد تسرّع الابتكار وفي الوقت نفسه تثير مخاوف من إساءة الاستخدام، مثل إنتاج تسجيلات صوتية مزيّفة ، وقد أضاف فريق المشروع أدوات للتوسيم، والتتبع للمساعدة في التعرف على الأصوات المولدة آلياً ، ويمثل Voicebox تحولاً نحو ديمقراطية التكنولوجيا الصوتية، حيث تحل الشراكة المفتوحة محل السرية التجارية في سباق تطوير أصوات اصطناعية أقرب إلى الواقع.
محرر بالموقع الموحد للهيئة الوطنية للإعلام
أصبح استخدام الهاتف المحمول قبل النوم من أكثر العادات انتشارًا حول العالم، حيث يقضي ملايين الأشخاص دقائق طويلة في تصفح...
أعلنت أكاديمية البحث العلمي والتكنولوجيا اليوم الأحد نتائج مبادرة «تحالفات مشروعات التخرج – مشروعي بدايتي» لعام 2026، والتي تُعد أحد...
طور باحثون في جامعة كاليفورنيا في ديفيس نظام ذكاء اصطناعي يمكنه جعل الوجبات صحية أكثر وبأسعار معقولة من خلال التوصية...
أعلنت شركة Open AI إطلاق تحديثات كبيرة لميزة الذاكرة في ChatGPT، منها نظام جديد لإدارة الذكريات باسم "Dreaming"، مما يتيح...