أطلق باحثون مستقلون مشروعاً مفتوح المصدر جديداً على منصة GitHub تحت اسم Voicebox، يتيح للمطورين منصة شفافة لإنتاج أصوات اصطناعية عالية الجودة، في خطوة يُتوقع أن تُعيد تشكيل مستقبل تقنيات تحويل النص إلى كلام.
والمشروع يعتمد على بنية معيارية تسمح بتدريب النماذج الصوتية، وتخصيصها، ونشرها بلغات متعددة، مع دعم التحكم في النبرة، والإيقاع، والعاطفة؛ بما يوفر أصواتاً أكثر واقعية يمكن استخدامها في التعليم، وإتاحة الوصول لذوي الاحتياجات الخاصة، والإنتاج الإعلامي الإبداعي.
وعلى خلاف المحركات التجارية المغلقة، يوفر Voicebox الشفرة الكاملة، وخطوات التدريب بشكل موثق، مما يتيح للباحثين مراجعة النتائج وإعادة إنتاجها ، ويرى خبراء أن هذه الخطوة قد تضع معياراً جديداً لتطوير تقنيات الصوت الاصطناعي بشكل أخلاقي، من خلال التركيز على الشفافية، والموافقة في استخدام البيانات الصوتية.
لكن محللين في الصناعة حذروا من أن إتاحة هذه التقنية بشكل مفتوح قد تسرّع الابتكار وفي الوقت نفسه تثير مخاوف من إساءة الاستخدام، مثل إنتاج تسجيلات صوتية مزيّفة ، وقد أضاف فريق المشروع أدوات للتوسيم، والتتبع للمساعدة في التعرف على الأصوات المولدة آلياً ، ويمثل Voicebox تحولاً نحو ديمقراطية التكنولوجيا الصوتية، حيث تحل الشراكة المفتوحة محل السرية التجارية في سباق تطوير أصوات اصطناعية أقرب إلى الواقع.
محرر بالموقع الموحد للهيئة الوطنية للإعلام
يوقع الأردن، اتفاقيات "أرتميس" مع وكالة ناسا للفضاء خلال مراسم رسمية تعقد في مقر الوكالة بالعاصمة الأميركية واشنطن، في خطوة...
عقد الدكتور محمد الطيب، نائب وزير الصحة والسكان، اجتماعًا مع ممثلي شركتي "اتصالات مصر" و"STM" للاستثمار؛ لمناقشة مقترح تعزيز استراتيجية...
عقد المهندس رأفت هندي وزير الاتصالات وتكنولوجيا المعلومات، والدكتورة جيهان زكي وزيرة الثقافة، اجتماعًا لبحث مستجدات العمل في مشروعات التعاون...
أعلنت شركة "أنثروبيك" عن إطلاق "كلود ديزاين"، وهي أداة جديدة تتيح للمستخدمين إنشاء تصاميم بصرية احترافية، مثل العروض التقديمية ونماذج...