أطلق باحثون مستقلون مشروعاً مفتوح المصدر جديداً على منصة GitHub تحت اسم Voicebox، يتيح للمطورين منصة شفافة لإنتاج أصوات اصطناعية عالية الجودة، في خطوة يُتوقع أن تُعيد تشكيل مستقبل تقنيات تحويل النص إلى كلام.
والمشروع يعتمد على بنية معيارية تسمح بتدريب النماذج الصوتية، وتخصيصها، ونشرها بلغات متعددة، مع دعم التحكم في النبرة، والإيقاع، والعاطفة؛ بما يوفر أصواتاً أكثر واقعية يمكن استخدامها في التعليم، وإتاحة الوصول لذوي الاحتياجات الخاصة، والإنتاج الإعلامي الإبداعي.
وعلى خلاف المحركات التجارية المغلقة، يوفر Voicebox الشفرة الكاملة، وخطوات التدريب بشكل موثق، مما يتيح للباحثين مراجعة النتائج وإعادة إنتاجها ، ويرى خبراء أن هذه الخطوة قد تضع معياراً جديداً لتطوير تقنيات الصوت الاصطناعي بشكل أخلاقي، من خلال التركيز على الشفافية، والموافقة في استخدام البيانات الصوتية.
لكن محللين في الصناعة حذروا من أن إتاحة هذه التقنية بشكل مفتوح قد تسرّع الابتكار وفي الوقت نفسه تثير مخاوف من إساءة الاستخدام، مثل إنتاج تسجيلات صوتية مزيّفة ، وقد أضاف فريق المشروع أدوات للتوسيم، والتتبع للمساعدة في التعرف على الأصوات المولدة آلياً ، ويمثل Voicebox تحولاً نحو ديمقراطية التكنولوجيا الصوتية، حيث تحل الشراكة المفتوحة محل السرية التجارية في سباق تطوير أصوات اصطناعية أقرب إلى الواقع.
محرر بالموقع الموحد للهيئة الوطنية للإعلام
أعلنت شركة "أنثروبيك" عن إطلاق "كلود ديزاين"، وهي أداة جديدة تتيح للمستخدمين إنشاء تصاميم بصرية احترافية، مثل العروض التقديمية ونماذج...
طوّر باحثون من جامعة شنيانج الصينية تقنية تعتمد على المجسات الضوئية (Optical Sensors) أو تقنيات النانو الضوئية للكشف عن الملوثات...
أعلنت شركة "كانفا" (Canva) الأسترالية عن إطلاق ما وصفته بأنه أكبر تحديث في تاريخها تحت مسمى "كانفا إيه آي 2.0"...
تشير التقارير الى ان المستخدم العادي يمتلك اكثر من 80 تطبيقا على هاتفه، لكن 62% منها لا تستخدم شهريا، ومع...