من خلال تحليل الكلام، تطوير نظام ذكي يشخّص الاضطرابات العصبية مبكرًا

طور فريق بحثي بقيادة الأستاذ لي هايا في معهد التكنولوجيا الصحية والطبية التابع للأكاديمية الصينية للعلوم نظام تعلم عميق مبتكر باسم المحوّل التفاعلي عبر الزمن والمحور (CTCAIT) لتحليل الصوت واكتشاف التغيرات المتعددة بدقة عالية، يهدف إلى كشف الاضطرابات العصبية من خلال تحليل الكلام بدقة تتجاوز 90%، ويملك CTCAIT القدرة على التقاط أنماط صوتية دقيقة تكشف عن الأعراض المبكرة لبعض الأمراض العصبية مثل باركنسون وهنتنغتون ومرض ويلسون.
آلية العمل
يعتمد النظام الجديد على نموذج صوتي متقدم لاستخراج السمات الدقيقة من الكلام، مثل الترددات الدقيقة والتغيرات في النبرة والاهتزازات وسرعة الكلام والإيقاع. ثم تستخدم شبكة Inception Time لالتقاط التغيرات في خصائص الصوت، مدعومًا بآليات Multi-head Attention لتمييز السمات المرضية بدقة. وبهذه الطريقة، يستطيع CTCAIT التمييز بين الكلام الطبيعي والكلام الذي يحمل علامات مرضية، مثل رعشة الصوت في مرض باركنسون.
وقد حقق النظام دقة بلغت 92.06% على مجموعة بيانات صينية، و87.73% على مجموعة بيانات خارجية باللغة الإنجليزية، ما يعكس قوته وإمكانية تطبيقه على بيانات صوتية متعددة اللغات. وقد نُشرت نتائج الدراسة وآلية عمل النموذج في مجلة Neurocomputing.
ويوضح نجاح النظام أن الكلام يمكن أن يكون أداة واعدة للتشخيص المبكر غير الجراحي ومتابعة الحالات العصبية بسهولة وفعالية. ويُعد عُسر النطق (Dysarthria) أحد الأعراض المبكرة الشائعة للعديد من الاضطرابات العصبية، إذ تعكس مشاكل في الكلام عمليات تنكس عصبي كامنة، مما يجعل الإشارات الصوتية مؤشرات حيوية للفحص المبكر والمتابعة المستمرة لهذه الحالات.
وتعتمد الطرق التقليدية لتحليل الكلام على استخراج السمات يدويًا، ما يحد من قدرتها على نمذجة التغيرات الصوتية عبر الزمن، ويصعب تقديم تفسيرات واضحة للنتائج.
لتجاوز هذه التحديات طور CTCAIT آلية تحليل دقيقة تجمع بين استخراج السمات الصوتية المتقدمة وتوجيه الانتباه عبر الزمن، مما يعزز الدقة والمرونة في تطبيقه على مصادر صوت مختلفة ولغات متعددة.