أعلن فريق بحثي عن تطوير تقنية جديدة تسمى الترجمة الذهنية، التي تسعى إلى قراءة الأفكار من خلال مسح دماغي بالرنين المغناطيسي الوظيفي. وتحوّل هذه التقنية إشارات الدماغ إلى وصف نصي دقيق لما يراه الشخص أو يتذكره. وتربط بين سمات النص وسمات الدماغ عبر نموذج لغوي مقنع لتوليد النصوص مباشرة من النشاط الدماغي. وتؤكد النتائج الأولية أن التقنية تتجاوز مجرد ربط الكلمات بآثارها وتستهدف فهم المعاني والعلاقات بين عناصر المحتوى.
آلية العمل والتقنيات المساندة
تعتمد التقنية على تحسين تكرارية يولد شرحًا نصيًا من نشاط الدماغ. يتم ذلك عبر ربط سمات النص المراد توليدها مع السمات المستخرجة من الإشارات الدماغية باستخدام نموذج DeBERTa-large كأداة لاستخلاص السمات، ثم تولّد RoBERTa-large النص النهائي من خلال أسلوب MLM. وتُشمل هذه المقاربة نماذج خطية مدربة على فك تشفير السمات الدلالية من نموذج لغوي عميق اعتمادًا على نشاط الدماغ، ما يتيح ترجمة التفكير إلى نصوص قابلة للفهم.
خلال التجربة، عُولجت مقاطع الفيديو التي شاهدها المشاركون عبر ترجمة نصية جماعية، ثم استخدمت DeBERTa-large لاستخلاص السمات المحددة، ليُنتج RoBERTa-large النص النهائي عبر عملية تكرارية. وفي البداية كان الوصف الناتج مجزأًا وغير واضح، لكن التحسين التكراري جعله أكثر اتساقًا ويعكس الجوانب الرئيسية للمشاهد والتغيرات الديناميكية بين عناصرها. كما أظهر النظام قدرة على نقل التفاعل بين عناصر متعددة حتى عندما لم تُحدد عناصر بعينها بشكل صريح.
تجربة قراءة الفيديو من الإدراك
في الجزء الأول من التجربة، شاهد ستة أشخاص 2196 مقطع فيديو قصير أثناء قياس نشاط أدمغتهم باستخدام التصوير بالرنين المغناطيسي الوظيفي. وتنوعت المقاطع بين أغراض ومشاهد وحركات وأحداث، مع وجود متعاملين من لغات مختلفة. خضعت المقاطع نفسها إلى ترجمة نصية جماعية ثم عُولجت بخطوات فك تشفير السمات عبر DeBERTa-large لاستخلاص سمات محددة، ليُنتج RoBERTa-large النص النهائي عبر MLM. وفي البداية كان الوصف الناتج مجزأًا وغير واضح، إلا أنه مع التحسن التكراري تطور ليصبح بنية متماسكة وتغيراته الديناميكية واضحة، مما يعكس المحتوى بدقة.
وقارن الفريق الأوصاف المولَّدة مع التسميات الصحيحة والخاطئة لعدد من المرشحين لتقييم الدقة، فأشاروا إلى نحو 50% كدقة عامة، وهو مستوى يفوق الأساليب الحالية وبشر بإمكانات تحسين مستقبلية. كما أكد الباحثون أن هذه الدقة تمثل خطوة نحو أنظمة قراءة أفكار أكثر تطورًا، مع وجود مجال للتحسين في الأطر والبيانات المستخدمة. وتبين أن مستوى الأداء قد يتفاوت بين الأفراد، ولكنه يعكس اتجاهًا إيجابيًا في قدرة التقنية على تمثيل المحتوى المدرك من الدماغ.
قراءة الذكريات وتخطيطها
خلال مرحلة لاحقة، طُلب من المشاركين تذكر مقاطع الفيديو باستخدام التصوير بالرنين المغناطيسي الوظيفي لاختبار قدرة التقنية على قراءة الذاكرة. وأظهرت النتائج أن التحليل كان قادرًا على توليد أوصاف تعكس محتوى المقاطع المستدعاة، مع تفاوت في الدقة بين الأفراد. ووصلت الدقة لدى المشاركين الأكثر قدرة على التمييز إلى نحو 40% في اختيار المقاطع الصحيحة من بين 100 مرشح، وهو رقم واعد يعكس إمكانات التطبيق المستقبلي. ويشير الباحثون إلى أن هذه النتائج تفتح بابًا أمام تحسينات مستقبلية في دقة التفسير مع تطور النماذج والتقنيات المساعدة.
أهمية التقنية للمصابين بفقدان الكلام
تُبرز التقنية إمكانية دعم المصابين بفقدان القدرة على الكلام، مثل من يعانون من السكتة الدماغية، في استعادة سبل التواصل بشكل أقوى من بعض أساليب التفاعل بين الدماغ والحاسوب. ويظهر النظام قدرة على فهم المعاني والعلاقات بين العناصر بشكل أعمق مقارنةً بالارتباطات الصوتية وحدها. ومع ذلك، لا تزال هناك حاجة إلى مزيد من التطوير والاختبار قبل أن تتحول إلى تطبيقات عملية واسعة النطاق في الرعاية الصحية والمجالات الاجتماعية.


