به گزارش سلامت نیوز به نقل از neurosciencenews، یک چارچوب هوش مصنوعی جدید قادر است با تحلیل الگوهای گفتاری، اختلالات عصبی را با دقت بیش از ۹۰٪ شناسایی کند. این مدل که CTCAIT نام دارد، تغییرات ظریف در صدا را که ممکن است نشانههای اولیه بیماریهایی مانند پارکینسون، هانتینگتون و بیماری ویلسون باشد، تشخیص میدهد.
نکات کلیدی:
-
دقت بالا: ۹۲.۰۶٪ دقت در دادههای زبان چینی ماندارین و ۸۷.۷۳٪ در دادههای زبان انگلیسی
-
نشانگر غیرتهاجمی: اختلالات گفتار میتوانند تغییرات عصبی زودهنگام را نشان دهند
-
قابلیت گسترده: قابل استفاده برای غربالگری و پایش بیماریهای عصبی مختلف
پروفسور لی های و تیم تحقیقاتیاش در مؤسسه فناوری سلامت و پزشکی، وابسته به آکادمی علوم چین، چارچوب یادگیری عمیق جدیدی توسعه دادهاند که دقت و قابلیت تفسیر مدلهای تشخیص اختلالات عصبی از طریق گفتار را بهطور قابل توجهی افزایش میدهد.
پروفسور لی میگوید:«یک تغییر کوچک در نحوه صحبت کردن ما ممکن است فقط یک اشتباه زبانی نباشد، بلکه هشداری از مغز باشد. مدل ما میتواند علائم اولیه بیماریهای عصبی مانند پارکینسون، هانتینگتون و ویلسون را از روی ضبط صداها تشخیص دهد.»
این مدل توانسته با دقت ۹۲.۰۶٪ روی دادههای گفتار به زبان ماندارین و ۸۷.۷۳٪ روی دادههای انگلیسی عملکرد بسیار خوبی داشته باشد که نشاندهنده قابلیت تطبیق بالای آن در زبانهای مختلف است.
روش تحقیق
اختلالات گفتاری مانند دیسآرتریا (اختلال در تولید صدا و کلام) یکی از نشانههای اولیه بیماریهای عصبی است. این اختلالات معمولاً ناشی از فرآیندهای تخریب عصبی هستند و بنابراین تحلیل صدا به عنوان یک نشانگر غیرتهاجمی و کمهزینه برای تشخیص و پایش زودهنگام این بیماریها مورد توجه قرار گرفته است.
با این حال، روشهای فعلی معمولاً به ویژگیهای دستی وابستهاند و توانایی کمی در مدلسازی تعاملات زمانی دارند که باعث کاهش دقت و قابلیت تفسیر میشود.
برای حل این مشکلات، تیم تحقیقاتی چارچوبی به نام CTCAIT (Cross-Time and Cross-Axis Interactive Transformer) را معرفی کرده است. این مدل ابتدا ویژگیهای پیچیده و چندبعدی زمانی را از گفتار استخراج میکند و سپس با استفاده از شبکه Inception Time و مکانیزم توجه چندسر متقاطع، الگوهای چندمقیاسی و تعاملات پیچیده در دادههای صوتی را شناسایی میکند.
نتایج:
-
دقت تشخیص ۹۲.۰۶٪ در دادههای چینی ماندارین
-
دقت ۸۷.۷۳٪ در دادههای انگلیسی خارجی
-
عملکرد بالا و قابلیت تعمیمپذیری زبانهای مختلف
-
مدل توانسته در تحلیل گفتار ساختارمند بهتر از گفتار آزاد عمل کند که برای کاربردهای بالینی اهمیت دارد
این مطالعه نشان میدهد که تحلیل گفتار میتواند به عنوان ابزاری کمهزینه، غیرتهاجمی و دقیق در تشخیص زودهنگام و پایش بیماریهای عصبی بهکار گرفته شود. علاوه بر این، قابلیت تفسیر داخلی مدل به درک بهتر نحوه تصمیمگیری آن کمک کرده و راهنماییهای مهمی برای استفاده بالینی فراهم میکند.
نظر شما