ازوقتی بات‌های هوش مصنوعی آمده‌اند خیلی از ما سفره دل‌مان را برایشان پهن می‌کنیم ازمسائل شخصی گرفته تا اوضاع جسمی و سلامت‌مان را. با این که هوش مصنوعی خیلی وقت‌ها حدس‌های خوبی می‌زند و نشانه‌های دقیقی می‌دهد ولی طبق مطالعه‌های جدید بیشتر مدل‌های زبانی هوش مصنوعی درتشخیص اولیه بیماری‌ها عملکرد خوبی ندارند.

هوش مصنوعی در۸۰ درصد مواقع درتشخیص اولیه بیماری‌ها شکست می‌خورد!

به گزارش سلامت نیوز به نقل از خراسان، شاید برای شما هم پیش آمده باشدکه تا برگه آزمایش را گرفتید، آن را برای هوش مصنوعی فرستادید و ازآن خواستید اوضاع را برایتان تفسیرکند. شاید هم سوالات مختلف پزشکی را ازآن پرسیده باشید و تا مرحله تشخیص و درمان بیماری هم پیش بروید.درست است که هوش مصنوعی به منبع انبوهی ازداده‌های سلامت وپزشکی متصل است وتا حدودی می‌تواند کمک‌کننده باشد اما مطالعات جدید می‌گوید هوش مصنوعی در۸۰ درصد مواقع درتشخیص اولیه بیماری‌ها شکست می‌خورد! اگرشما هم برای مسائل پزشکی‌تان سراغ هوش مصنوعی می‌روید این مطلب برای شماست.




۸۰درصد شکست در تشخیص‌های افتراقی!


ازوقتی بات‌های هوش مصنوعی آمده‌اند خیلی از ما سفره دل‌مان را برایشان پهن می‌کنیم ازمسائل شخصی گرفته تا اوضاع جسمی و سلامت‌مان را. با این که هوش مصنوعی خیلی وقت‌ها حدس‌های خوبی می‌زند و نشانه‌های دقیقی می‌دهد ولی طبق مطالعه‌های جدید بیشتر مدل‌های زبانی هوش مصنوعی درتشخیص اولیه بیماری‌ها عملکرد خوبی ندارند. محققان بیمارستان Mass General Brigham بوستون دریافتند که چت‌بات‌های هوش مصنوعی درمواجهه با اطلاعات بالینی جامع عملکرد خوبی درتشخیص بیماری‌ها پیدا کرده‌اند، اما همچنان درتشخیص افتراقی دربیش از۸۰ درصد مواقع شکست می‌خورند.


امتحان پزشکی چت جی‌پی‌تی و گراک و دیپ سیک


شاید بپرسید محققان چطوربه این نتیجه رسیدند که هوش مصنوعی خیلی وقت‌ها برای تشخیص بیماری شکست می‌خورد؟پژوهشگران دراین مطالعه۲۱مدل زبانی بزرگ ازجمله جدیدترین نسخه‌های جمینای، GPT، گراک و دیپ‌سیک را آزمایش کردند. سپس با ابزاری توانایی‌های مدل‌ها را درمراحل مختلف استدلال بالینی بررسی کردند: ازتشخیص اولیه و مرتب‌سازی نتایج آزمایشات گرفته تا رسیدن به تشخیص نهایی و برنامه‌ریزی برای درمان. نتیجه چه شد؟مدل‌های زبانی دررسیدن به تشخیص نهایی دقت بالایی داشتند، اما درتشخیص افتراقی وعبورازتردیدها ضعیف عمل کردند. تشخیص افتراقی مرحله‌ای حیاتی درتشخیص‌های پزشکی است که طی آن متخصصان یک بیماری را شناسایی و آن را ازسایر علایم متمایز می‌کنند. همه مدل‌ها دربیش از۸۰ درصد مواقع درتشخیص افتراقی ناموفق عمل می‌کردند، اما با دریافت اطلاعات جامع، درتشخیص نهایی نرخ، موفقیت حدود ۶۰ تا ۹۰ درصدی داشتند. طبق این تحقیق، مدل‌های گراک ۴، جی‌پی‌تی ۵،  جمینای ۳ فلش و جمینای۳پرو ازبقیه بهترظاهرشدند.


همچنان انسان‌ها باید درفرآیند تشخیص باشند


باید بدانیم مدل‌های عمومی برای استدلال بالینی مهارت‌های کافی ندارند و برای این کاربردها باید به‌سراغ مدل‌های تخصصی‌تر رفت. بنابراین ضروری است که درصورت استفاده از هوش مصنوعی درامورپزشکی، همچنان انسان‌ها دراین فرایند حضورداشته باشند تا نتیجه کار را بررسی کنند. شاهدش هم مردی۶۰ساله که پس ازمشورت با چت جی پی تی (ChatGPT)، نمک خوراکی خود را با برومید سدیم جایگزین کرد؛ اقدامی که منجربه مسمومیت با برومید و بستری شدن سه هفته‌ای دربخش روانپزشکی شد. ازآن‌جا که ربات‌های چت هوش مصنوعی سوابق سلامت شخصی شما را دراختیار ندارند، نمی‌توانند درمورد علایم جدید، شرایط موجود شما، یا نیازتان به مراقبت‌های اورژانسی، راهنمایی قابل اعتمادی ارائه دهند. ازطرفی ممکن است اطلاعات هوش مصنوعی درزمینه پزشکی قدیمی یا نادرست باشد.درنهایت بهترین کاربردهوش مصنوعی درحال حاضر، استفاده ازآن برای به دست آوردن اطلاعات زمینه‌ای برای کمک به شما درطرح پرسش‌ها ازپزشک یا توضیح اصطلاحات پزشکی است که نمی‌دانید.

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.
captcha