به گزارش سلامت نیوز به نقل از خراسان، شاید برای شما هم پیش آمده باشدکه تا برگه آزمایش را گرفتید، آن را برای هوش مصنوعی فرستادید و ازآن خواستید اوضاع را برایتان تفسیرکند. شاید هم سوالات مختلف پزشکی را ازآن پرسیده باشید و تا مرحله تشخیص و درمان بیماری هم پیش بروید.درست است که هوش مصنوعی به منبع انبوهی ازدادههای سلامت وپزشکی متصل است وتا حدودی میتواند کمککننده باشد اما مطالعات جدید میگوید هوش مصنوعی در۸۰ درصد مواقع درتشخیص اولیه بیماریها شکست میخورد! اگرشما هم برای مسائل پزشکیتان سراغ هوش مصنوعی میروید این مطلب برای شماست.
۸۰درصد شکست در تشخیصهای افتراقی!
ازوقتی باتهای هوش مصنوعی آمدهاند خیلی از ما سفره دلمان را برایشان پهن میکنیم ازمسائل شخصی گرفته تا اوضاع جسمی و سلامتمان را. با این که هوش مصنوعی خیلی وقتها حدسهای خوبی میزند و نشانههای دقیقی میدهد ولی طبق مطالعههای جدید بیشتر مدلهای زبانی هوش مصنوعی درتشخیص اولیه بیماریها عملکرد خوبی ندارند. محققان بیمارستان Mass General Brigham بوستون دریافتند که چتباتهای هوش مصنوعی درمواجهه با اطلاعات بالینی جامع عملکرد خوبی درتشخیص بیماریها پیدا کردهاند، اما همچنان درتشخیص افتراقی دربیش از۸۰ درصد مواقع شکست میخورند.
امتحان پزشکی چت جیپیتی و گراک و دیپ سیک
شاید بپرسید محققان چطوربه این نتیجه رسیدند که هوش مصنوعی خیلی وقتها برای تشخیص بیماری شکست میخورد؟پژوهشگران دراین مطالعه۲۱مدل زبانی بزرگ ازجمله جدیدترین نسخههای جمینای، GPT، گراک و دیپسیک را آزمایش کردند. سپس با ابزاری تواناییهای مدلها را درمراحل مختلف استدلال بالینی بررسی کردند: ازتشخیص اولیه و مرتبسازی نتایج آزمایشات گرفته تا رسیدن به تشخیص نهایی و برنامهریزی برای درمان. نتیجه چه شد؟مدلهای زبانی دررسیدن به تشخیص نهایی دقت بالایی داشتند، اما درتشخیص افتراقی وعبورازتردیدها ضعیف عمل کردند. تشخیص افتراقی مرحلهای حیاتی درتشخیصهای پزشکی است که طی آن متخصصان یک بیماری را شناسایی و آن را ازسایر علایم متمایز میکنند. همه مدلها دربیش از۸۰ درصد مواقع درتشخیص افتراقی ناموفق عمل میکردند، اما با دریافت اطلاعات جامع، درتشخیص نهایی نرخ، موفقیت حدود ۶۰ تا ۹۰ درصدی داشتند. طبق این تحقیق، مدلهای گراک ۴، جیپیتی ۵، جمینای ۳ فلش و جمینای۳پرو ازبقیه بهترظاهرشدند.
همچنان انسانها باید درفرآیند تشخیص باشند
باید بدانیم مدلهای عمومی برای استدلال بالینی مهارتهای کافی ندارند و برای این کاربردها باید بهسراغ مدلهای تخصصیتر رفت. بنابراین ضروری است که درصورت استفاده از هوش مصنوعی درامورپزشکی، همچنان انسانها دراین فرایند حضورداشته باشند تا نتیجه کار را بررسی کنند. شاهدش هم مردی۶۰ساله که پس ازمشورت با چت جی پی تی (ChatGPT)، نمک خوراکی خود را با برومید سدیم جایگزین کرد؛ اقدامی که منجربه مسمومیت با برومید و بستری شدن سه هفتهای دربخش روانپزشکی شد. ازآنجا که رباتهای چت هوش مصنوعی سوابق سلامت شخصی شما را دراختیار ندارند، نمیتوانند درمورد علایم جدید، شرایط موجود شما، یا نیازتان به مراقبتهای اورژانسی، راهنمایی قابل اعتمادی ارائه دهند. ازطرفی ممکن است اطلاعات هوش مصنوعی درزمینه پزشکی قدیمی یا نادرست باشد.درنهایت بهترین کاربردهوش مصنوعی درحال حاضر، استفاده ازآن برای به دست آوردن اطلاعات زمینهای برای کمک به شما درطرح پرسشها ازپزشک یا توضیح اصطلاحات پزشکی است که نمیدانید.

نظر شما