آستانه کارایی 3.5 و 4 chatgpt بر روی شانه AAOS ، بررسی آرنج

14 فوریه 2025

1 دقیقه بخو،د

یک موضوع را به هشدارهای ایمیل اضافه کنید

هنگام انتشار مقاله های جدید ، یک ایمیل دریافت کنید

لطفاً هنگام انتشار مقالات جدید ، آدرس ایمیل خود را برای دریافت ایمیل ارائه دهید بشر

<،on type="،on" cl،="btn btn-primary" data-loading-text="Loading <i cl،=" fa="" fa-spinner="" fa-spin="">data-work = “مش، شدن”> مش، شدن

ما نتوانستیم درخواست شما را اداره کنیم. لطفا بعداً دوباره امتحان کنید. اگر همچنان به این مشکل رسیدید ، لطفاً با [email protected] تماس بگیرید.

<،on data-dismiss="modal" cl،="btn btn-primary btn-lg btn-block">بازگشت به هیلو

وعده های غذایی اصلی:

Chatgpt 3.5 و Chatgpt 4 از سؤالات کارآیی در مورد آزمون شانه AAOS -s،ulder فراتر رفته است.

chatgpt ممکن است به اندازه کافی دقیق برای جایگزینی تصمیمات بالینی نباشد.

با توجه به نتایج منتشر شده ، Chatgpt 3.5 و Chatgpt 4 ، از Openai ، از نرم شدن سؤالات مکتوب در مورد آکادمی آکادمی آمریکا از جراحان ارتوپدی شانه فراتر رفت.

با این حال ، محققان خاطرنشان كردند كه ChatGPT به اندازه کافی دقیق یا قابل اعتماد نیست تا بتواند تصمیمات بالینی را جایگزین كند.

Chatgpt 3.5 و Chatgpt 4 از سؤالات کارآیی در مورد آزمون شانه AAOS -s،ulder فراتر رفته است. ع،: سهام Adobe

“Chatgpt 3.5 و Chatgpt 4 به بیش از نیمی از سوالات AAOS AAOS در متن (امتحان خود ارزیابی) به درستی سؤالاتی پاسخ دادند ، که درصد کافی برای به دست آوردن اعتبار CME است.” بنیامین نوس لوپز ، مدرک لیسانس ، محقق دانشگاه دانشگاه دانشگاه پورتوریکو برای علوم پزشکی ، همراهان در مطالعه نوشتند. “Chatgpt 4 بسیار بهتر از Chatgpt 3.5 عمل کرده است ، که نشان دهنده پتانسیل یادگیری پویا برای (LLM) است.

Nights-Lopez و همکارانش قابلیت های Chatgpt 3.5 و Chatgpt 4 را آزمایش کرده اند تا به 86 سؤال بر اساس متن از 2019 و 2021 AAOS Erbow خود ارزیابی پاسخ دهند.

به طور کلی ، ChatGPT 3.5 به 52.3 ٪ (45 نفر) از سؤالات به درستی پاسخ می داد ، در حالی که چتپ 4 به 73.3 ٪ (63 نفر) به درستی پاسخ می داد. توجه داشته باشید-لوپز و همكارانش خاطرنشان كردند كه هر دو نرخ پاسخ صحیح برای اعتبار CME از 50 ٪ فراتر رفته است.

عملکرد Chatgpt 4 در آناتومی (5 /61 ٪ در مقایسه با 30.8 ٪) ، بیماری مش، (76 ٪ در مقایسه با 60 ٪) ، علوم پایه (50 ٪ در مقایسه با 25 ٪) ، غیر جراحی (75 ٪ در مقایسه با 25 ٪) و شوک (81.8 ٪ در برابر 36.4 ٪) در مقایسه با ChatGPT 3.5.

شبهای-لوپز و همکارانش نوشت: “بهبود آموزش chatgpt ممکن است عملکرد و سود خود را به ،وان یک منبع بهبود بخشد.” “در حال حاضر ، ChatGPT هنوز قادر به پاسخگویی به سؤالات با دقت بالا به اندازه کافی برای جایگزینی تصمیمات بالینی نیست.”

من آن را منتشر کردم:

منابع/افشای

فروپاشی

افشای اطلاعات: شب ها-لوپز ، هرگونه افشای مالی مربوطه. لطفاً این مطالعه را برای همه نویسندگان دیگر افشای مالی مشاهده کنید.

یک موضوع را به هشدارهای ایمیل اضافه کنید

هنگام انتشار مقاله های جدید ، یک ایمیل دریافت کنید

لطفاً هنگام انتشار مقالات جدید ، آدرس ایمیل خود را برای دریافت ایمیل ارائه دهید بشر

<،on type="،on" cl،="btn btn-primary" data-loading-text="Loading <i cl،=" fa="" fa-spinner="" fa-spin="">data-work = “مش، شدن”> مش، شدن

ما نتوانستیم درخواست شما را اداره کنیم. لطفا بعداً دوباره امتحان کنید. اگر همچنان به این مشکل رسیدید ، لطفاً با [email protected] تماس بگیرید.

<،on data-dismiss="modal" cl،="btn btn-primary btn-lg btn-block">بازگشت به هیلو

منبع: https://www.healio.com/news/ort،pedics/20250214/chatgpt-35-and-4-exceeded-the-proficiency-thres،ld-on-aaos-s،ulder-elbow-examination