انسان ها ChatGPT را در آزمون های حسابداری شکست می دهند، امتیاز 29% بیشتر از ربات هوش مصنوعی اخبار فناوری

دهلی نو: محققان دریافتند که دانش آموزان در امتحانات حسابداری بهتر از ChatGPT، محصول چت بات OpenAI، عملکرد بهتری داشتند. با وجود این، آن‌ها گفتند که عملکرد ChatGPT «مطلوب» بود و این یک «تغییر بازی است که روش آموزش و یادگیری همه را تغییر می‌دهد – به سمت بهتر».

محققان دانشگاه بریگهام یانگ (BYU)، ایالات متحده و 186 دانشگاه دیگر می‌خواستند بدانند که فناوری OpenAI در امتحانات حسابداری چگونه عمل می‌کند. آنها یافته های خود را در مجله Issues in Accounting Education منتشر کرده اند.

در آزمون حسابداری محققین، دانش آموزان میانگین کلی 76.7 درصد را کسب کردند، در حالی که ChatGPT 47.4 درصد بود. در حالی که در 11.3 درصد از سؤالات، ChatGPT بالاتر از میانگین دانش آموز، به ویژه در سیستم های اطلاعات حسابداری (AIS) و حسابرسی خوب عمل می کرد، ربات هوش مصنوعی در ارزیابی های مالیاتی، مالی و مدیریتی عملکرد بدتری داشت. . محققان فکر می کنند که این احتمالاً می تواند به این دلیل باشد که ChatGPT با فرآیندهای ریاضی مورد نیاز برای نوع دوم دست و پنجه نرم می کند.

ربات هوش مصنوعی که از یادگیری ماشینی برای تولید متن زبان طبیعی استفاده می‌کند، در سؤالات درست/نادرست (68.7 درصد صحیح) و سؤالات چند گزینه‌ای (59.5 درصد) بهتر عمل می‌کند، اما با پاسخ کوتاه مشکل داشت. سوالات (بین 28.7 تا 39.1 درصد).

به طور کلی، محققان گفتند که پاسخ به سؤالات درجه بالاتر برای ChatGPT دشوارتر است. در واقع، گاهی اوقات ChatGPT برای ارائه توضیحات مکتوب معتبر برای پاسخ های نادرست، یا پاسخ به یک سوال مشابه به روش های مختلف یافت می شد.

آنها همچنین دریافتند که ChatGPT اغلب برای پاسخ های خود توضیحاتی ارائه می دهد، حتی اگر آنها نادرست باشند. در موارد دیگر، علی رغم ارائه توضیحات دقیق، پاسخ چند گزینه ای اشتباه را انتخاب کرد. محققان به طور مهمی خاطرنشان کردند که ChatGPT گاهی اوقات حقایقی را می سازد. به عنوان مثال، هنگام ارائه یک مرجع، یک مرجع واقعی ایجاد کرد که کاملاً ساخته شده بود. اثر و گاهی نویسندگان حتی وجود نداشتند.

همچنین مشاهده شد که این ربات دارای خطاهای ریاضی بی معنی مانند جمع کردن دو عدد در یک مسئله تفریق یا تقسیم اعداد اشتباه است. دیوید وود، نویسنده اصلی این مطالعه، استاد حسابداری دانشگاه BYU، برای افزودن به بحث‌های مداوم در مورد اینکه چگونه مدل‌هایی مانند ChatGPT باید در آموزش نقش داشته باشند، تصمیم گرفت تا حد امکان استادان را استخدام کند تا ببیند هوش مصنوعی در برابر حسابداری واقعی دانشگاه چگونه عمل می‌کند. دانش آموزان .

طرح جذب نویسنده همکار او در رسانه های اجتماعی منفجر شد: 327 نویسنده مشترک از 186 موسسه آموزشی در 14 کشور در این تحقیق شرکت کردند و 25181 سوال امتحان حسابداری کلاس درس را ارائه کردند. آنها همچنین دانشجویان BYU را در مقطع کارشناسی استخدام کردند تا 2268 سؤال دیگر از بانک آزمون کتاب درسی را به ChatGPT بدهند. سوالات شامل AIS، حسابرسی، حسابداری مالی، حسابداری مدیریتی و مالیات می‌شد و از نظر سختی و نوع (درست/نادرست، چند گزینه‌ای، پاسخ کوتاه) متفاوت بود.

انسان ها ChatGPT را در آزمون های حسابداری شکست می دهند، امتیاز 29% بیشتر از ربات هوش مصنوعی اخبار فناوری

Claudia Larsen

مطالب مرتبط:

مامای بازار خدور تمام عصبانیت!

اوکراین از دست دادن برق در نیروگاه هسته‌ای نشان‌دهنده وضعیت ایمنی «بسیار آسیب‌پذیر» است

فرارو (فیلم) خلاصه بازی بارسلونا 1