BRICS-ի երկրները հրաժարվել են փոխարինել դոլարը՝ 150% մաքսատուրքերի սպառնալիքի պատճառով. Դոնալդ Թրամփ
Եգիպտոսում վերջին 1 դարում առաջին անգամ փարավոնի դամբարան է հայտնաբերվել
Ապահովագրական ընկերությունները մեկ օրում ավելի քան 1000 վթար են գրանցել
ՀՀ–ում ԱՊՊԱ պայմանագրեր սպասարկող ընկերությունները 1 օրում ավելի քան 1000 վթար են գրանցել
Թրամփի անվամբ թողարկված կրիպտոարժույթը երկու շաբաթում փոխեց շուկան. ինչ դասեր են քաղում ներդրողները. մանրամասները՝ ABNews.am կայքում
2024-ին Թբիլիսիում վաճառվել է ավելի քան 40.3 հազար բնակարան
Evocabank-ի «Հանրապետության» մասնաճյուղն արդեն բաց է. մանրամասները՝ ABNews.am կայքում
Անկարայում հինգ օրվա ընթացքում երկրորդ երկրաշարժն է տեղի ունեցել
Չինաստանում չղջիկների մոտ կորոնավիրուսի նոր տեսակ են հայտնաբերել
Մայրենի լեզվի օրը ԱրարատԲանկն ամփոփեց Մատենադարանի հետ բացառիկ ծրագրի արդյունքները. մանրամասները՝ ABNews.am կայքում
Երևանում ձյան շերտի բարձրությունը հասել էր 40-50 սմ-ի
Ինչպես աշխատել արտասահմանյան ընկերությունների հետ՝ առանց երկիրը լքելու. մանրամասները՝ ABNews.am կայքում
Հայաստանի տնտեսությունը 2024թ․ գրանցել է 5.9% աճ. ՀՆԱ-ն հասել է 10.13 տրլն դրամի
ԵՄ 27 երկրների դեսպանները հաստատել են ՌԴ-ի դեմ պատժամիջոցների 16-րդ փաթեթը
Կոնվերս բանկի հաջողության պատմությունը` Ֆիլիպ Կոտլերի «Ժամանակակից մարքեթինգի հիմունքներ» գրքում. դիտեք ABNews.am կայքում
2025-ի հունվարին Վրաստանի ապրանքաշրջանառությունն աճել է 39.3%
Եվրոպական կենտրոնական բանկի տարեկան վնասը հասել է ռեկորդային 7,9 մլրդ եվրոյի
SpaceX-ի նոր ռեկորդը. Falcon 9-ը արձակվեց մեկ երկրից, վայրէջք կատարեց մեկ այլում. մանրամասները՝ ABNews.am կայքում
Թուրքիան մտադիր է Ուկրաինայի հետ առևտրի ծավալները հասցնել 10 մլրդ դոլարի
Ինչ փոփոխություններ են սպասվում տրանսպորտային ոլորտում, և ինչպես դա կազդի ուղևորների վրա. մանրամասները՝ ABNews.am կայքում

ChatGPT-4-ի պատասխանի ճշգրտությունը մի քանի ամսում 97%-ից իջել է մինչև 2,4%

Հլս 28, 2023 17:44
43
ADS

Ստենֆորդի համալսարանի և Կալիֆորնիայի համալսարանի հետազոտողների թիմը պարզել է, որ ChatGPT-ի վճարովի տարբերակի պատասխանների ճշգրտությունը կտրուկ նվազել է:

Գիտնականները պարզել են, որ եթե այս տարվա մարտին ChatGPT-4-ը մաթեմատիկական խնդիրներ էր լուծում 97,6% ճշգրտությամբ, ապա հունիսին այդ ցուցանիշը կտրուկ իջել էր մինչև 2,4%:

Միևնույն ժամանակ, GPT-3.5 տարբերակի պատասխանների ճշգրտությունը միայն աճում է։ Եթե ​​մարտին մաթեմատիկական հաշվարկների ճշգրտությունը կազմել է 7,4%, ապա հունիսին այն աճել է մինչև 86,8%։

Բացի մաթեմատիկական հաշվարկներից, գիտնականները վերլուծել են AI մոդելների ճշգրտության դինամիկան կոդերի ստեղծման, տեսողական մտածողության և զգայուն կամ վտանգավոր հարցերի պատասխանների առումով:

Փոխվել են GPT-4-ի՝ վտանգավոր հարցերին պատասխանելու ցուցանիշները, հունիսին բոտն ավելի քիչ պատասխաններ է տվել, քան մարտին։ Միևնույն ժամանակ, երկու տարբերակներն էլ հունիսից դադարեցրել են բացատրել, թե ինչու չեն կարողացել պատասխանել այս կամ այն ​​հարցին։ Դեռ մարտին օգտատերերը մանրամասն բացատրություն էին ստանում։

Բացի այդ, ավելացել է ծրագրային կոդի գեներացման սխալների թիվը։ Եթե ​​մարտին GPT-4-ը կատարել է հանձնարարված 50 առաջադրանքների 50%-ը, ապա հունիսին կարողացել է կատարել միայն 10%-ը։ Նման միտում է նկատվում GPT-3.5 տարբերակում:

Ի դեպ, վերջին շաբաթների ընթացքում օգտատերերը նույնպես դժգոհում են ChatGPT-ի «մտավոր ունակությունների» նվազումից։ Միաժամանակ, դեռ պարզ չէ, թե ինչու է դա տեղի ունեցել, և արդյոք OpenAI-ն ինչ-որ բան կձեռնարկի, թե՝ ոչ։