ՀՐԱՏԱՊ. Սյունիքում տեղի ունեցած ավտոբուսի վթարի հետևանքով նախնական տվյալներով կա 4 զոհ և 9 տուժած. ՆԳՆ (20:25)
Bitcoin-ի փոխարժեքը նվազել է. 27/04/24
Հնդկաստանը պատրաստվում է առևտրային համաձայնագիր ստորագրել Օմանի հետ Մերձավոր Արևելքում իր կապերն ընդլայնելու համար
Հնդկական India Yes Bank-ի զուտ շահույթն ավելի քան կրկնապատկվել է հունվար-մարտին
1965թ. ապրիլի 27-ին ԱՄՆ-ում արտոնագիր է տրվել առաջին միանգամյա օգտագործման տակդիրի՝ «Պամպերսի» համար
2001թ. ապրիլի 27-ին «Հրազդանցեմենտ» ՓԲԸ-ն վաճառվել է «Միկա-Արմենիա» ընկերությանը 415 մլն դրամով
1992թ. ապրիլի 27-ին Հայաստանը դարձել է Արժույթի միջազգային հիմնադրամի անդամ-երկիր
Օդի ջերմաստիճանը կբարձրանա, առանձին շրջաններում սպասվում է կարճատև անձրև և ամպրոպ
Ինչպես օգտագործել հայկական մշակութային ժառանգությունը բիզնեսի զարգացման համար. հոդվածը կարող եք կարդալ abnews.am կայքում
Ներդրողների համար լուրերին կարող եք ծանոթանալ abnews.am կայքում
Որտե՞ղ գտնել ոգեշնչում ձեր մարքեթինգային արշավի համար. դասեր հայկական շուկայից. կարդացեք abnews.am կայքում
Ժամանակակից հայկական բիզնեսի 7 կարևոր կանոնները կարդացեք abnews.am կայքում
Եվրոպական բաժնետոմսերը հունվարից ի վեր լավագույն շաբաթն են գրանցում ուժեղ շահույթով
Ռուսաստանի Բանկի տնօրենների խորհուրդը երրորդ նիստն անընդմեջ պահպանում է հիմնական տոկոսադրույքը 16% մակարդակում
Բայդենի վարչակազմը հետաձգում է մենթոլի ծխախոտն արգելելու առաջարկը
Chevron-ի և Exxon-ի բաժնետոմսերը անկում են ապրում, քանի որ նավթի վերամշակման մարժաների նվազում հարվածում է շահույթին
Hermes-ը կարող է առաջ անցնել Louis Vuitton-ից որպես լավագույն ապրանքանիշ
Paramount-ի խորհուրդը քննարկում է գործադիր տնօրենի պաշտոնանկությունը վաճառքի շուրջ բանակցությունների ֆոնին
American Airlines-ը մինչև 2025 թվականը կրճատում է որոշ միջազգային չվերթներ՝ պատճառաբանելով Boeing-ի մատակարարումների ուշացումները
Չինաստանին Ռուսաստանի վճարումների կեսը կատարվել է միջնորդների միջոցով. Reuters

ChatGPT-4-ի պատասխանի ճշգրտությունը մի քանի ամսում 97%-ից իջել է մինչև 2,4%

Հլս 28, 2023 17:44
38
ADS

Ստենֆորդի համալսարանի և Կալիֆորնիայի համալսարանի հետազոտողների թիմը պարզել է, որ ChatGPT-ի վճարովի տարբերակի պատասխանների ճշգրտությունը կտրուկ նվազել է:

Գիտնականները պարզել են, որ եթե այս տարվա մարտին ChatGPT-4-ը մաթեմատիկական խնդիրներ էր լուծում 97,6% ճշգրտությամբ, ապա հունիսին այդ ցուցանիշը կտրուկ իջել էր մինչև 2,4%:

Միևնույն ժամանակ, GPT-3.5 տարբերակի պատասխանների ճշգրտությունը միայն աճում է։ Եթե ​​մարտին մաթեմատիկական հաշվարկների ճշգրտությունը կազմել է 7,4%, ապա հունիսին այն աճել է մինչև 86,8%։

Բացի մաթեմատիկական հաշվարկներից, գիտնականները վերլուծել են AI մոդելների ճշգրտության դինամիկան կոդերի ստեղծման, տեսողական մտածողության և զգայուն կամ վտանգավոր հարցերի պատասխանների առումով:

Փոխվել են GPT-4-ի՝ վտանգավոր հարցերին պատասխանելու ցուցանիշները, հունիսին բոտն ավելի քիչ պատասխաններ է տվել, քան մարտին։ Միևնույն ժամանակ, երկու տարբերակներն էլ հունիսից դադարեցրել են բացատրել, թե ինչու չեն կարողացել պատասխանել այս կամ այն ​​հարցին։ Դեռ մարտին օգտատերերը մանրամասն բացատրություն էին ստանում։

Բացի այդ, ավելացել է ծրագրային կոդի գեներացման սխալների թիվը։ Եթե ​​մարտին GPT-4-ը կատարել է հանձնարարված 50 առաջադրանքների 50%-ը, ապա հունիսին կարողացել է կատարել միայն 10%-ը։ Նման միտում է նկատվում GPT-3.5 տարբերակում:

Ի դեպ, վերջին շաբաթների ընթացքում օգտատերերը նույնպես դժգոհում են ChatGPT-ի «մտավոր ունակությունների» նվազումից։ Միաժամանակ, դեռ պարզ չէ, թե ինչու է դա տեղի ունեցել, և արդյոք OpenAI-ն ինչ-որ բան կձեռնարկի, թե՝ ոչ։

Մեկնաբանություն