Պատկերների գեներացում բարդ հրահանգներով. GPT-4o-ի նոր հնարավորությունները հասանելի են ChatGPT-ում

OpenAI-ը ներկայացրել է նորագույն հնարավորությունը՝ 4o Image Generation, որը թույլ է տալիս օգտատերերին ստեղծել բարձր ճշգրտությամբ պատկերներ անմիջապես ChatGPT-ի միջերեսից՝ օգտագործելով GPT-4o մուլտիմոդալ մոդելը։ Սա զգալի առաջխաղացում է համեմատած նախկին DALL·E 3 համակարգի հետ՝ առաջարկելով ավելի հստակ, բարդ և առանց սխալների գեներացված արդյունքներ:

Ի՞նչ է 4o Image Generation-ը

4o Image Generation-ը նոր պատկերագրական տեխնոլոգիա է, որը հիմնված է GPT-4o մոդելի հնարավորությունների վրա։ Այն թույլ է տալիս գեներացնել պատկերներ՝ հասկանալով ոչ միայն պարզ հրահանգներ, այլև՝

համատեքստային տեղեկատվությունը,
բարդ փոխազդեցությունները օբյեկտների միջև,
տեքստի ինտեգրումը պատկերում՝ առանց տառասխալների և արտեֆակտների։

Այս գործառույթը հասանելի կլինի բոլոր օգտատերերի համար արդեն այսօր, ընդ որում՝ անվճար օգտատերերի համար օրական սահմանաչափը մնում է նույնը՝ 3 պատկեր, ինչպես DALL·E-ի դեպքում։

Ինչով է առանձնանում 4o Image Generation-ը

Բարդ հրահանգների ճիշտ մշակումը
GPT-4o-ն կարող է ճշգրտորեն գեներացնել պատկերներ, որոնք պարունակում են միաժամանակ 15-20 տարբեր տարր, այն դեպքում, երբ մյուս մոդելները շփոթվում են նույնիսկ 5-8 տարրի պարագայում։
Անթերի տեքստային ներկայացում
Տեքստային տարրերի ճիշտ արտացոլումը պատկերի վրա եղել է մի խնդիրը, որը երկար ժամանակ չի լուծվել պատշաճ կերպով։ Նոր մոդելը ապահովում է տեքստի ընթեռնելիություն, անթերի տառատեսք, առանց սխալների բովանդակություն, ինչը հատկապես կարևոր է պաստառների, լոգոների, մենյուների, կոմիքսների և գրաֆիկական ներկայացումների ստեղծման ժամանակ։
Նորարար գեներացման մեթոդ
4o Image Generation-ը պատկերները գեներացնում է հաջորդական կարգով՝ ձախից աջ և վերևից ներքև, այլ ոչ թե ամբողջական բլոկով, ինչի շնորհիվ հնարավոր է հասնել առավել ճշգրիտ շերտավորման և կառուցվածքի:
Պատկերների խմբագրում ըստ հրահանգների
Նոր գործառույթը թույլ է տալիս նաև օգտատիրոջ կողմից վերբեռնված պատկերների խմբագրում պարզ հրահանգներով՝ ավելացնելով կամ հեռացնելով տարրեր, առանց գրաֆիկական ծրագրերի անհրաժեշտության։

Գործնական կիրառություններ

OpenAI-ն արդեն ցուցադրել է նոր մոդելի կիրառման մի շարք օրինակներ, այդ թվում՝

Գիտական դիագրամների ստեղծում (օր․՝ Նյուտոնի պրիզմայի փորձ),
Կոմիքսների և ինտերակտիվ պաստառների գեներացում,
Լոգոների և մենյուների պատրաստում թափանցիկ ֆոնով,
Սթիքերների, ինֆոգրաֆիկայի և բրենդային նյութերի ձևավորում։

Այս բոլոր առաջադրանքներն ավարտվել են առանց գեներացված տեքստում սխալների կամ ձևաչափային խախտումների։

***

4o Image Generation-ը մեծ քայլ է դեպի լիարժեք մուլտիմոդալ ստեղծագործական գործիք՝ հասանելի նույնիսկ անփորձ օգտատերերին։ Այն միավորում է լեզվային ընկալման ուժը և պատկերային ճշգրտությունը՝ մի պլատֆորմի մեջ, ինչպիսին է ChatGPT-ն։ Անկախ նրանից՝ ցանկանում եք ստեղծել պրոֆեսիոնալ պաստառ, տեսողական բովանդակություն սոցիալական ցանցերի համար, թե պարզ գրաֆիկ ձեր նախագծի համար՝ այս գործիքը կարող է դառնալ ձեր ամենօրյա աշխատանքային օգնակիցներից մեկը։

Բաժանորդագրվեք մեր Տելեգրամյան ալիքին՝ բիզնես ոլորտի ամենաթարմ և կարևոր նորություններին առաջինը ծանոթանալու համար: