
OpenAI-ը ներկայացրել է նորագույն հնարավորությունը՝ 4o Image Generation, որը թույլ է տալիս օգտատերերին ստեղծել բարձր ճշգրտությամբ պատկերներ անմիջապես ChatGPT-ի միջերեսից՝ օգտագործելով GPT-4o մուլտիմոդալ մոդելը։ Սա զգալի առաջխաղացում է համեմատած նախկին DALL·E 3 համակարգի հետ՝ առաջարկելով ավելի հստակ, բարդ և առանց սխալների գեներացված արդյունքներ:
Ի՞նչ է 4o Image Generation-ը
4o Image Generation-ը նոր պատկերագրական տեխնոլոգիա է, որը հիմնված է GPT-4o մոդելի հնարավորությունների վրա։ Այն թույլ է տալիս գեներացնել պատկերներ՝ հասկանալով ոչ միայն պարզ հրահանգներ, այլև՝
-
համատեքստային տեղեկատվությունը,
-
բարդ փոխազդեցությունները օբյեկտների միջև,
-
տեքստի ինտեգրումը պատկերում՝ առանց տառասխալների և արտեֆակտների։
Այս գործառույթը հասանելի կլինի բոլոր օգտատերերի համար արդեն այսօր, ընդ որում՝ անվճար օգտատերերի համար օրական սահմանաչափը մնում է նույնը՝ 3 պատկեր, ինչպես DALL·E-ի դեպքում։
Ինչով է առանձնանում 4o Image Generation-ը
-
Բարդ հրահանգների ճիշտ մշակումը
GPT-4o-ն կարող է ճշգրտորեն գեներացնել պատկերներ, որոնք պարունակում են միաժամանակ 15-20 տարբեր տարր, այն դեպքում, երբ մյուս մոդելները շփոթվում են նույնիսկ 5-8 տարրի պարագայում։ -
Անթերի տեքստային ներկայացում
Տեքստային տարրերի ճիշտ արտացոլումը պատկերի վրա եղել է մի խնդիրը, որը երկար ժամանակ չի լուծվել պատշաճ կերպով։ Նոր մոդելը ապահովում է տեքստի ընթեռնելիություն, անթերի տառատեսք, առանց սխալների բովանդակություն, ինչը հատկապես կարևոր է պաստառների, լոգոների, մենյուների, կոմիքսների և գրաֆիկական ներկայացումների ստեղծման ժամանակ։ -
Նորարար գեներացման մեթոդ
4o Image Generation-ը պատկերները գեներացնում է հաջորդական կարգով՝ ձախից աջ և վերևից ներքև, այլ ոչ թե ամբողջական բլոկով, ինչի շնորհիվ հնարավոր է հասնել առավել ճշգրիտ շերտավորման և կառուցվածքի: -
Պատկերների խմբագրում ըստ հրահանգների
Նոր գործառույթը թույլ է տալիս նաև օգտատիրոջ կողմից վերբեռնված պատկերների խմբագրում պարզ հրահանգներով՝ ավելացնելով կամ հեռացնելով տարրեր, առանց գրաֆիկական ծրագրերի անհրաժեշտության։
Գործնական կիրառություններ
OpenAI-ն արդեն ցուցադրել է նոր մոդելի կիրառման մի շարք օրինակներ, այդ թվում՝
-
Գիտական դիագրամների ստեղծում (օր․՝ Նյուտոնի պրիզմայի փորձ),
-
Կոմիքսների և ինտերակտիվ պաստառների գեներացում,
-
Լոգոների և մենյուների պատրաստում թափանցիկ ֆոնով,
-
Սթիքերների, ինֆոգրաֆիկայի և բրենդային նյութերի ձևավորում։
Այս բոլոր առաջադրանքներն ավարտվել են առանց գեներացված տեքստում սխալների կամ ձևաչափային խախտումների։
***
4o Image Generation-ը մեծ քայլ է դեպի լիարժեք մուլտիմոդալ ստեղծագործական գործիք՝ հասանելի նույնիսկ անփորձ օգտատերերին։ Այն միավորում է լեզվային ընկալման ուժը և պատկերային ճշգրտությունը՝ մի պլատֆորմի մեջ, ինչպիսին է ChatGPT-ն։ Անկախ նրանից՝ ցանկանում եք ստեղծել պրոֆեսիոնալ պաստառ, տեսողական բովանդակություն սոցիալական ցանցերի համար, թե պարզ գրաֆիկ ձեր նախագծի համար՝ այս գործիքը կարող է դառնալ ձեր ամենօրյա աշխատանքային օգնակիցներից մեկը։