Ինչպե՞ս DeepSeek-ը դարձավ վիրուսային
DeepSeek-ը՝ չինական արհեստական բանականության (AI) լաբորատորիան, այս շաբաթ գրավեց ուշադրությունը՝ բարձրանալով Apple App Store-ի AI chatbot հավելվածների առաջատար հորիզոնական: Այս իրադարձությունը ստիպեց Ուոլ Սթրիթի վերլուծաբաններին և տեխնոլոգիական ոլորտի մասնագետներին կասկածի տակ առնել ԱՄՆ-ի գերակայությունը AI մրցավազքում և դրա ազդեցությունը AI չիպերի պահանջարկի վրա:
DeepSeek-ի ծագումը
DeepSeek-ը հիմնադրվել է որպես հետազոտական լաբորատորիա՝ կապված High-Flyer Capital Management-ի հետ, որը Չինաստանի առաջատար քանակական հեջ-ֆոնդերից մեկն է: High-Flyer-ը հիմնադրվել է 2015-ին Լիանգ Վենֆենգի կողմից, ով հետագայում 2019-ին ստեղծեց ֆոնդային կառավարման ընկերություն, հիմնված AI ալգորիթմների վրա:
2023-ին High-Flyer-ը ստեղծեց DeepSeek-ը՝ որպես առանձին AI հետազոտական լաբորատորիա: Մինչև պաշտոնապես առանձին ընկերություն դառնալը, DeepSeek-ը կառուցեց իր սեփական տվյալների կենտրոնները, սակայն ստիպված եղավ գործել ԱՄՆ-ի արտահանման սահմանափակումների ներքո, ինչը սահմանափակեց առաջադեմ Nvidia H100 չիպերի հասանելիությունը՝ փոխարենը ստիպելով օգտագործել ավելի թույլ H800 տարբերակը:
DeepSeek-ի տեխնիկական թիմը
Ընկերությունը մեծ ուշադրություն է դարձնում AI հետազոտությանը և աշխատանքի է ընդունում բարձրակարգ մասնագետների Չինաստանի լավագույն համալսարաններից, ներառյալ գիտությունների թեկնածուներ և ոլորտային փորձագետներ: Բացի այդ, DeepSeek-ը ներգրավում է նաև մասնագետների՝ առանց համակարգչային գիտության նախապատմության, ինչը թույլ է տալիս ստեղծել լայնածավալ թեմատիկ գիտելիքներ՝ AI մոդելների կատարելագործման համար:
DeepSeek-ի AI մոդելները
DeepSeek-ը իր առաջին մոդելները՝ DeepSeek Coder, DeepSeek LLM և DeepSeek Chat, թողարկեց 2023-ի նոյեմբերին։ Սակայն իրական բեկումը տեղի ունեցավ 2024-ի գարնանը՝ DeepSeek-V2 սերնդի մոդելների թողարկմամբ։ Այս մոդելները առաջարկեցին էժանագին, բայց բարձրորակ լուծումներ, ինչի արդյունքում մրցակիցները, այդ թվում՝ ByteDance-ը և Alibaba-ն, ստիպված եղան նվազեցնել իրենց մոդելների գները կամ առաջարկել դրանք անվճար:
2024-ի դեկտեմբերին թողարկված DeepSeek-V3 մոդելը նոր մակարդակի հասցրեց ընկերության համբավը։ Ըստ ընկերության՝ DeepSeek-V3-ը գերազանցում է ինչպես բաց կոդով մոդելները (օրինակ՝ Meta-ի Llama-ն), այնպես էլ API-ով հասանելի փակ մոդելները (օրինակ՝ OpenAI-ի GPT-4o-ն):
Հատկապես ուշագրավ է DeepSeek R1 «պատճառաբանության» մոդելը, որը ներկայացվեց 2025-ի հունվարին։ Այս մոդելն առանձնանում է ինքնավերահսկման ունակությամբ, ինչը նվազեցնում է սխալների հավանականությունը, հատկապես գիտական և մաթեմատիկական ոլորտներում։
DeepSeek-ի սահմանափակումները
Չինաստանում գործող այլ AI մոդելների նման, DeepSeek-ը նույնպես ենթարկվում է չինական կառավարության վերահսկողությանը։ Ընկերության chatbot-ը չի պատասխանում քաղաքական զգայուն հարցերին, ինչպիսիք են Տյանանմեն հրապարակի իրադարձությունները կամ Թայվանի ինքնավարությունը:
DeepSeek-ի ազդեցությունը շուկայի վրա
DeepSeek-ի մատչելի մոդելների հայտնվելը խառնաշփոթ առաջացրեց տեխնոլոգիական շուկայում։ Nvidia-ի բաժնետոմսերը երկուշաբթի օրը կտրուկ նվազեցին՝ կորցնելով մոտ 593 միլիարդ դոլար շուկայական արժեք, ինչը ռեկորդային կորուստ էր: Հաջորդ օրը որոշ ներդրողներ սկսեցին վերադառնալ, սակայն ընդհանուր անկումը ստիպեց շուկայի մասնագետներին վերանայել AI արդյունաբերության հեռանկարները:
ԱՄՆ-ի տեխնոլոգիական հսկաները, ներառյալ Microsoft-ը և OpenAI-ն, արձագանքեցին DeepSeek-ի աճող մրցունակությանը։ OpenAI-ի գործադիր տնօրեն Սեմ Ալթմանը DeepSeek-ի մոդելները բնութագրեց որպես «տպավորիչ», մինչդեռ ԱՄՆ նախագահ Դոնալդ Թրամփը նշեց, որ սա «արթնացման կոչ» է ամերիկյան AI արդյունաբերության համար։
Ապագա հեռանկարներ
Չնայած DeepSeek-ի հաջողությանը, մնում են բազմաթիվ հարցեր․
- ԱՄՆ կառավարությունը մտահոգված է չինական AI մոդելների աճող ազդեցությամբ։
- AI չիպերի պահանջարկը կարող է վերանայվել՝ հաշվի առնելով էժան և մրցունակ մոդելների հայտնվելը։
- Ներդրողները ավելի զգուշավոր են դարձել AI բաժնետոմսերի նկատմամբ։
DeepSeek-ը ցույց տվեց, որ չինական AI տեխնոլոգիաները կարող են հավասարվել կամ նույնիսկ գերազանցել ամերիկյան մրցակիցներին։ Բայց արդյո՞ք սա երկարաժամկետ կտրվածքով կփոխի AI մրցակցության բալանսը՝ դեռ պարզ չէ։
Աղբյուր՝ TechCrunch, Reuters