Alibaba өзінің Qwen 2.5 Max ИИ моделін DeepSeek-тің табысты шығарылымынан кейін таныстырды
Фото: Shutterstock.
Кеше Қытай әлемді нейросеть DeepSeek-ті шығарумен таң қалдырды. Жаңа өнімнің қуаты және оны аз ғана бюджетпен (12 миллион доллар, америкалық бәсекелестердің жүздеген миллиондарына қарсы) жасау Силикон алқабында үлкен әсер қалдырды. Батыс ИИ-компанияларының акциялары күрт төмендеді, мысалы, чип өндіруші Nvidia бір мезетте 600 миллиард доллар жоғалтты. Бірақ батыс үшін апат жалғыз келмейді. Қытайдың жаңа жылының бірінші күні ірі ИИ-ойыншы Alibaba нейросеть Qwen 2.5 Max-ті таныстырды, және ол одан да қуатты. Мұндай қарқынмен Қытайдың жетекшілігі даусыз болып келеді.
Alibaba – Қытайда Open AI сияқты, компания ұзақ уақыт бойы сәтті жұмыс істеп келеді. Өткен жылдың көктемінде Қытайдың технологиялық көкжиегіне жаңа (2023 жылы құрылған) DeepSeek компаниясы келді. Батыста олардың нейросеть-нің бірінші нұсқасы байқалмады (қазір өкініп отыр). Ал Қытайда ол үлкен шу тудырды. Alibaba-да жиналыстар мен дағдарыс штабтары жиналды. Жастар бізден озып кетті!
Енді жаңа бетбұрыс. Alibaba-ның желісі ішкі нарықты жаулап алуда, ал DeepSeek-пен бірге олар халықаралық нарықты да өздеріне тартып жатыр.
Alibaba-ның өнімі DeepSeek-ті нейросетьтің мүмкіндіктерін сынаудың барлық тесттерінде (бенчмарктерінде) озып шықты. Желінің жауап дәлдігі, деректерді өңдеу жылдамдығы және адаптивтілігі әлдеқайда жоғары болды. Бұл таңқаларлық емес: оны мұқият оқытқан.
Шын мәнінде, нейросет жасаушылар ұзақ уақыт бойы білім беруде бәсекелесуде. Америкалық Open AI-ға сенсек, бұл өте қымбат әрі ұзақ процесс. Мысалы, Open AI келесі буын GPT, GPT5-ті оқытуға миллиард доллар жұмсамақ. Компаниялар оқу орталықтарын қуаттандыру үшін тұтас электр станцияларын сатып алады. Ал контентті ұрлау (Интернетте, әлеуметтік желілерде, тіпті жеке деректерде) даулар мен талқылаулардың тақырыбына айналды. Бірақ контент өте қажет, өйткені ИИ-ге адамдардың өмірін зерттеу үшін мысалдар қажет.
DeepSeek үлкен нейросетьке айналды, өйткені ол небәрі 5,5 миллион долларға оқытылды (дегенмен, кейбір шығындар есепке алынбағаны айтылады; бәрібір арзан), ал нәтиже жақсы болды. Нейросеть GPT4-тен кем емес, бірақ жүздеген есе арзанға түсті.
Qwen минималды шығынмен оқытылған жоқ. Оған 20 триллион ақпарат (токен) енгізілді, сонымен қатар нәзік баптау әдістемелері (SFT) және адаммен кері байланыс (RLHF) қолданылды, яғни ең заманауи әдістер қолданылды. Бұл DeepSeek-ке қарағанда тез болмайды, бірақ жақсы болады. Qwen қазіргі американ аналогтарынан да асып түсті.
Alibaba желіні арзан оқытты деп мәлімдемейді. Бірақ американдықтарға қарағанда арзан екенін білдіреді. Компания қалай оқытқанын егжей-тегжейлі баяндады. Бұл баяндауда сарапшыларды ең қатты таңғалдырғаны – әр кезеңдегі оңтайландыру. Нәтижесінде оқыту (және кейінгі жұмыс) үшін минималды есептеу қуаты қажет.
Qwen бір уақытта 1 миллион ақпарат бірлігін өңдей алатыны хабарланды. Бұл, егер сіз бір сәтте «Сақиналардың әміршісі» көлеміндегі 10 романның сөзбе-сөз басыңызда болушы еді. Сарапшылар бұл ИИ-нің дамуы үшін шешуші сәт екенін жазады. Көптеген нейросеттер 120 мың ақпарат бірлігінен артық есте сақтай алмайды.
Дамуышылар қазір тестілеуге кірісті: желі еркін лицензия бойынша эксперименттер жүргізуге қолжетімді.
Qwen-де, DeepSeek секілді, чат бар, және нейросетпен сөйлесуге болады (тіркелгеннен кейін), бірақ негізінен Qwen – бұл құралдар жиынтығы, ал озық пайдаланушылар оны өздеріне бейімдеп, мысалы, суреттер жасау, компьютерлік кодтарды талдау, инженерлік және ғылыми мәселелерді шешу үшін пайдалана алады.
Шындығында, біз білетін GPT-тің жұмыс істеу тәсілі осындай. Сіз, бәлкім, GPT-ке көмек сұраған шығарсыз, бірақ оны қайдан таптыңыз? Сіз оны өзіңіз жүктеп алған жоқсыз, мысалы, телеграмда, немесе бір сайтта. Бұл, демек, біреу негізгі жүйеге қол жеткізіп, оны бейімдеп, енді қарапайым пайдаланушыларға ұсынуда. Оның мүддесі – әдетте, телеграм-каналға немесе сайтқа енгізілетін жарнама немесе ИИ жасаған сурет-тексттердің авторлық құқықтары.
Ресейлік пайдаланушылардан пікірлер әзірге аз, ал Батыста жаңалықтар қызықтырды.
DeepSeek-тің шығуы АҚШ президентінің назарын аударды: Дональд Трамп әлемдік бәсекелестіктің күшейіп жатқанын айтты, және америкалық компанияларға одан да көп күш салу қажет екенін ескертті.
Трамп командасы ИИ-технологияларына өте байыпты қарайды. Олар түсінеді: қуатты ИИ-ге ие болу қазіргі әлемге ие болу деген сөз. Сіздің жауыңыздың қолындағы ИИ сіздің барлық құпияларыңызды ашып көрсетеді. Қуатты ИИ – жаңа дәрі-дәрмек, техника, қару әзірлеуді тездету болып табылады.
Америка не істей алады? Сарапшылар америкалық компаниялардың ең жақсы жағдайда еместігімен келіседі. Біріншіден, олар бірінші болып шығып, қазір «айқын» болып жатқан нәрселерге көп ақша жұмсады. Бұл мобильді байланыспен байланысты: алғашқы телефондар мен тарифтер қымбат болды. Екіншіден, ірі компаниялар қазірдің өзінде майланған және қарқынын жоғалтқан. Жалақы мен қажетсіз жобаларға үлкен шығындар, менеджердің инженерден басым болуы – бәрі бұрынғыдай.
Батыс жаңа күштермен жарысқа кірісу үшін жас, агрессивті стартаптарды шығара ала ма? Мүмкін, бірақ оларға дағдарыс кезеңінен өту керек болады.
Дегенмен, 2025 жыл шын мәнінде ИИ жылы болып келеді, бірақ Open AI-дің керемет нейросеть шығарумен байланысты емес. Барлығы әлдеқайда қызықты.