Analize și opinii

Dan Diaconu: Evoluții

O să încep cu cel mai mare eșec din istoria AI: Builder.ai, un startup britanic evaluat la 1,5 mld. $ după ce Microsoft a împins în el vreo 455 mln. $, a dat faliment. Motivul? Viola Credit, care dăduse un credit de 50 mln.$ anul trecut a luat ce-a mai găsit prin conturile companiei, adică vreo 37 mln. $, lăsând compania cu doar 5 milioane $ în conturi. Doar că acei bani nu sunt în Anglia – unde operează firma – ci în … India, de unde nu pot fi aduși din cauza unor restricții.
Acum vine partea cu adevărat frumoasă: ce caută banii companiei în India? Ei bine, treaba e importantă: startup-ul britanic pretindea că deține o tehnologie AI importantă – Natasha neural network – care face ca un program să fie construit în zile sau săptămâni față de luni sau ani. Interesant, nu-i așa? Doar că „Natasha neural network” s-a dovedit a fi o echipă de 700 de programatori indieni. Ar fi de plâns dacă n-ar fi de râs! Exact: nu era nici vorbă de AI, ci de niște robi IT care făceau toată munca în spate. Toată treaba începe să pută mai rău ca la Dotcom!

Pe X, David Sacks scrie cu năduf:

Nimeni nu a fost luat mai prin surprindere de momentul DeepSeek în afara damnaților cu inteligență artificială.

Ei susțineau:

că SUA erau cu ani înaintea în domeniul inteligenței artificiale;
că liderilor chinezi nu le păsa prea mult de inteligența artificială;
că China ar acorda prioritate stabilității în detrimentul perturbărilor; și
că, dacă SUA ar încetini dezvoltarea inteligenței artificiale, și China ar încetini ritmul.
Toate acestea s-au dovedit a fi profund greșite. Acum, în mod ironic, mulți dintre „damnați” – care înainte de DeepSeek încercaseră să interzică modelele americane utilizate în prezent – încearcă să se redenumească „Șoimii Chinei”. Dacă ar fi avut ce voiau, SUA ar fi pierdut deja cursa inteligenței artificiale!

Între altele, arată cu degetul și către Musk, cel care spusese că ar trebui luată o pauză în dezvoltarea modelelor AI deoarece pot produce dezastre mari în condițiile în care nu sunt suficient supravegheate și dacă nu se stabilesc anumite limite ale dezvoltării lor. Dincolo însă de răfuielile dintre americani, avem câteva chestiuni cât se poate de clare.

ChatGPT 3.5 a fost lansat în noiembrie 2022, a avut un update prin martie 2023(ChatGPT 4), după care până prin septembrie 2024 – când au venit cu un preview al o1- nu s-a întâmplat nimic. Tot AI-ul însemna OpenAI. Concurenții săi americani au apărut tot prin 2024, mai precis Anthropic, cu al său Claude.

Ce se întâmpla în China? Mai nimic. Ăia de la Alibaba au lansat prin 2023 Qwen 7b(adică având 7 miliarde de parametri). A fost slab, dar acela era abia începutul.În decembrie 2023, Alibaba a scos Qwen 1.5 cu 72 miliarde de parametri, atingând performanțele lui ChatGPT 3.5! Practic, putem spune că cei de la Alibaba au ajuns în câteva luni cu doar un an în urma liderului lumii AI, ceea ce e impresionant. Însă treburile nu se opresc aici.

În septembrie 2024, Zhipu AI – un startup chinezesc puțin cunoscut – a scos un model extrem de puternic, GLM-4-plus, care a atins performanțele GPT4 de la începutul anului. A urmat în octombrie Qwen 2.5 Plus care aatins performanțekle o1!! Doar că erau unele diferențe în favoarea OpenAI.

StepFun, un alt startup chinezesc apărut de nicăieri, a lansat LLM-Step2 care a devenit lider, dar pentru scurt timp deoarece, în decembrie 2024 avea să apară DeepSeek V3, cel mai bun model non-rațional al lumii. N-a trecut însă decât o lună până când DeepSeek a venit cu R1, care se apropia teribil de OpenAI, iar recent a venit cu o iterație la R1 care se apropie extrem de mult de OpenAI. Ca idee, există o clasificare a LLM-urilor, pe care o sumarizez mai jos(o puteți găsi aici):

04-mini șți o3 de la OpenAI -70 puncte
Gemini 2.5 PRO de la Google(ultima iterație) – 69 puncte
DeepSeek R1(iterația recentă) – 68 puncte
Gemini 2.5 Pro (penultima iterație) – 67 puncte
Grok 3 mini Reasoning de la XAi – 66 puncte
După cum puteți observa, DeepSeek e în fruntea clasamentului, depășind invesytiții mult mai puternice, precum cea a XAi. De remarcat că Gemini a trecut în frunte acum o zi, după iterația sa târzie din mai, până atunci modelul chinezesc fiind pe locul doi. Ideea e că avem de-a face cu o nebunie. Noi modele se lansează pe bandă rulantă, iar asta înseamnă costuri serioase păentru operatorii americani.

Ar mai trebui specificat ceva, anume că, la capitolul hardware China nici nu se compară cu SUA. Aflată sub interdicții puternice, țara caută cu disperare să-și dezvolte industria producătoare pentru a acoperi distanța. Și aici, așa cum ați aflat dintr-un articol trecut, se află la aproximativ 1,5-2 generații în spatele liderului Nvidia, dar cursa este nebunească.

Este de-a dreptul remarcabil modul în care China a acoperit domeniul. Fără hardware de calitate, joacă în prima ligă fără probleme și asta bazându-se pe descoperiri remarcabile. Ar fi interesant de văzut cum e posibil ca DeepSeek să fie nu doar unul dintre cele mai inteligente modele, dar și cel mai rapid – în ceea ce privește output-ul de tokenuri/secundă, având și printre cele mai reduse costuri pe token, unde e devansat de modele banale(Gemma cu 32 puncte sau Ministral cu 20 de puncte).

Iar ceea ce vă spun aici e doar o fotografie de moment. De ce spun asta? Pentru că Qwuen 3 e abia la 62 puncte, însă are în lucru un nou model, la fel ca și cei de la ByteDance, Baidu sau Tencent. Ceea ce vedem e o accelerație imposibilă.

Nu mai vorbesc despre cursa agenților autonomi precum Manus sau, agentul gratuit lansat de Zhipu, AutoGLM Rumination. De la un anumit moment încolo, nu mia rentează să te lupți pentru supremație întrucât, din punctul meu de vedere, un model care are peste 60 de puncte și un număr redus de halucinații este suficient pentru a fi pus la muncă.

Aceasta e poza momentului și am preferat să v-o prezint acum întrucât intuiesc că spre sfârșitul anului treburile se vor schimba radical. Chinezii vor ieși cu noi chip-uri AI, iar nivelul de cunoștințe de-acolo și efuziunea intelectuală sunt atât de mari încât cred că-i vor lăsa în urmă pe americani. E o părere, vom vedea dacă am dreptate.

Autor: Dan Diaconu

Sursa: https://trenduri.blogspot.com/