استارتاپ چینی دیپ سیک با انتشار نسخه جدید مدل زبانی خود بار دیگر جایگاه خود را بهعنوان یکی از رقبای جدی در عرصه جهانی هوش مصنوعی تثبیت کرده است. این نسخه، که بهتازگی منتشر شده، در حوزههایی مانند استدلال پیچیده، کدنویسی و منطق عملکرد چشمگیری از خود نشان داده؛ حوزههایی که حتی مدلهای پیشرفته معروف گاهی با آنها چالش دارند.
تینا مزدکی – مدل تازهی شرکت دیپ سیک چین با نام DeepSeek-R1-0528 توانسته در آزمون AIME 2025، که یکی از سنجههای دقیق برای ارزیابی تواناییهای استدلالی مدلهای زبانی است، به دقت چشمگیر ۸۷.۵ درصد برسد؛ عددی که در مقایسه با نسخهی قبلی (با دقت ۷۰ درصد)، جهشی بزرگ به حساب میآید. در بنچمارک تخصصی LiveCodeBench نیز که عملکرد مدل در زمینهی برنامهنویسی را میسنجد، دقت DeepSeek-R1-0528 از ۶۳.۵ به ۷۳.۳ درصد افزایش یافته است. حتی در آزمون مشهور و دشوار «آخرین آزمون بشریت» (Humanity’s Last Exam)، امتیاز مدل از ۸.۵ به ۱۷.۷ درصد رسیده؛ یعنی بیش از دو برابر بهبود نسبت به نسخهی قبلی.
این آمارها نشان میدهند که DeepSeek-R1-0528 در برخی حوزهها به سطحی رسیده که میتواند با مدلهای مطرحی مانند GPT-4o از OpenAI یا Gemini از Google رقابت کند و حتی در بعضی معیارها، عملکردی بهتر از آنها داشته باشد.