تهدیدی جدی برای ChatGPT و گوگل / آپدیت جدید «دیپ سیک» منتشر شد

استارتاپ چینی دیپ سیک با انتشار نسخه جدید مدل زبانی خود بار دیگر جایگاه خود را به‌عنوان یکی از رقبای جدی در عرصه جهانی هوش مصنوعی تثبیت کرده است. این نسخه، که به‌تازگی منتشر شده، در حوزه‌هایی مانند استدلال پیچیده، کدنویسی و منطق عملکرد چشمگیری از خود نشان داده؛ حوزه‌هایی که حتی مدل‌های پیشرفته معروف گاهی با آن‌ها چالش دارند.

تینا مزدکی – مدل تازه‌ی شرکت دیپ سیک چین با نام DeepSeek-R1-0528 توانسته در آزمون AIME 2025، که یکی از سنجه‌های دقیق برای ارزیابی توانایی‌های استدلالی مدل‌های زبانی است، به دقت چشمگیر ۸۷.۵ درصد برسد؛ عددی که در مقایسه با نسخه‌ی قبلی (با دقت ۷۰ درصد)، جهشی بزرگ به حساب می‌آید. در بنچ‌مارک تخصصی LiveCodeBench نیز که عملکرد مدل در زمینه‌ی برنامه‌نویسی را می‌سنجد، دقت DeepSeek-R1-0528 از ۶۳.۵ به ۷۳.۳ درصد افزایش یافته است. حتی در آزمون مشهور و دشوار «آخرین آزمون بشریت» (Humanity’s Last Exam)، امتیاز مدل از ۸.۵ به ۱۷.۷ درصد رسیده؛ یعنی بیش از دو برابر بهبود نسبت به نسخه‌ی قبلی.

این آمارها نشان می‌دهند که DeepSeek-R1-0528 در برخی حوزه‌ها به سطحی رسیده که می‌تواند با مدل‌های مطرحی مانند GPT-4o از OpenAI یا Gemini از Google رقابت کند و حتی در بعضی معیارها، عملکردی بهتر از آن‌ها داشته باشد.

دیدگاهی بنویسید

دیدگاهی بنویسید لغو پاسخ