Deepseek Research Paper PDF 2025

ByVishnu Updated onJanuary 28, 2025 2:28 pm

आजकल की दुनिया में, आर्टिफिशियल इंटेलिजेंस (AI) तेजी से विकसित हो रहा है। इसी क्रम में डीपसीक-आर1 (DeepSeek-R1) एक ऐसा नया शोध है जिसने मशीन लर्निंग और भाषा मॉडलों में नई क्रांति की शुरुआत की है।

यह रिसर्च मॉडल को बेहतर तर्क क्षमता देने के लिए रिइनफोर्समेंट लर्निंग (Reinforcement Learning) तकनीक का उपयोग करता है।

Table of Contents

1 डीपसीक-आर1 और डीपसीक-आर1-ज़ीरो की शुरुआत
2 Deepseek-R1 की विशेषताएं
3 Deepseek Research Paper PDF
4 Deepseek-R1 और Deepseek-R1-Zero की तुलना
5 भविष्य की संभावनाएं
6 निष्कर्ष

डीपसीक-आर1 और डीपसीक-आर1-ज़ीरो की शुरुआत

डीपसीक-आर1-ज़ीरो को बिना किसी सुपरवाइज्ड फाइन-ट्यूनिंग के रिइनफोर्समेंट लर्निंग द्वारा प्रशिक्षित किया गया। इस प्रक्रिया में मॉडल ने अपनी सोचने-समझने की क्षमता को स्वाभाविक रूप से विकसित किया। हालांकि, इस प्रारंभिक मॉडल में कुछ कमियां थीं, जैसे कि भाषा का मिक्स होना और पाठ का पढ़ने में कठिन होना। इन्हीं समस्याओं को हल करने के लिए डीपसीक-आर1 विकसित किया गया।

Deepseek-R1 की विशेषताएं

मल्टी-स्टेज ट्रेनिंग: डीपसीक-आर1 को ठोस डेटा के साथ चरणबद्ध तरीके से प्रशिक्षित किया गया। इसने मॉडल को अधिक उपयोगी और पढ़ने में आसान बनाया।
रिइनफोर्समेंट लर्निंग पर फोकस: यह मॉडल गणित, कोडिंग और तार्किक समस्याओं जैसे जटिल विषयों पर भी उच्च प्रदर्शन कर सकता है।
डिस्टिलेशन प्रक्रिया: डीपसीक-आर1 ने छोटे मॉडलों को प्रशिक्षित कर यह दिखाया कि बड़े मॉडलों की क्षमताओं को छोटे मॉडलों में भी समाहित किया जा सकता है।

Deepseek Research Paper PDF

deepseek research paper pdf Download

गणितीय समस्याएं: AIME 2024 जैसे प्रतिस्पर्धाओं में 79.8% सटीकता।
कोडिंग: LiveCodeBench जैसे प्लेटफॉर्म पर 65.9% पास रेट।
ज्ञान परीक्षण: MMLU और GPQA डायमंड जैसे मानकों पर डीपसीक-आर1 का प्रदर्शन अद्वितीय रहा।

Deepseek-R1 और Deepseek-R1-Zero की तुलना

Criteria	Deepseek-R1-Zero	Deepseek-R1
AIME 2024 (Pass@1)	71.0%	79.8%
MATH-500 (Pass@1)	95.9%	97.3%
GPQA डायमंड (Pass@1)	73.3%	71.5%
कोडफोर्सेस (प्रतिशत)	50.0%	96.3%