జెజియాంగ్, జనవరి 22: డీప్సీక్ R1 అనేది చైనీస్ AI ల్యాబ్ డీప్సీక్ ద్వారా ప్రారంభించబడిన LLM, ఇది OpenAI o1 మోడల్ల వలె శక్తివంతమైన పనితీరును అందిస్తుంది. ఇటీవల, చైనా-ఆధారిత డీప్సీక్ సంస్థ డీప్సీక్ V-3ని ప్రారంభించింది, ఇది 671 బిలియన్ పారామితులపై శిక్షణ పొందిన MoE (మిక్స్చర్ ఆఫ్ ఎక్స్పర్ట్స్) భాషా నమూనా. ఇది Meta మరియు OpenAIతో సహా ఇతర ప్రత్యర్థి LLMలను అధిగమించింది. DeepSeek R1 లార్జ్ లాంగ్వేజ్ మోడల్ అదే విధమైన MoE ఆర్కిటెక్చర్తో వస్తుంది, ఇది కోడింగ్, గణిత మరియు సాధారణ జ్ఞానం-ఆధారిత పనులను చేయడానికి అనుమతిస్తుంది.
ఈ టాస్క్లను పరిష్కరించడంతో పాటు, డీప్సీక్ R1 మానవులలా ప్రవర్తించే వివిధ సమస్యలకు కారణమయ్యే LLMగా ప్రశంసించబడింది. శక్తివంతమైన ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ అడ్వాన్స్మెంట్లను ఉపయోగించుకోవడం కోసం చైనాలోని డీప్సీక్ AI ల్యాబ్ ద్వారా AI మోడల్ ఓపెన్ సోర్స్గా ప్రారంభించబడింది. ఓపెన్ సోర్స్ అయినప్పటికీ, డీప్సీక్ R1 అనేది ఒక శక్తివంతమైన భాషా మోడల్, ఇది పనితీరుకు సంబంధించి పట్టికకు చాలా అందిస్తుంది. స్టార్గేట్ ప్రాజెక్ట్: OpenAI మెగా AI ఇనిషియేటివ్ను ప్రకటించిన తర్వాత ఎలాన్ మస్క్ స్వైప్ చేసాడు, ‘వాస్తవానికి వారి వద్ద డబ్బు లేదు’ అని చెప్పాడు.
DeepSeek R1 LLM అంటే ఏమిటి? ఇది ఏమి చేస్తుంది?
డీప్సీక్ R1 అధునాతన సమస్య-పరిష్కార మరియు విశ్లేషణాత్మక సామర్థ్యాలతో అత్యాధునిక LLMగా టెక్ కమ్యూనిటీలో ప్రశంసించబడింది. ఇది ఓపెన్ సోర్స్గా ప్రారంభించబడింది మరియు ప్రత్యేక వెబ్సైట్ను కలిగి ఉంది: chat.deepseek.com. డీప్సీక్ తన కొత్త 32B మరియు 70B AI మోడల్లు OpenAI o1 మినీతో సమానంగా ఉన్నాయని పేర్కొంది. డీప్సీక్ ఆర్-1 అని కంపెనీ తెలిపింది. కొత్త మోడల్ను డీప్సీక్-ఆర్1-జీరో మరియు డీప్సీక్-ఆర్1 అనే రెండు వేరియంట్లలో లాంచ్ చేసినట్లు రీసెర్చ్ పేపర్ షేర్ చేసింది.
DeepSeek-R1-Zero RL (రీన్ఫోర్స్మెంట్ లెర్నింగ్)పై శిక్షణ పొందింది మరియు పర్యవేక్షించబడే ఫైన్-ట్యూనింగ్ ఏదీ చేయలేదు. ఇది బహుళ-దశల RL ద్వారా వెళ్ళింది, AI మోడల్ శక్తివంతమైన రీజనింగ్ మరియు రీడబిలిటీని అందించిందని నిర్ధారిస్తుంది. డీప్సీక్-ఆర్1 అనేది R1-జీరో మోడల్ అందించిన పునాదిపై నిర్మించబడింది. డొనాల్డ్ ట్రంప్ AIలో USD 500 బిలియన్ల పెట్టుబడితో ‘ది స్టార్గేట్ ప్రాజెక్ట్’ కంపెనీని, ఒరాకిల్, NVIDIA మరియు OpenAI భాగస్వామ్యంతో AGI అభివృద్ధిని ప్రకటించారు.
డీప్సీక్ R1 బెంచ్మార్క్లు మరియు పనితీరు
చైనా-ఆధారిత DeepSeek కూడా OpenAI o1-mini, GPT-4o-0513, Claude 3.5-Sonnet-1022 మరియు ఇతర మోడళ్లతో పోల్చి బెంచ్మార్క్లను పంచుకుంది. ఇప్పటికే ఉన్న AI LLMలతో పోల్చితే ఇది చాలా బాగా పనిచేసింది, ముఖ్యంగా MATH-500 (Pass@1) మరియు GPQA డైమండ్ (Pass@1) స్కోర్లలో. ఇది దాని నిపుణుల-స్థాయి కోడింగ్ సామర్ధ్యాలను సూచించే మానవ పాల్గొనేవారిలో అధిక 96.3 శాతం ర్యాంక్ను సాధించింది.
(పై కథనం మొదటిసారిగా జనవరి 22, 2025 12:37 PM ISTలో కనిపించింది. రాజకీయాలు, ప్రపంచం, క్రీడలు, వినోదం మరియు జీవనశైలిపై మరిన్ని వార్తలు మరియు నవీకరణల కోసం, మా వెబ్సైట్కి లాగిన్ అవ్వండి తాజాగా.కామ్)