జెజియాంగ్, జనవరి 22: డీప్‌సీక్ R1 అనేది చైనీస్ AI ల్యాబ్ డీప్‌సీక్ ద్వారా ప్రారంభించబడిన LLM, ఇది OpenAI o1 మోడల్‌ల వలె శక్తివంతమైన పనితీరును అందిస్తుంది. ఇటీవల, చైనా-ఆధారిత డీప్‌సీక్ సంస్థ డీప్‌సీక్ V-3ని ప్రారంభించింది, ఇది 671 బిలియన్ పారామితులపై శిక్షణ పొందిన MoE (మిక్స్చర్ ఆఫ్ ఎక్స్‌పర్ట్స్) భాషా నమూనా. ఇది Meta మరియు OpenAIతో సహా ఇతర ప్రత్యర్థి LLMలను అధిగమించింది. DeepSeek R1 లార్జ్ లాంగ్వేజ్ మోడల్ అదే విధమైన MoE ఆర్కిటెక్చర్‌తో వస్తుంది, ఇది కోడింగ్, గణిత మరియు సాధారణ జ్ఞానం-ఆధారిత పనులను చేయడానికి అనుమతిస్తుంది.

ఈ టాస్క్‌లను పరిష్కరించడంతో పాటు, డీప్‌సీక్ R1 మానవులలా ప్రవర్తించే వివిధ సమస్యలకు కారణమయ్యే LLMగా ప్రశంసించబడింది. శక్తివంతమైన ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ అడ్వాన్స్‌మెంట్‌లను ఉపయోగించుకోవడం కోసం చైనాలోని డీప్‌సీక్ AI ల్యాబ్ ద్వారా AI మోడల్ ఓపెన్ సోర్స్‌గా ప్రారంభించబడింది. ఓపెన్ సోర్స్ అయినప్పటికీ, డీప్‌సీక్ R1 అనేది ఒక శక్తివంతమైన భాషా మోడల్, ఇది పనితీరుకు సంబంధించి పట్టికకు చాలా అందిస్తుంది. స్టార్‌గేట్ ప్రాజెక్ట్: OpenAI మెగా AI ఇనిషియేటివ్‌ను ప్రకటించిన తర్వాత ఎలాన్ మస్క్ స్వైప్ చేసాడు, ‘వాస్తవానికి వారి వద్ద డబ్బు లేదు’ అని చెప్పాడు.

DeepSeek R1 LLM అంటే ఏమిటి? ఇది ఏమి చేస్తుంది?

డీప్‌సీక్ R1 అధునాతన సమస్య-పరిష్కార మరియు విశ్లేషణాత్మక సామర్థ్యాలతో అత్యాధునిక LLMగా టెక్ కమ్యూనిటీలో ప్రశంసించబడింది. ఇది ఓపెన్ సోర్స్‌గా ప్రారంభించబడింది మరియు ప్రత్యేక వెబ్‌సైట్‌ను కలిగి ఉంది: chat.deepseek.com. డీప్‌సీక్ తన కొత్త 32B మరియు 70B AI మోడల్‌లు OpenAI o1 మినీతో సమానంగా ఉన్నాయని పేర్కొంది. డీప్‌సీక్ ఆర్-1 అని కంపెనీ తెలిపింది. కొత్త మోడల్‌ను డీప్‌సీక్-ఆర్1-జీరో మరియు డీప్‌సీక్-ఆర్1 అనే రెండు వేరియంట్‌లలో లాంచ్ చేసినట్లు రీసెర్చ్ పేపర్ షేర్ చేసింది.

DeepSeek-R1-Zero RL (రీన్‌ఫోర్స్‌మెంట్ లెర్నింగ్)పై శిక్షణ పొందింది మరియు పర్యవేక్షించబడే ఫైన్-ట్యూనింగ్ ఏదీ చేయలేదు. ఇది బహుళ-దశల RL ద్వారా వెళ్ళింది, AI మోడల్ శక్తివంతమైన రీజనింగ్ మరియు రీడబిలిటీని అందించిందని నిర్ధారిస్తుంది. డీప్‌సీక్-ఆర్1 అనేది R1-జీరో మోడల్ అందించిన పునాదిపై నిర్మించబడింది. డొనాల్డ్ ట్రంప్ AIలో USD 500 బిలియన్ల పెట్టుబడితో ‘ది స్టార్‌గేట్ ప్రాజెక్ట్’ కంపెనీని, ఒరాకిల్, NVIDIA మరియు OpenAI భాగస్వామ్యంతో AGI అభివృద్ధిని ప్రకటించారు.

డీప్‌సీక్ R1 బెంచ్‌మార్క్‌లు మరియు పనితీరు

చైనా-ఆధారిత DeepSeek కూడా OpenAI o1-mini, GPT-4o-0513, Claude 3.5-Sonnet-1022 మరియు ఇతర మోడళ్లతో పోల్చి బెంచ్‌మార్క్‌లను పంచుకుంది. ఇప్పటికే ఉన్న AI LLMలతో పోల్చితే ఇది చాలా బాగా పనిచేసింది, ముఖ్యంగా MATH-500 (Pass@1) మరియు GPQA డైమండ్ (Pass@1) స్కోర్‌లలో. ఇది దాని నిపుణుల-స్థాయి కోడింగ్ సామర్ధ్యాలను సూచించే మానవ పాల్గొనేవారిలో అధిక 96.3 శాతం ర్యాంక్‌ను సాధించింది.

(పై కథనం మొదటిసారిగా జనవరి 22, 2025 12:37 PM ISTలో కనిపించింది. రాజకీయాలు, ప్రపంచం, క్రీడలు, వినోదం మరియు జీవనశైలిపై మరిన్ని వార్తలు మరియు నవీకరణల కోసం, మా వెబ్‌సైట్‌కి లాగిన్ అవ్వండి తాజాగా.కామ్)





Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here