రీజనింగ్ AI మోడల్స్ అని పిలవబడేవి అభివృద్ధి చేయడం సులభం – మరియు చౌకగా మారుతున్నాయి.

శుక్రవారం, UC బర్కిలీ యొక్క స్కై కంప్యూటింగ్ ల్యాబ్ నుండి వచ్చిన పరిశోధకుల బృందం NovaSky, Sky-T1-32B-Previewను విడుదల చేసింది, ఇది ఒక రీజనింగ్ మోడల్‌తో పోటీగా ఉంది. OpenAI యొక్క o1 యొక్క మునుపటి వెర్షన్ అనేక కీలక బెంచ్‌మార్క్‌లపై. Sky-T1 అనేది మొదటి నిజమైన ఓపెన్ సోర్స్ రీజనింగ్ మోడల్‌గా కనిపిస్తుంది మొదటి నుండి ప్రతిరూపం; బృందం శిక్షణ కోసం ఉపయోగించిన డేటా సెట్‌తో పాటు అవసరమైన శిక్షణా కోడ్‌ను విడుదల చేసింది.

“ముఖ్యంగా, స్కై-T1-32B-ప్రివ్యూ $450 కంటే తక్కువ ధరకు శిక్షణ పొందింది,” అని బృందం వ్రాసింది బ్లాగ్ పోస్ట్“అధిక-స్థాయి తార్కిక సామర్థ్యాలను సరసమైన మరియు సమర్ధవంతంగా పునరావృతం చేయడం సాధ్యమవుతుందని నిరూపిస్తుంది.”

$450 అంత సరసమైనది కాకపోవచ్చు. కానీ పోల్చదగిన పనితీరుతో మోడల్‌కు శిక్షణ ఇవ్వడానికి ధర ట్యాగ్ చాలా కాలం క్రితం కాదు తరచుగా మిలియన్ల డాలర్లలో ఉంటుంది. సింథటిక్ శిక్షణ డేటా లేదా ఇతర మోడల్‌ల ద్వారా రూపొందించబడిన శిక్షణ డేటా ఖర్చులను తగ్గించడంలో సహాయపడింది. Palmyra X 004, AI కంపెనీ రైటర్ ఇటీవల విడుదల చేసిన మోడల్, దాదాపు పూర్తిగా శిక్షణ పొందింది సింథటిక్ డేటాఅభివృద్ధి చేయడానికి కేవలం $700,000 ఖర్చవుతుందని నివేదించబడింది.

చాలా AI వలె కాకుండా, తార్కిక నమూనాలు తమను తాము సమర్థవంతంగా తనిఖీ చేసుకుంటాయి సాధారణంగా మోడల్‌లను పెంచే కొన్ని ఆపదలను నివారించడానికి వారికి సహాయపడుతుంది. రీజనింగ్ మోడల్‌లు సాధారణ నాన్-రీజనింగ్ మోడల్‌తో పోలిస్తే పరిష్కారాలను చేరుకోవడానికి – సాధారణంగా సెకన్ల నుండి నిమిషాల వరకు ఎక్కువ సమయం తీసుకుంటాయి. పైకి ఏమిటంటే, వారు భౌతిక శాస్త్రం, సైన్స్ మరియు గణితం వంటి డొమైన్‌లలో మరింత విశ్వసనీయంగా ఉంటారు.

నోవాస్కీ బృందం ఇది మరొక రీజనింగ్ మోడల్‌ను ఉపయోగించిందని చెప్పారు, అలీబాబా యొక్క QwQ-32B-ప్రివ్యూSky-T1 కోసం ప్రారంభ శిక్షణ డేటాను రూపొందించడానికి, ఆపై డేటా మిశ్రమాన్ని “క్యూరేట్” చేసి, OpenAI యొక్క పరపతి GPT-4o-మినీ డేటాను మరింత పని చేయదగిన ఆకృతికి రీఫాక్టర్ చేయడానికి. 8 Nvidia H100 GPUల ర్యాక్‌ని ఉపయోగించి 32-బిలియన్-పారామీటర్ Sky-T1కి శిక్షణ ఇవ్వడానికి దాదాపు 19 గంటలు పట్టింది. (పారామితులు దాదాపుగా మోడల్ యొక్క సమస్య-పరిష్కార నైపుణ్యాలకు అనుగుణంగా ఉంటాయి.)

నోవాస్కీ బృందం ప్రకారం, “పోటీ-స్థాయి” గణిత సవాళ్ల సమాహారమైన MATH500లో o1 యొక్క ప్రారంభ ప్రివ్యూ వెర్షన్ కంటే Sky-T1 మెరుగ్గా పని చేస్తుంది. మోడల్ లైవ్‌కోడ్‌బెంచ్, కోడింగ్ మూల్యాంకనం నుండి క్లిష్టమైన సమస్యల సెట్‌పై o1 యొక్క ప్రివ్యూను కూడా బీట్ చేస్తుంది.

అయినప్పటికీ, GPQA-డైమండ్‌లోని o1 ప్రివ్యూ కంటే Sky-T1 తక్కువగా ఉంటుంది, ఇందులో PhD గ్రాడ్యుయేట్ తెలుసుకోవాలని భావించే భౌతిక శాస్త్రం, జీవశాస్త్రం మరియు రసాయన శాస్త్రానికి సంబంధించిన ప్రశ్నలు ఉంటాయి.

OpenAI లు అని కూడా గమనించాలి o1 యొక్క GA విడుదల o1 యొక్క ప్రివ్యూ వెర్షన్ కంటే బలమైన మోడల్, మరియు OpenAI మరింత మెరుగ్గా పనిచేసే రీజనింగ్ మోడల్‌ను విడుదల చేస్తుందని భావిస్తున్నారు, o3రాబోయే వారాల్లో.

కానీ నోవాస్కీ బృందం స్కై-T1 అధునాతన రీజనింగ్ సామర్థ్యాలతో ఓపెన్ సోర్స్ మోడల్‌లను అభివృద్ధి చేయడానికి వారి ప్రయాణం ప్రారంభాన్ని మాత్రమే సూచిస్తుంది.

“ముందుకు వెళుతున్నప్పుడు, బలమైన తార్కిక పనితీరును కొనసాగించే మరింత సమర్థవంతమైన మోడల్‌లను అభివృద్ధి చేయడం మరియు పరీక్ష సమయంలో మోడల్‌ల సామర్థ్యం మరియు ఖచ్చితత్వాన్ని మరింత మెరుగుపరిచే అధునాతన పద్ధతులను అన్వేషించడంపై మేము దృష్టి పెడతాము” అని బృందం పోస్ట్‌లో రాసింది. “ఈ ఉత్తేజకరమైన కార్యక్రమాలలో మేము పురోగతి సాధిస్తున్నప్పుడు వేచి ఉండండి.”



Source link