రీజనింగ్ AI మోడల్స్ అని పిలవబడేవి అభివృద్ధి చేయడం సులభం – మరియు చౌకగా మారుతున్నాయి.
శుక్రవారం, UC బర్కిలీ యొక్క స్కై కంప్యూటింగ్ ల్యాబ్ నుండి వచ్చిన పరిశోధకుల బృందం NovaSky, Sky-T1-32B-Previewను విడుదల చేసింది, ఇది ఒక రీజనింగ్ మోడల్తో పోటీగా ఉంది. OpenAI యొక్క o1 యొక్క మునుపటి వెర్షన్ అనేక కీలక బెంచ్మార్క్లపై. Sky-T1 అనేది మొదటి నిజమైన ఓపెన్ సోర్స్ రీజనింగ్ మోడల్గా కనిపిస్తుంది మొదటి నుండి ప్రతిరూపం; బృందం శిక్షణ కోసం ఉపయోగించిన డేటా సెట్తో పాటు అవసరమైన శిక్షణా కోడ్ను విడుదల చేసింది.
“ముఖ్యంగా, స్కై-T1-32B-ప్రివ్యూ $450 కంటే తక్కువ ధరకు శిక్షణ పొందింది,” అని బృందం వ్రాసింది బ్లాగ్ పోస్ట్“అధిక-స్థాయి తార్కిక సామర్థ్యాలను సరసమైన మరియు సమర్ధవంతంగా పునరావృతం చేయడం సాధ్యమవుతుందని నిరూపిస్తుంది.”
$450 అంత సరసమైనది కాకపోవచ్చు. కానీ పోల్చదగిన పనితీరుతో మోడల్కు శిక్షణ ఇవ్వడానికి ధర ట్యాగ్ చాలా కాలం క్రితం కాదు తరచుగా మిలియన్ల డాలర్లలో ఉంటుంది. సింథటిక్ శిక్షణ డేటా లేదా ఇతర మోడల్ల ద్వారా రూపొందించబడిన శిక్షణ డేటా ఖర్చులను తగ్గించడంలో సహాయపడింది. Palmyra X 004, AI కంపెనీ రైటర్ ఇటీవల విడుదల చేసిన మోడల్, దాదాపు పూర్తిగా శిక్షణ పొందింది సింథటిక్ డేటాఅభివృద్ధి చేయడానికి కేవలం $700,000 ఖర్చవుతుందని నివేదించబడింది.
చాలా AI వలె కాకుండా, తార్కిక నమూనాలు తమను తాము సమర్థవంతంగా తనిఖీ చేసుకుంటాయి సాధారణంగా మోడల్లను పెంచే కొన్ని ఆపదలను నివారించడానికి వారికి సహాయపడుతుంది. రీజనింగ్ మోడల్లు సాధారణ నాన్-రీజనింగ్ మోడల్తో పోలిస్తే పరిష్కారాలను చేరుకోవడానికి – సాధారణంగా సెకన్ల నుండి నిమిషాల వరకు ఎక్కువ సమయం తీసుకుంటాయి. పైకి ఏమిటంటే, వారు భౌతిక శాస్త్రం, సైన్స్ మరియు గణితం వంటి డొమైన్లలో మరింత విశ్వసనీయంగా ఉంటారు.
నోవాస్కీ బృందం ఇది మరొక రీజనింగ్ మోడల్ను ఉపయోగించిందని చెప్పారు, అలీబాబా యొక్క QwQ-32B-ప్రివ్యూSky-T1 కోసం ప్రారంభ శిక్షణ డేటాను రూపొందించడానికి, ఆపై డేటా మిశ్రమాన్ని “క్యూరేట్” చేసి, OpenAI యొక్క పరపతి GPT-4o-మినీ డేటాను మరింత పని చేయదగిన ఆకృతికి రీఫాక్టర్ చేయడానికి. 8 Nvidia H100 GPUల ర్యాక్ని ఉపయోగించి 32-బిలియన్-పారామీటర్ Sky-T1కి శిక్షణ ఇవ్వడానికి దాదాపు 19 గంటలు పట్టింది. (పారామితులు దాదాపుగా మోడల్ యొక్క సమస్య-పరిష్కార నైపుణ్యాలకు అనుగుణంగా ఉంటాయి.)
నోవాస్కీ బృందం ప్రకారం, “పోటీ-స్థాయి” గణిత సవాళ్ల సమాహారమైన MATH500లో o1 యొక్క ప్రారంభ ప్రివ్యూ వెర్షన్ కంటే Sky-T1 మెరుగ్గా పని చేస్తుంది. మోడల్ లైవ్కోడ్బెంచ్, కోడింగ్ మూల్యాంకనం నుండి క్లిష్టమైన సమస్యల సెట్పై o1 యొక్క ప్రివ్యూను కూడా బీట్ చేస్తుంది.
అయినప్పటికీ, GPQA-డైమండ్లోని o1 ప్రివ్యూ కంటే Sky-T1 తక్కువగా ఉంటుంది, ఇందులో PhD గ్రాడ్యుయేట్ తెలుసుకోవాలని భావించే భౌతిక శాస్త్రం, జీవశాస్త్రం మరియు రసాయన శాస్త్రానికి సంబంధించిన ప్రశ్నలు ఉంటాయి.
OpenAI లు అని కూడా గమనించాలి o1 యొక్క GA విడుదల o1 యొక్క ప్రివ్యూ వెర్షన్ కంటే బలమైన మోడల్, మరియు OpenAI మరింత మెరుగ్గా పనిచేసే రీజనింగ్ మోడల్ను విడుదల చేస్తుందని భావిస్తున్నారు, o3రాబోయే వారాల్లో.
కానీ నోవాస్కీ బృందం స్కై-T1 అధునాతన రీజనింగ్ సామర్థ్యాలతో ఓపెన్ సోర్స్ మోడల్లను అభివృద్ధి చేయడానికి వారి ప్రయాణం ప్రారంభాన్ని మాత్రమే సూచిస్తుంది.
“ముందుకు వెళుతున్నప్పుడు, బలమైన తార్కిక పనితీరును కొనసాగించే మరింత సమర్థవంతమైన మోడల్లను అభివృద్ధి చేయడం మరియు పరీక్ష సమయంలో మోడల్ల సామర్థ్యం మరియు ఖచ్చితత్వాన్ని మరింత మెరుగుపరిచే అధునాతన పద్ధతులను అన్వేషించడంపై మేము దృష్టి పెడతాము” అని బృందం పోస్ట్లో రాసింది. “ఈ ఉత్తేజకరమైన కార్యక్రమాలలో మేము పురోగతి సాధిస్తున్నప్పుడు వేచి ఉండండి.”