Home Technology పరిశోధకులు ఓపెన్ సోర్స్ స్కై-T1, $450 కంటే తక్కువ ఖర్చుతో శిక్షణ పొందగల ‘రీజనింగ్’ AI...

Technology

పరిశోధకులు ఓపెన్ సోర్స్ స్కై-T1, $450 కంటే తక్కువ ఖర్చుతో శిక్షణ పొందగల ‘రీజనింగ్’ AI మోడల్

12 జనవరి 2025

రీజనింగ్ AI మోడల్స్ అని పిలవబడేవి అభివృద్ధి చేయడం సులభం – మరియు చౌకగా మారుతున్నాయి.

శుక్రవారం, UC బర్కిలీ యొక్క స్కై కంప్యూటింగ్ ల్యాబ్ నుండి వచ్చిన పరిశోధకుల బృందం NovaSky, Sky-T1-32B-Previewను విడుదల చేసింది, ఇది ఒక రీజనింగ్ మోడల్‌తో పోటీగా ఉంది. OpenAI యొక్క o1 యొక్క మునుపటి వెర్షన్ అనేక కీలక బెంచ్‌మార్క్‌లపై. Sky-T1 అనేది మొదటి నిజమైన ఓపెన్ సోర్స్ రీజనింగ్ మోడల్‌గా కనిపిస్తుంది మొదటి నుండి ప్రతిరూపం; బృందం శిక్షణ కోసం ఉపయోగించిన డేటా సెట్‌తో పాటు అవసరమైన శిక్షణా కోడ్‌ను విడుదల చేసింది.

“ముఖ్యంగా, స్కై-T1-32B-ప్రివ్యూ $450 కంటే తక్కువ ధరకు శిక్షణ పొందింది,” అని బృందం వ్రాసింది బ్లాగ్ పోస్ట్“అధిక-స్థాయి తార్కిక సామర్థ్యాలను సరసమైన మరియు సమర్ధవంతంగా పునరావృతం చేయడం సాధ్యమవుతుందని నిరూపిస్తుంది.”

$450 అంత సరసమైనది కాకపోవచ్చు. కానీ పోల్చదగిన పనితీరుతో మోడల్‌కు శిక్షణ ఇవ్వడానికి ధర ట్యాగ్ చాలా కాలం క్రితం కాదు తరచుగా మిలియన్ల డాలర్లలో ఉంటుంది. సింథటిక్ శిక్షణ డేటా లేదా ఇతర మోడల్‌ల ద్వారా రూపొందించబడిన శిక్షణ డేటా ఖర్చులను తగ్గించడంలో సహాయపడింది. Palmyra X 004, AI కంపెనీ రైటర్ ఇటీవల విడుదల చేసిన మోడల్, దాదాపు పూర్తిగా శిక్షణ పొందింది సింథటిక్ డేటాఅభివృద్ధి చేయడానికి కేవలం $700,000 ఖర్చవుతుందని నివేదించబడింది.

చాలా AI వలె కాకుండా, తార్కిక నమూనాలు తమను తాము సమర్థవంతంగా తనిఖీ చేసుకుంటాయి సాధారణంగా మోడల్‌లను పెంచే కొన్ని ఆపదలను నివారించడానికి వారికి సహాయపడుతుంది. రీజనింగ్ మోడల్‌లు సాధారణ నాన్-రీజనింగ్ మోడల్‌తో పోలిస్తే పరిష్కారాలను చేరుకోవడానికి – సాధారణంగా సెకన్ల నుండి నిమిషాల వరకు ఎక్కువ సమయం తీసుకుంటాయి. పైకి ఏమిటంటే, వారు భౌతిక శాస్త్రం, సైన్స్ మరియు గణితం వంటి డొమైన్‌లలో మరింత విశ్వసనీయంగా ఉంటారు.

నోవాస్కీ బృందం ఇది మరొక రీజనింగ్ మోడల్‌ను ఉపయోగించిందని చెప్పారు, అలీబాబా యొక్క QwQ-32B-ప్రివ్యూSky-T1 కోసం ప్రారంభ శిక్షణ డేటాను రూపొందించడానికి, ఆపై డేటా మిశ్రమాన్ని “క్యూరేట్” చేసి, OpenAI యొక్క పరపతి GPT-4o-మినీ డేటాను మరింత పని చేయదగిన ఆకృతికి రీఫాక్టర్ చేయడానికి. 8 Nvidia H100 GPUల ర్యాక్‌ని ఉపయోగించి 32-బిలియన్-పారామీటర్ Sky-T1కి శిక్షణ ఇవ్వడానికి దాదాపు 19 గంటలు పట్టింది. (పారామితులు దాదాపుగా మోడల్ యొక్క సమస్య-పరిష్కార నైపుణ్యాలకు అనుగుణంగా ఉంటాయి.)

నోవాస్కీ బృందం ప్రకారం, “పోటీ-స్థాయి” గణిత సవాళ్ల సమాహారమైన MATH500లో o1 యొక్క ప్రారంభ ప్రివ్యూ వెర్షన్ కంటే Sky-T1 మెరుగ్గా పని చేస్తుంది. మోడల్ లైవ్‌కోడ్‌బెంచ్, కోడింగ్ మూల్యాంకనం నుండి క్లిష్టమైన సమస్యల సెట్‌పై o1 యొక్క ప్రివ్యూను కూడా బీట్ చేస్తుంది.

అయినప్పటికీ, GPQA-డైమండ్‌లోని o1 ప్రివ్యూ కంటే Sky-T1 తక్కువగా ఉంటుంది, ఇందులో PhD గ్రాడ్యుయేట్ తెలుసుకోవాలని భావించే భౌతిక శాస్త్రం, జీవశాస్త్రం మరియు రసాయన శాస్త్రానికి సంబంధించిన ప్రశ్నలు ఉంటాయి.

OpenAI లు అని కూడా గమనించాలి o1 యొక్క GA విడుదల o1 యొక్క ప్రివ్యూ వెర్షన్ కంటే బలమైన మోడల్, మరియు OpenAI మరింత మెరుగ్గా పనిచేసే రీజనింగ్ మోడల్‌ను విడుదల చేస్తుందని భావిస్తున్నారు, o3రాబోయే వారాల్లో.

కానీ నోవాస్కీ బృందం స్కై-T1 అధునాతన రీజనింగ్ సామర్థ్యాలతో ఓపెన్ సోర్స్ మోడల్‌లను అభివృద్ధి చేయడానికి వారి ప్రయాణం ప్రారంభాన్ని మాత్రమే సూచిస్తుంది.

“ముందుకు వెళుతున్నప్పుడు, బలమైన తార్కిక పనితీరును కొనసాగించే మరింత సమర్థవంతమైన మోడల్‌లను అభివృద్ధి చేయడం మరియు పరీక్ష సమయంలో మోడల్‌ల సామర్థ్యం మరియు ఖచ్చితత్వాన్ని మరింత మెరుగుపరిచే అధునాతన పద్ధతులను అన్వేషించడంపై మేము దృష్టి పెడతాము” అని బృందం పోస్ట్‌లో రాసింది. “ఈ ఉత్తేజకరమైన కార్యక్రమాలలో మేము పురోగతి సాధిస్తున్నప్పుడు వేచి ఉండండి.”

Source link

పరిశోధకులు ఓపెన్ సోర్స్ స్కై-T1, $450 కంటే తక్కువ ఖర్చుతో శిక్షణ పొందగల ‘రీజనింగ్’ AI మోడల్

Breaking News

కోకో గాఫ్ ఆస్కార్‌కి వెళ్లడం ‘వేరే స్థలంలో ఉండటానికి బాగుంది’ అని అన్నారు, కాని...

కెలోవానా నిరాశ్రయుల శిబిరం గుండా వెళ్ళిన వ్యక్తికి జైలు సమయం లేదు

అమీర్ అలీ వైరల్ వీడియోలో మిస్టరీ మహిళతో హోలీని జరుపుకుంటాడు; ‘ఫిర్’ నటుడి పుకార్లు...

మీ ఉదయం జో ఎందుకు అంత ఖరీదైనది? బ్రెజిల్ కాఫీ ఫార్మ్స్‌కు సమాధానం ఉంది.

బ్రయాన్ కోహ్బెర్గర్ కేసు: ఇడాహో స్టూడెంట్ హత్యలలో విడుదలైన 911 కాల్ ఆడియో

USMNT ఉత్తేజకరమైన MLS చేర్పులతో నేషన్స్ లీగ్ కంటే ముందు రోస్టర్‌ను తగ్గిస్తుంది |...

‘హ్యాపీ 4’, జాస్ప్రిట్ బుమ్రా మరియు సంజన గనేసన్ నాలుగు సంవత్సరాల వివాహం పూర్తి,...

వైరల్ వీడియో ఏనుగు తన భాగస్వామికి 25 సంవత్సరాల సంతాపం చూపిస్తుంది: “కంటే ఎక్కువ...

బ్యాచిలర్ షోరన్నర్స్ క్లైర్ ఫ్రీలాండ్, బెన్నెట్ గ్రేబ్నర్ నిష్క్రమణ

యుఎస్ సెనేట్ గడువుకు ముందు గంటల ముందు బిల్లు ఖర్చు చేస్తుంది

జోసెఫ్ ఫార్జెస్ స్టూడియోస్ ‘దృష్టికి అంటుకోవాలి’

స్మిషింగ్ స్కామ్ అంటే ఏమిటి? SMS ఫిషింగ్ నివారించడానికి మీరు మిమ్మల్ని మీరు ఎలా...

రష్యా ఒక అమెరికన్ మిత్రుడు కాదు | లేఖ | అక్షరాలు

90 ల కల్ట్ క్లాసిక్ ఫిల్మ్ మ్యూజికల్ రీబ్రాండ్ పొందుతుంది

రష్యా డాగ్ అటాక్: వెట్స్ సెవర్స్క్‌లో అనాయాస అభ్యర్థనను తిరస్కరించిన తరువాత శిశు దూకుడు...

Category