ది AI కోసం అలెన్ ఇన్స్టిట్యూట్ (Ai2) ఉంది ఓపెన్ సోర్స్ AI మోడల్స్ యొక్క కొత్త సెట్‌ను విడుదల చేస్తోంది మరియు ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ ప్రపంచంలోని క్లిష్టమైన కానీ అంతకుముందు రహస్యమైన మూలలో వెలుగునిచ్చే ప్రయత్నంలో సంబంధిత వనరులు.

Ai2 యొక్క తుళు చొరవ యొక్క దృష్టి పోస్ట్-ట్రైనింగ్ — ప్రారంభ శిక్షణ ప్రక్రియ తర్వాత భాషా నమూనాను దాని సామర్థ్యాలను మెరుగుపరచడానికి మరియు నిర్దిష్ట పనులు మరియు వాస్తవ-ప్రపంచ అనువర్తనాలకు అనుకూలంగా ఉండేలా చేసే ప్రక్రియ.

Ai2 దాని కొత్త తుళు 3 మోడల్‌లు ప్రత్యర్థిగా ఉన్నాయని మరియు కొన్ని సందర్భాల్లో OpenAI, Mistral, Google మరియు ఇతర కంపెనీల యాజమాన్య మోడళ్లను మించి గణిత, సూచనలను అనుసరించడం మరియు చాట్ సామర్థ్యాల వంటి నైపుణ్యాల బెంచ్‌మార్క్‌ల గురించి చెబుతోంది.

సీటెల్ ఆధారిత AI లాభాపేక్ష రహితమైనది తుళు 3 మోడళ్లను విడుదల చేస్తోంది గురువారం నాడు, శిక్షణానంతర ప్రక్రియలో ఉపయోగించిన డేటా, కోడ్ మరియు అవస్థాపనతో పాటు, దీనిని ఎవరైనా ఉపయోగించుకోవడానికి మరియు నిర్మించడానికి అందుబాటులో ఉండేలా చేస్తుంది.

తుళు 3 విడుదల కోసం ఒక పెద్ద లక్ష్యం ఏమిటంటే, ఇతర AI పరిశోధకులు మరియు ఇంజనీర్‌లకు మరింత ప్రభావవంతమైన పోస్ట్-ట్రైనింగ్ చేయడానికి కావలసిన పదార్థాలు మరియు రెసిపీని అందించడం. తుళు 3 మోడల్స్ ఆధారంగా ఒక చాట్‌బాట్ ఇక్కడ అందుబాటులో ఉంది — Ai2 యొక్క కొత్త వ్యూహంలో భాగం, దాని సాంకేతికత యొక్క డెమోలను విడుదల చేయడం ద్వారా దాని పనిపై మరింత ప్రజల దృష్టిని తీసుకురావడం.

“పోస్ట్ ట్రైనింగ్ నిజంగా ముఖ్యం,” అన్నాడు హన్నా హాజిషిర్జినేచురల్ లాంగ్వేజ్ ప్రాసెసింగ్ యొక్క Ai2 సీనియర్ డైరెక్టర్, ఈ వారం మీడియా బ్రీఫింగ్‌లో, AI భాషా నమూనాలను ఉపయోగించగలిగేలా చేయడంలో శిక్షణానంతర పాత్ర పోషిస్తున్న కీలక పాత్రను వివరిస్తున్నారు.

ఇది కూడా ఒక సవాలుతో కూడుకున్న ప్రక్రియ, శిక్షణానంతర ప్రక్రియలో AI నిర్దిష్ట సామర్థ్యాలను అందించడం వలన మోడల్‌లు శిక్షణకు ముందు ప్రక్రియలో పొందిన సాధారణ సామర్థ్యాలను మరచిపోయేలా చేస్తుందని ఆమె వివరించారు. మరియు ఇప్పటి వరకు, శిక్షణానంతర దశ పరిశ్రమలో చాలా రహస్యంగా సంరక్షించబడింది, ఇది మూసి మోడల్‌లకు ప్రయోజనాన్ని ఇస్తుంది.

తుళు 3 విడుదలతో, మొదటి నుండి పూర్తిగా ప్రీ-ట్రైనింగ్ మోడల్‌లకు అవసరమైన భారీ కంప్యూటింగ్ వనరులు లేకుండా అధిక-నాణ్యత పోస్ట్-ట్రైన్డ్ మోడల్‌లను అర్థం చేసుకోవడానికి మరియు రూపొందించడానికి విస్తృత కమ్యూనిటీని ప్రారంభించాలనే ఆలోచన ఉంది.

“ఈ రకమైన మ్యాజిక్ బ్లాక్-బాక్స్ దశ పోస్ట్-ట్రైనింగ్ ఉంది, ఇది సాధారణ సామర్థ్యాన్ని కోల్పోకుండా కొన్ని పనులలో మోడల్‌లను నిజంగా ఉత్తమంగా చేస్తుంది” అని చెప్పారు. సోఫీ లెబ్రెచ్ట్Ai2 చీఫ్ ఆపరేటింగ్ ఆఫీసర్. ప్రజలు అధిక-నాణ్యత, టాస్క్-నిర్దిష్ట మోడల్‌లను రూపొందించడానికి వీలు కల్పించడానికి తుళు 3 విడుదల “భారీ గేమ్ ఛేంజర్‌గా” ఉంటుందని ఆమె అన్నారు.

మునుపటి తుళు నమూనాల నుండి ప్రధాన వ్యత్యాసాలలో డేటా క్యూరేషన్‌లో పురోగతి, మరింత కఠినమైన మూల్యాంకన ఫ్రేమ్‌వర్క్ మరియు బహుళ-దశల శిక్షణా ప్రక్రియతో సహా అల్గారిథమిక్ మరియు ఇన్‌ఫ్రాస్ట్రక్చర్ మెరుగుదలలు ఉన్నాయి.

“మీరు సరైన డేటాను అందిస్తే అది ఎంత సులభమో దాదాపు ఆశ్చర్యం కలిగించే అనేక విషయాలు ఉన్నాయి” అని అన్నారు. నాథన్ లాంబెర్ట్Ai2 మెషిన్ లెర్నింగ్ సైంటిస్ట్, తుళు 3 మోడల్‌లతో Ai2 అమలు చేసిన పురోగతిని వివరిస్తుంది.

Ai2ని 2014లో దివంగత మైక్రోసాఫ్ట్ సహ వ్యవస్థాపకుడు పాల్ అలెన్ స్థాపించారు. గత ఏడాది నుంచి దీనికి నాయకత్వం వహిస్తున్నారు అలీ ఫర్హాదిఎవరు మునుపు CEO గా Ai2 స్పిన్అవుట్ Xnor.aiని స్థాపించారు మరియు నడిపించారు మరియు 2020లో Appleకి విక్రయించింది అంచనా వేసిన $200 మిలియన్ల డీల్‌లో ఇది ఇప్పటి వరకు ఇన్‌స్టిట్యూట్ యొక్క అతిపెద్ద వాణిజ్య విజయాలలో ఒకటి.

ఈ సంవత్సరం ప్రారంభంలో, Ai2 విడుదలైంది కొత్త మల్టీమోడల్ ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ మోడల్డబ్ చేయబడింది నోరుఇది విజువల్ డేటాతో కొత్త మార్గాల్లో పనిచేస్తుంది. Ai2 దాని ఓపెన్ లాంగ్వేజ్ మోడల్‌ను విడుదల చేసిందిలేదా ఎల్మ్గత సంవత్సరం ఫిబ్రవరిలో, ఉత్పాదక AI మోడల్‌ల పెరుగుదలకు మరింత పారదర్శకతను తీసుకురావడానికి పెద్ద ప్రయత్నంలో భాగం.

Ai2కి యూనివర్శిటీ ఆఫ్ వాషింగ్టన్ యొక్క అలెన్ స్కూల్ ఆఫ్ కంప్యూటర్ సైన్స్ & ఇంజినీరింగ్‌తో సంబంధాలు ఉన్నాయి, ఇక్కడ Ai2 పరిశోధనా నాయకులైన హాజిషిర్జి కూడా అధ్యాపక స్థానాలను కలిగి ఉన్నారు.

తుళు 3 పోస్ట్-ట్రైన్డ్ మోడల్స్ మరియు సంబంధిత వనరులకు లింక్‌లను చూడండి ఇక్కడ.



Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here