OpenAI మీ PCని నియంత్రించగల మరియు మీ తరపున చర్యలను చేయగల AI సాధనాన్ని విడుదల చేయడానికి దగ్గరగా ఉండవచ్చు.
టిబోర్ బ్లాహో, రాబోయే AI ఉత్పత్తులను ఖచ్చితంగా లీక్ చేయడంలో ఖ్యాతి గడించిన సాఫ్ట్వేర్ ఇంజనీర్, వాదనలు OpenAI యొక్క సుదీర్ఘ పుకార్లకు సంబంధించిన సాక్ష్యాలను వెలికితీసేందుకు ఆపరేటర్ సాధనం. ప్రచురణలు సహా బ్లూమ్బెర్గ్ గతంలోనూ ఉన్నాయి నివేదించారు ఆపరేటర్లో, ఇది “ఏజెంట్”కోడ్ రాయడం మరియు ప్రయాణాన్ని బుక్ చేసుకోవడం వంటి పనులను స్వయంప్రతిపత్తితో నిర్వహించగల వ్యవస్థ.
ప్రకారం సమాచారానికి, OpenAI జనవరిని ఆపరేటర్ విడుదల నెలగా లక్ష్యంగా పెట్టుకుంది. ఈ వారాంతంలో Blaho ద్వారా వెలికితీసిన కోడ్ ఆ రిపోర్టింగ్కు విశ్వసనీయతను జోడిస్తుంది.
OpenAI లు ChatGPT MacOS కోసం క్లయింట్ Blahoకి “టోగుల్ ఆపరేటర్” మరియు “ఫోర్స్ క్విట్ ఆపరేటర్”కి షార్ట్కట్లను నిర్వచించడానికి, ప్రస్తుతానికి దాచబడిన ఎంపికలను పొందింది. మరియు OpenAI దాని వెబ్సైట్లో ఆపరేటర్కు సూచనలను జోడించింది, Blaho చెప్పారు – ఇంకా బహిరంగంగా కనిపించని సూచనలు.
OpenAI వెబ్సైట్ ఇప్పటికే ఆపరేటర్/OpenAI CUA (కంప్యూటర్ యూజ్ ఏజెంట్) – “ఆపరేటర్ సిస్టమ్ కార్డ్ టేబుల్”, “ఆపరేటర్ రీసెర్చ్ ఎవాల్ టేబుల్” మరియు “ఆపరేటర్ రిఫ్యూసల్ రేట్ టేబుల్”కి సూచనలను కలిగి ఉంది.
క్లాడ్ 3.5 సొనెట్ కంప్యూటర్ వినియోగం, గూగుల్ మెరైనర్ మొదలైన వాటితో పోలికతో సహా.
(పట్టికల ప్రివ్యూ… pic.twitter.com/OOBgC3ddkU
— టిబోర్ బ్లాహో (@btibor91) జనవరి 20, 2025
Blaho ప్రకారం, OpenAI యొక్క సైట్ ఆపరేటర్ పనితీరును ఇతర కంప్యూటర్-ఉపయోగించే AI సిస్టమ్లతో పోల్చిన ఇంకా పబ్లిక్ కాని పట్టికలను కలిగి ఉంది. పట్టికలు ప్లేస్హోల్డర్లు కావచ్చు. సంఖ్యలు ఖచ్చితమైనవి అయితే, పనిని బట్టి ఆపరేటర్ 100% నమ్మదగినది కాదని వారు సూచిస్తున్నారు.
OpenAI వెబ్సైట్ ఇప్పటికే ఆపరేటర్/OpenAI CUA (కంప్యూటర్ యూజ్ ఏజెంట్) – “ఆపరేటర్ సిస్టమ్ కార్డ్ టేబుల్”, “ఆపరేటర్ రీసెర్చ్ ఎవాల్ టేబుల్” మరియు “ఆపరేటర్ రిఫ్యూసల్ రేట్ టేబుల్”కి సూచనలను కలిగి ఉంది.
క్లాడ్ 3.5 సొనెట్ కంప్యూటర్ వినియోగం, గూగుల్ మెరైనర్ మొదలైన వాటితో పోలికతో సహా.
(పట్టికల ప్రివ్యూ… pic.twitter.com/OOBgC3ddkU
— టిబోర్ బ్లాహో (@btibor91) జనవరి 20, 2025
OSWorldలో, నిజమైన కంప్యూటర్ వాతావరణాన్ని అనుకరించడానికి ప్రయత్నించే బెంచ్మార్క్, “OpenAI కంప్యూటర్ యూజ్ ఏజెంట్ (CUA)” — బహుశా AI మోడల్ పవర్ చేసే ఆపరేటర్ — స్కోర్ 38.1%, ఆంత్రోపిక్స్ కంటే ముందుంది. కంప్యూటర్-నియంత్రణ నమూనా కానీ 72.4% మానవుల స్కోర్ కంటే చాలా తక్కువ. OpenAI CUA వెబ్వోయేజర్లో మానవ పనితీరును అధిగమించింది, ఇది వెబ్సైట్లతో నావిగేట్ చేయడానికి మరియు పరస్పర చర్య చేయడానికి AI యొక్క సామర్థ్యాన్ని అంచనా వేస్తుంది. అయితే లీక్ అయిన బెంచ్మార్క్ల ప్రకారం, మోడల్ మరొక వెబ్ ఆధారిత బెంచ్మార్క్ వెబ్అరెనాలో మానవ-స్థాయి స్కోర్ల కంటే తక్కువగా ఉంది.
లీక్ను విశ్వసిస్తే, మానవుడు సులభంగా చేయగలిగే పనులతో ఆపరేటర్ కూడా కష్టపడతాడు. క్లౌడ్ ప్రొవైడర్తో సైన్ అప్ చేయడం మరియు వర్చువల్ మెషీన్ను ప్రారంభించడం వంటి పనిని ఆపరేటర్కు అప్పగించిన పరీక్షలో, ఆపరేటర్ 60% సమయం మాత్రమే విజయవంతమైంది. బిట్కాయిన్ వాలెట్ను సృష్టించే పనిలో, ఆపరేటర్ 10% సమయం మాత్రమే విజయం సాధించారు.
AI ఏజెంట్ స్పేస్లోకి OpenAI యొక్క ఆసన్న ప్రవేశం పైన పేర్కొన్న ఆంత్రోపిక్తో సహా ప్రత్యర్థులుగా వస్తుంది, Googleమరియు ఇతరులు నాసెంట్ సెగ్మెంట్ కోసం నాటకాలు వేస్తారు. AI ఏజెంట్లు కావచ్చు ప్రమాదకర మరియు ఊహాజనితకానీ టెక్ దిగ్గజాలు వాటిని ఇప్పటికే ప్రచారం చేస్తున్నారు తదుపరి పెద్ద విషయం AI లో. ప్రకారం అనలిటిక్స్ సంస్థ మార్కెట్స్ అండ్ మార్కెట్స్ ప్రకారం, AI ఏజెంట్ల మార్కెట్ విలువ 2030 నాటికి $47.1 బిలియన్గా ఉండవచ్చు.
ఏజెంట్లు నేడు చాలా ప్రాచీనమైనవి. అయితే సాంకేతికత వేగంగా అభివృద్ధి చెందాలంటే, కొందరు నిపుణులు వారి భద్రత గురించి ఆందోళన వ్యక్తం చేశారు.
లీక్ అయిన చార్ట్లలో ఒకటి, ఎంపిక చేసిన భద్రతా మూల్యాంకనాలపై ఆపరేటర్ బాగా పని చేస్తుందని చూపిస్తుంది, ఇందులో సిస్టమ్ను “అక్రమ కార్యకలాపాలు” నిర్వహించేలా మరియు “సున్నితమైన వ్యక్తిగత డేటా” కోసం శోధించడానికి ప్రయత్నించే పరీక్షలు ఉన్నాయి. నివేదించబడిందిఆపరేటర్ యొక్క సుదీర్ఘ అభివృద్ధి చక్రానికి కారణాలలో భద్రతా పరీక్ష ఒకటి. ఇటీవలి X లో పోస్ట్OpenAI సహ-వ్యవస్థాపకుడు Wojciech Zaremba అతను భద్రతా ఉపశమనాలు లేవని పేర్కొన్న ఏజెంట్ను విడుదల చేసినందుకు ఆంత్రోపిక్ను విమర్శించారు.
“OpenAI ఇదే విధమైన విడుదల చేస్తే ప్రతికూల ప్రతిచర్యలను నేను ఊహించగలను” అని Zaremba రాశారు.
OpenAI అని గమనించాలి విమర్శించారు AI పరిశోధకులు, మాజీ సిబ్బందితో సహా, దాని సాంకేతికతను త్వరగా ఉత్పత్తి చేయడానికి అనుకూలంగా భద్రతా పనిని నొక్కిచెప్పారు.