AI నమూనాలు తరచూ “నకిలీ సహసంబంధాలపై” ఆధారపడతాయి, అప్రధానమైన మరియు తప్పుదోవ పట్టించే సమాచారం ఆధారంగా నిర్ణయాలు తీసుకుంటాయి. ఈ నేర్చుకున్న నకిలీ సహసంబంధాలను శిక్షణ డేటా యొక్క చాలా చిన్న ఉపసమితిని గుర్తించవచ్చని పరిశోధకులు ఇప్పుడు కనుగొన్నారు మరియు సమస్యను అధిగమించే సాంకేతికతను ప్రదర్శించారు.

“ఈ టెక్నిక్ నవల, AI ఏ నకిలీ సహసంబంధాలు ఆధారపడుతున్నాయో మీకు తెలియకపోయినా ఉపయోగించవచ్చు” అని ఈ పనిపై కాగితం యొక్క సంబంధిత రచయిత మరియు నార్త్ కరోలినా స్టేట్ యూనివర్శిటీలో కంప్యూటర్ సైన్స్ అసిస్టెంట్ ప్రొఫెసర్ జంగ్-యున్ కిమ్ చెప్పారు. “నకిలీ లక్షణాలు ఏమిటో మీకు ఇప్పటికే మంచి ఆలోచన ఉంటే, మా టెక్నిక్ సమస్యను పరిష్కరించడానికి సమర్థవంతమైన మరియు ప్రభావవంతమైన మార్గం. అయినప్పటికీ, మీరు పనితీరు సమస్యలను కలిగి ఉన్నప్పటికీ, ఎందుకు అర్థం కాలేదు, ఒక చిన్న సహసంబంధం ఉందో లేదో తెలుసుకోవడానికి మరియు ఆ సమస్యను పరిష్కరించడానికి మీరు ఇప్పటికీ మా సాంకేతికతను ఉపయోగించవచ్చు.”

నకిలీ సహసంబంధాలు సాధారణంగా AI శిక్షణ సమయంలో సరళత పక్షపాతం వల్ల సంభవిస్తాయి. నిర్దిష్ట పనులను నిర్వహించడానికి ప్రాక్టీషనర్లు AI మోడళ్లకు శిక్షణ ఇవ్వడానికి డేటా సెట్‌లను ఉపయోగిస్తారు. ఉదాహరణకు, కుక్కల ఛాయాచిత్రాలను గుర్తించడానికి AI మోడల్‌కు శిక్షణ ఇవ్వవచ్చు. శిక్షణ డేటా సెట్‌లో కుక్కల చిత్రాలు ఉంటాయి, ఇక్కడ AI కి ఫోటోలో ఉన్న కుక్క ఉంది. శిక్షణా ప్రక్రియలో, కుక్కలను గుర్తించడానికి ఇది ఉపయోగించగల నిర్దిష్ట లక్షణాలను గుర్తించడం ప్రారంభిస్తుంది. అయినప్పటికీ, ఫోటోలలోని చాలా కుక్కలు కాలర్లు ధరించి ఉంటే, మరియు కాలర్లు సాధారణంగా చెవులు లేదా బొచ్చు కంటే కుక్క యొక్క తక్కువ సంక్లిష్ట లక్షణాలు కాబట్టి, కుక్కలను గుర్తించడానికి AI కాలర్లను ఒక సాధారణ మార్గంగా ఉపయోగించవచ్చు. సరళత పక్షపాతం నకిలీ సహసంబంధాలకు కారణమవుతుంది.

“మరియు కుక్కలను గుర్తించడానికి AI కాలర్లను ఉపయోగించే కారకంగా ఉపయోగిస్తే, కాలర్లను ధరించిన పిల్లులను కుక్కలుగా AI గుర్తించవచ్చు” అని కిమ్ చెప్పారు.

నకిలీ సహసంబంధాల వల్ల కలిగే సమస్యలను పరిష్కరించడానికి సాంప్రదాయిక పద్ధతులు సమస్యకు కారణమయ్యే నకిలీ లక్షణాలను గుర్తించగలిగే అభ్యాసకులు ఆధారపడతాయి. వారు AI మోడల్‌కు శిక్షణ ఇవ్వడానికి ఉపయోగించే డేటా సెట్‌లను సవరించడం ద్వారా దీనిని పరిష్కరించవచ్చు. ఉదాహరణకు, ప్రాక్టీషనర్లు డేటా సెట్‌లోని ఫోటోలకు ఇచ్చిన బరువును పెంచవచ్చు, ఇందులో కాలర్లు ధరించని కుక్కలను కలిగి ఉంటారు.

ఏదేమైనా, వారి కొత్త పనిలో, పరిశోధకులు సమస్యలను కలిగించే నకిలీ లక్షణాలను గుర్తించడం ఎల్లప్పుడూ సాధ్యం కాదని నిరూపించారు – నకిలీ సహసంబంధాలను పనికిరాని పరిష్కరించడానికి సాంప్రదాయిక పద్ధతులు చేయడం.

“ఈ పనితో మా లక్ష్యం ఏమిటంటే, ఆ నకిలీ లక్షణాల గురించి మాకు ఏమీ తెలియకపోయినా నకిలీ సహసంబంధాలను విడదీయడానికి అనుమతించే ఒక సాంకేతికతను అభివృద్ధి చేయడం” అని కిమ్ చెప్పారు.

కొత్త టెక్నిక్ AI మోడల్‌కు శిక్షణ ఇవ్వడానికి ఉపయోగించే డేటాలో కొంత భాగాన్ని తొలగించడంపై ఆధారపడుతుంది.

“శిక్షణ డేటా సెట్లలో చేర్చబడిన డేటా నమూనాలలో గణనీయమైన వైవిధ్యం ఉండవచ్చు” అని కిమ్ చెప్పారు. “కొన్ని నమూనాలు చాలా సరళంగా ఉంటాయి, మరికొన్ని చాలా క్లిష్టంగా ఉండవచ్చు మరియు శిక్షణ సమయంలో మోడల్ ఎలా ప్రవర్తిస్తుందో దానిపై ప్రతి నమూనా ఎంత ‘కష్టతరమైనది’ అనే దానిపై ఆధారపడి ఉంటుంది.

“మా పరికల్పన ఏమిటంటే, డేటా సెట్‌లోని చాలా కష్టమైన నమూనాలు ధ్వనించేవి మరియు అస్పష్టంగా ఉంటాయి మరియు మోడల్ యొక్క పనితీరును దెబ్బతీసే అసంబద్ధమైన సమాచారంపై ఆధారపడటానికి నెట్‌వర్క్‌ను బలవంతం చేసే అవకాశం ఉంది” అని కిమ్ వివరించాడు. “అర్థం చేసుకోవడం కష్టతరమైన శిక్షణ డేటా యొక్క చిన్న సిల్వర్‌ను తొలగించడం ద్వారా, మీరు నకిలీ లక్షణాలను కలిగి ఉన్న హార్డ్ డేటా నమూనాలను కూడా తొలగిస్తున్నారు. ఈ తొలగింపు గణనీయమైన ప్రతికూల ప్రభావాలను కలిగించకుండా, నకిలీ సహసంబంధ సమస్యను అధిగమిస్తుంది.”

కొత్త సాంకేతికత అత్యాధునిక ఫలితాలను సాధిస్తుందని పరిశోధకులు నిరూపించారు-నకిలీ లక్షణాలు గుర్తించదగిన మోడళ్లపై మునుపటి పనితో పోల్చినప్పుడు కూడా పనితీరును మెరుగుపరుస్తుంది.

పీర్-సమీక్షించిన కాగితం, “డేటా కత్తిరింపుతో నకిలీ సహసంబంధాలను విడదీయడం”, ఏప్రిల్ 24-28 వరకు సింగపూర్‌లో జరుగుతున్న ఇంటర్నేషనల్ కాన్ఫరెన్స్ ఆన్ లెర్నింగ్ రిప్రజెంటేషన్స్ (ఐసిఎల్‌ఆర్) లో ప్రదర్శించబడుతుంది. కాగితం యొక్క మొదటి రచయిత వరుణ్ ముల్చందని, పిహెచ్.డి. ఎన్‌సి స్టేట్‌లో విద్యార్థి.



Source link