AI నమూనాలు తరచూ “నకిలీ సహసంబంధాలపై” ఆధారపడతాయి, అప్రధానమైన మరియు తప్పుదోవ పట్టించే సమాచారం ఆధారంగా నిర్ణయాలు తీసుకుంటాయి. ఈ నేర్చుకున్న నకిలీ సహసంబంధాలను శిక్షణ డేటా యొక్క చాలా చిన్న ఉపసమితిని గుర్తించవచ్చని పరిశోధకులు ఇప్పుడు కనుగొన్నారు మరియు సమస్యను అధిగమించే సాంకేతికతను ప్రదర్శించారు.
“ఈ టెక్నిక్ నవల, AI ఏ నకిలీ సహసంబంధాలు ఆధారపడుతున్నాయో మీకు తెలియకపోయినా ఉపయోగించవచ్చు” అని ఈ పనిపై కాగితం యొక్క సంబంధిత రచయిత మరియు నార్త్ కరోలినా స్టేట్ యూనివర్శిటీలో కంప్యూటర్ సైన్స్ అసిస్టెంట్ ప్రొఫెసర్ జంగ్-యున్ కిమ్ చెప్పారు. “నకిలీ లక్షణాలు ఏమిటో మీకు ఇప్పటికే మంచి ఆలోచన ఉంటే, మా టెక్నిక్ సమస్యను పరిష్కరించడానికి సమర్థవంతమైన మరియు ప్రభావవంతమైన మార్గం. అయినప్పటికీ, మీరు పనితీరు సమస్యలను కలిగి ఉన్నప్పటికీ, ఎందుకు అర్థం కాలేదు, ఒక చిన్న సహసంబంధం ఉందో లేదో తెలుసుకోవడానికి మరియు ఆ సమస్యను పరిష్కరించడానికి మీరు ఇప్పటికీ మా సాంకేతికతను ఉపయోగించవచ్చు.”
నకిలీ సహసంబంధాలు సాధారణంగా AI శిక్షణ సమయంలో సరళత పక్షపాతం వల్ల సంభవిస్తాయి. నిర్దిష్ట పనులను నిర్వహించడానికి ప్రాక్టీషనర్లు AI మోడళ్లకు శిక్షణ ఇవ్వడానికి డేటా సెట్లను ఉపయోగిస్తారు. ఉదాహరణకు, కుక్కల ఛాయాచిత్రాలను గుర్తించడానికి AI మోడల్కు శిక్షణ ఇవ్వవచ్చు. శిక్షణ డేటా సెట్లో కుక్కల చిత్రాలు ఉంటాయి, ఇక్కడ AI కి ఫోటోలో ఉన్న కుక్క ఉంది. శిక్షణా ప్రక్రియలో, కుక్కలను గుర్తించడానికి ఇది ఉపయోగించగల నిర్దిష్ట లక్షణాలను గుర్తించడం ప్రారంభిస్తుంది. అయినప్పటికీ, ఫోటోలలోని చాలా కుక్కలు కాలర్లు ధరించి ఉంటే, మరియు కాలర్లు సాధారణంగా చెవులు లేదా బొచ్చు కంటే కుక్క యొక్క తక్కువ సంక్లిష్ట లక్షణాలు కాబట్టి, కుక్కలను గుర్తించడానికి AI కాలర్లను ఒక సాధారణ మార్గంగా ఉపయోగించవచ్చు. సరళత పక్షపాతం నకిలీ సహసంబంధాలకు కారణమవుతుంది.
“మరియు కుక్కలను గుర్తించడానికి AI కాలర్లను ఉపయోగించే కారకంగా ఉపయోగిస్తే, కాలర్లను ధరించిన పిల్లులను కుక్కలుగా AI గుర్తించవచ్చు” అని కిమ్ చెప్పారు.
నకిలీ సహసంబంధాల వల్ల కలిగే సమస్యలను పరిష్కరించడానికి సాంప్రదాయిక పద్ధతులు సమస్యకు కారణమయ్యే నకిలీ లక్షణాలను గుర్తించగలిగే అభ్యాసకులు ఆధారపడతాయి. వారు AI మోడల్కు శిక్షణ ఇవ్వడానికి ఉపయోగించే డేటా సెట్లను సవరించడం ద్వారా దీనిని పరిష్కరించవచ్చు. ఉదాహరణకు, ప్రాక్టీషనర్లు డేటా సెట్లోని ఫోటోలకు ఇచ్చిన బరువును పెంచవచ్చు, ఇందులో కాలర్లు ధరించని కుక్కలను కలిగి ఉంటారు.
ఏదేమైనా, వారి కొత్త పనిలో, పరిశోధకులు సమస్యలను కలిగించే నకిలీ లక్షణాలను గుర్తించడం ఎల్లప్పుడూ సాధ్యం కాదని నిరూపించారు – నకిలీ సహసంబంధాలను పనికిరాని పరిష్కరించడానికి సాంప్రదాయిక పద్ధతులు చేయడం.
“ఈ పనితో మా లక్ష్యం ఏమిటంటే, ఆ నకిలీ లక్షణాల గురించి మాకు ఏమీ తెలియకపోయినా నకిలీ సహసంబంధాలను విడదీయడానికి అనుమతించే ఒక సాంకేతికతను అభివృద్ధి చేయడం” అని కిమ్ చెప్పారు.
కొత్త టెక్నిక్ AI మోడల్కు శిక్షణ ఇవ్వడానికి ఉపయోగించే డేటాలో కొంత భాగాన్ని తొలగించడంపై ఆధారపడుతుంది.
“శిక్షణ డేటా సెట్లలో చేర్చబడిన డేటా నమూనాలలో గణనీయమైన వైవిధ్యం ఉండవచ్చు” అని కిమ్ చెప్పారు. “కొన్ని నమూనాలు చాలా సరళంగా ఉంటాయి, మరికొన్ని చాలా క్లిష్టంగా ఉండవచ్చు మరియు శిక్షణ సమయంలో మోడల్ ఎలా ప్రవర్తిస్తుందో దానిపై ప్రతి నమూనా ఎంత ‘కష్టతరమైనది’ అనే దానిపై ఆధారపడి ఉంటుంది.
“మా పరికల్పన ఏమిటంటే, డేటా సెట్లోని చాలా కష్టమైన నమూనాలు ధ్వనించేవి మరియు అస్పష్టంగా ఉంటాయి మరియు మోడల్ యొక్క పనితీరును దెబ్బతీసే అసంబద్ధమైన సమాచారంపై ఆధారపడటానికి నెట్వర్క్ను బలవంతం చేసే అవకాశం ఉంది” అని కిమ్ వివరించాడు. “అర్థం చేసుకోవడం కష్టతరమైన శిక్షణ డేటా యొక్క చిన్న సిల్వర్ను తొలగించడం ద్వారా, మీరు నకిలీ లక్షణాలను కలిగి ఉన్న హార్డ్ డేటా నమూనాలను కూడా తొలగిస్తున్నారు. ఈ తొలగింపు గణనీయమైన ప్రతికూల ప్రభావాలను కలిగించకుండా, నకిలీ సహసంబంధ సమస్యను అధిగమిస్తుంది.”
కొత్త సాంకేతికత అత్యాధునిక ఫలితాలను సాధిస్తుందని పరిశోధకులు నిరూపించారు-నకిలీ లక్షణాలు గుర్తించదగిన మోడళ్లపై మునుపటి పనితో పోల్చినప్పుడు కూడా పనితీరును మెరుగుపరుస్తుంది.
పీర్-సమీక్షించిన కాగితం, “డేటా కత్తిరింపుతో నకిలీ సహసంబంధాలను విడదీయడం”, ఏప్రిల్ 24-28 వరకు సింగపూర్లో జరుగుతున్న ఇంటర్నేషనల్ కాన్ఫరెన్స్ ఆన్ లెర్నింగ్ రిప్రజెంటేషన్స్ (ఐసిఎల్ఆర్) లో ప్రదర్శించబడుతుంది. కాగితం యొక్క మొదటి రచయిత వరుణ్ ముల్చందని, పిహెచ్.డి. ఎన్సి స్టేట్లో విద్యార్థి.