AI ప్రపంచాన్ని ఆక్రమించింది మరియు మా సిలికాన్ వ్యాలీ టెక్ ఓవర్లార్డ్లలో అధునాతన అంశంగా కనిపిస్తోంది. “AI” అనే పదం 1950ల చివరి నుండి ఉనికిలో ఉన్నప్పటికీ, దాని వినియోగం పూర్తిగా ప్రజాదరణ పొందింది, OpenAI యొక్క ప్రముఖ లార్జ్ లాంగ్వేజ్ మోడల్ (LLM) చాట్బాట్ అయిన ChatGPTకి ధన్యవాదాలు.
ChatGPT వంటి LLMలు అందరినీ ఆకట్టుకున్నాయి, కానీ ప్రతి ఒక్కరూ వాటి అభివృద్ధి గురించి థ్రిల్గా ఉండరు. ఈ చాట్బాట్ల వెనుక ఉన్న మోడల్లు కాపీరైట్ చేయబడిన మెటీరియల్ని కలిగి ఉండే మానవ మూలం డేటాసెట్లపై శిక్షణ పొందుతాయి. చెల్లింపు లేదా సమ్మతి లేకుండా AI మెషీన్లో తమ పనిని అందించడం పట్ల క్రియేటివ్లు చాలా సంతోషంగా లేరు.
ఉదాహరణకు, ఎలోన్ మస్క్ అని తెలుసుకున్న కొంతమంది వినియోగదారులు బ్లూస్కీ కోసం ట్విట్టర్ నుండి పారిపోయారు అతని AI, గ్రోక్కి శిక్షణ ఇచ్చాడుట్విట్టర్ పోస్ట్లలో. కొన్ని నెలల క్రితం, బ్లూస్కీ వినియోగదారులు ఆగ్రహం వ్యక్తం చేశారు హగ్గింగ్ ఫేస్ ఉద్యోగి AI శిక్షణ కోసం 1 మిలియన్ బ్లూస్కీ పోస్ట్లను కలిగి ఉన్న డేటాసెట్ను అప్లోడ్ చేసినప్పుడు. AIలో కాపీరైట్ ఆందోళనలు జోక్ కాదు మరియు ఈ సమస్యలు ఇప్పటికే అనేక వ్యాజ్యాలకు దారితీశాయి.
కొత్త వ్యాజ్యం కాలిఫోర్నియా ఉత్తర జిల్లా కొరకు US డిస్ట్రిక్ట్ కోర్ట్లో దాఖలు చేయబడిందిమార్క్ జుకర్బర్గ్ ఆమోదంతో ఆరోపించిన పైరేటెడ్ ఈబుక్లు మరియు కథనాల డేటాసెట్లో మెటా తన లామా AI మోడల్లకు శిక్షణ ఇస్తోందని ఆరోపించింది.
సారా సిల్వర్మాన్ మరియు టా-నెహిసి కోట్స్తో సహా వాదిదారులు, మెటా లిబ్జెన్ను ఉపయోగించారని పేర్కొన్నారు, ఇది స్వీయ-వర్ణించిన “లింక్ల అగ్రిగేటర్”, లామాకు శిక్షణ ఇవ్వడానికి డేటాసెట్గా ఉంది. కోర్టు పత్రం ఇలా పేర్కొంది:
‘లిబ్జెన్ డేటాసెట్’ అనేది షాడో లేదా పైరేటెడ్ డేటాసెట్, ఇది సెంగజ్ లెర్నింగ్, మాక్మిలన్ లెర్నింగ్, మెక్గ్రా హిల్ మరియు పియర్సన్ ఎడ్యుకేషన్ (లిబ్జెన్ ద్వారా పైరసీని నిరోధించడానికి దావా వేసింది) వంటి పెద్ద ప్రచురణకర్తల రచనలను కలిగి ఉంటుంది.
స్పష్టంగా, జుకర్బర్గ్ అనుమతితో తన లామా మోడల్లకు శిక్షణ ఇవ్వడానికి లిబ్జెన్ను ఉపయోగించినట్లు మెటా గత సంవత్సరం సాక్ష్యమిచ్చింది. లిబ్జెన్ నుండి డేటాను మెటా స్క్రాప్ చేసిన తర్వాత, అది తీసుకున్న మెటీరియల్ల నుండి మొత్తం కాపీరైట్ సమాచారాన్ని తీసివేయడానికి ప్రయత్నించిందని దావా ఆరోపించింది.
విస్తృతమైన కాపీరైట్ ఉల్లంఘనను సులభతరం చేయడానికి మరియు దాచడానికి దాని లామా మోడల్లకు శిక్షణ ఇవ్వడానికి ఉపయోగించబడిన వర్క్లను మెటా చట్టవిరుద్ధంగా వాది నుండి కాపీరైట్ మేనేజ్మెంట్ సమాచారం (‘CMI’) తీసివేసినట్లు ఇప్పుడు స్పష్టమైంది.
లిబ్జెన్ను స్క్రాప్ చేసి, లామాకు శిక్షణ కోసం దాని డేటాను ఉపయోగించాలని మెటా తీసుకున్న నిర్ణయం నిబంధనలను ఉల్లంఘించడమేనని వాదిదారులు వాదించారు. కాలిఫోర్నియా కాంప్రహెన్సివ్ కంప్యూటర్ డేటా యాక్సెస్ అండ్ ఫ్రాడ్ యాక్ట్ (CDAFA).
అగ్నికి ఆజ్యం పోస్తూ, Meta యొక్క ముఖ్య AI శాస్త్రవేత్త, Yann LeCun, గత సంవత్సరం X (గతంలో Twitter)లో పుస్తక రచయితలు తమ రచనలను ఉచితంగా అందుబాటులో ఉంచాలని సూచించినప్పుడు ఎదురుదెబ్బ తగిలింది.
తక్కువ సంఖ్యలో పుస్తక రచయితలు మాత్రమే పుస్తక విక్రయాల నుండి గణనీయమైన డబ్బు సంపాదిస్తారు.
చాలా పుస్తకాలు డౌన్లోడ్ చేసుకోవడానికి ఉచితంగా అందుబాటులో ఉండాలని ఇది సూచించినట్లు కనిపిస్తోంది.
రచయితల కోసం కోల్పోయిన ఆదాయం తక్కువగా ఉంటుంది మరియు పోల్చి చూస్తే సమాజానికి పెద్దగా ప్రయోజనాలు ఉంటాయి. https://t.co/4ObkW1tm85– యాన్ లెకున్ (@ylecun) జనవరి 1, 2024
మెటా కేసుకు సంబంధించి మాకు ఇంకా తీర్పు లేదు, కానీ యుద్ధం ముగియలేదు. AI మన జీవితాల్లోకి మరింత లోతుగా నేయడం కొనసాగిస్తున్నందున, ఇలాంటి మరిన్ని వ్యాజ్యాలను ఆశించండి.