కొన్నేళ్లుగా, మెటా ఉద్యోగులు సంస్థ యొక్క AI మోడళ్లకు శిక్షణ ఇవ్వడానికి చట్టబద్ధంగా ప్రశ్నార్థకమైన మార్గాల ద్వారా పొందిన కాపీరైట్ చేసిన రచనలను ఉపయోగించి అంతర్గతంగా చర్చించారు, గురువారం అన్‌సీల్ చేయని కోర్టు పత్రాల ప్రకారం.

కాడ్రీ వి. మెటా కేసులో వాది పత్రాలను సమర్పించారు, యుఎస్ కోర్టు వ్యవస్థ ద్వారా నెమ్మదిగా మూసివేసే అనేక AI కాపీరైట్ వివాదాలలో ఒకటి. ప్రతివాది, మెటా, ఐపి-ప్రొటెక్టెడ్ రచనలపై, ముఖ్యంగా పుస్తకాలపై శిక్షణా నమూనాలు “సరసమైన ఉపయోగం” అని పేర్కొన్నాడు. రచయితలు సారా సిల్వర్‌మాన్ మరియు టా-నెహిసి కోట్స్ ఉన్న వాదిదారులు అంగీకరించలేదు.

మెటా సిఇఒ మార్క్ జుకర్‌బర్గ్ అని దావాలో సమర్పించిన మునుపటి పదార్థాలు కాపీరైట్ చేసిన కంటెంట్‌పై శిక్షణ ఇవ్వడానికి మెటా యొక్క AI బృందానికి సరే ఇచ్చింది మరియు ఆ మెటా పుస్తక ప్రచురణకర్తలతో AI శిక్షణ డేటా లైసెన్సింగ్ చర్చలను నిలిపివేసింది. కొత్త ఫైలింగ్స్, వీటిలో ఎక్కువ భాగం మెటా సిబ్బంది మధ్య అంతర్గత పని చాట్‌ల భాగాలను చూపుతాయి, కాపీరైట్ చేసిన డేటాను ఎలా ఉపయోగించుకోవాలో స్పష్టమైన చిత్రాన్ని చిత్రించాయి, కాపీరైట్ చేసిన డేటాను దాని మోడళ్లకు శిక్షణ ఇవ్వడానికి, సంస్థలోని మోడళ్లతో సహా లామా కుటుంబం.

ఒక చాట్‌లో, మెటా యొక్క లామా మోడల్ రీసెర్చ్ టీం యొక్క సీనియర్ మేనేజర్ మెలానియా కంబదూర్ సహా మెటా ఉద్యోగులు చట్టబద్ధంగా నిండి ఉండవచ్చని తమకు తెలిసిన రచనలపై శిక్షణా నమూనాలను చర్చించారు.

“(M) y అభిప్రాయం (క్షమాపణ అడగండి, అనుమతి కోసం కాదు ‘అనే పంక్తిలో): మేము పుస్తకాలను సంపాదించడానికి మరియు దానిని అమలు చేయడానికి ప్రయత్నిస్తాము, తద్వారా వారు కాల్ చేస్తారు” అని మెటా రీసెర్చ్ ఇంజనీర్ జేవియర్ మార్టినెట్ రాశారు, ఫిబ్రవరి 2023 నాటి చాట్‌లో, దాఖలు ప్రకారం. “(టి) అతను (sic) కోసం ఈ జెన్ ఐ ఆర్గ్ ఎందుకు ఏర్పాటు చేశారు: కాబట్టి మనం తక్కువ రిస్క్ విముఖంగా ఉంటారు.”

వ్యక్తిగత పుస్తక ప్రచురణకర్తలతో లైసెన్సింగ్ ఒప్పందాలను తగ్గించడం కంటే శిక్షణా సమితిని నిర్మించడానికి రిటైల్ ధరలకు ఇ-పుస్తకాలను కొనుగోలు చేయాలనే ఆలోచనను మార్టినెట్ తేలింది. మరొక సిబ్బంది అనధికార, కాపీరైట్ చేసిన పదార్థాలను చట్టపరమైన సవాలుకు కారణమని ఎత్తి చూపిన తరువాత, మార్టినెట్ రెట్టింపు అయ్యింది, “ఒక గెజిలియన్” స్టార్టప్‌లు ఇప్పటికే పైరేటెడ్ పుస్తకాలను శిక్షణ కోసం ఉపయోగిస్తున్నాయని వాదించారు.

“నా ఉద్దేశ్యం, చెత్త కేసు: చివరకు ఇది సరేనని మేము కనుగొన్నాము, అయితే ఒక గెజిలియన్ స్టార్ట్ అప్ (sic) బిట్‌టొరెంట్ గురించి టన్నుల కొద్దీ పుస్తకాలను పైరేటెడ్” అని మార్టినెట్ రాశాడు, దాఖలు ప్రకారం. “(M) y 2 సెంట్లు మళ్ళీ: ప్రచురణకర్తలతో ఒప్పందాలు చేసుకోవడానికి ప్రయత్నించడానికి నేరుగా చాలా సమయం పడుతుంది…”

అదే చాట్‌లో, మెటా లైసెన్సుల కోసం డాక్యుమెంట్ హోస్టింగ్ ప్లాట్‌ఫాం స్క్రిబ్డ్ “మరియు ఇతరులు” తో చర్చలు జరుపుతున్నట్లు గుర్తించిన కంబాదూర్, మోడల్ శిక్షణ కోసం “బహిరంగంగా లభించే డేటాను” ఉపయోగిస్తున్నప్పుడు ఆమోదాలు అవసరమని హెచ్చరించారు, మెటా యొక్క న్యాయవాదులు కంటే “తక్కువ సంప్రదాయవాదం” వారు గతంలో ఇటువంటి ఆమోదాలతో ఉన్నారు.

“అవును, మేము ఖచ్చితంగా బహిరంగంగా లభించే డేటాపై లైసెన్సులు లేదా ఆమోదాలు పొందాలి” అని కంబదూర్ చెప్పారు, దాఖలు ప్రకారం. “(డి) ఇప్పుడు మనకు ఎక్కువ డబ్బు, ఎక్కువ మంది న్యాయవాదులు, ఎక్కువ బిజ్దేవ్ సహాయం, వేగం కోసం వేగంగా ట్రాక్ చేసే/పెరిగే సామర్థ్యం, ​​మరియు న్యాయవాదులు ఆమోదాలపై కొంచెం తక్కువ సాంప్రదాయికంగా ఉన్నారు.”

లిబెన్ గురించి చర్చలు

ఫైలింగ్స్‌లో ప్రసారం చేయబడిన మరొక పని చాట్‌లో, కంబదూర్ మెటా లైసెన్స్ ఇవ్వగల డేటా మూలాలకు ప్రత్యామ్నాయంగా, ప్రచురణకర్తల నుండి కాపీరైట్ చేసిన రచనలకు ప్రాప్యతను అందించే “లింక్స్ అగ్రిగేటర్” అనే “లింక్స్ అగ్రిగేటర్” ను ఉపయోగించడం గురించి చర్చిస్తుంది.

లిబెన్‌పై అనేకసార్లు కేసు పెట్టారు, మూసివేయాలని ఆదేశించారు మరియు కాపీరైట్ ఉల్లంఘన కోసం పదిలక్షల డాలర్ల జరిమానా విధించారు. కంబదూర్ సహచరులలో ఒకరు స్క్రీన్ షాట్ తో స్పందించారు “లేదు, లిబ్జెన్ చట్టబద్ధం కాదు” అని స్నిప్పెట్ ఉన్న లిబ్జెన్ కోసం గూగుల్ శోధన ఫలితం.

మెటాలోని కొంతమంది నిర్ణయాధికారులు మోడల్ శిక్షణ కోసం లిబెన్‌ను ఉపయోగించడంలో విఫలమవడం AI రేసులో మెటా యొక్క పోటీతత్వాన్ని తీవ్రంగా దెబ్బతీస్తుందనే అభిప్రాయంలో ఉన్నట్లు తెలుస్తోంది, దాఖలు ప్రకారం.

మెటా ఐ విపి జోయెల్ పినౌ, మెటాలో ప్రొడక్ట్ మేనేజ్‌మెంట్ డైరెక్టర్ సోనీ థీకనాథ్, లిబెన్‌ను “అన్ని వర్గాలలో సోటా సంఖ్యలను కలవడానికి ఎసెన్షియల్” అని పిలువబడే ఒక ఇమెయిల్‌లో, ఉత్తమమైన, అత్యాధునిక (సోటా) ను అగ్రస్థానంలో పేర్కొంటుంది. AI మోడల్స్ మరియు బెంచ్ మార్క్ వర్గాలు.

మెటా యొక్క చట్టపరమైన బహిర్గతం తగ్గించడంలో సహాయపడటానికి ఉద్దేశించిన ఇమెయిల్‌లో “ఉపశమనాలు” ను కూడా వివరించాడు, వీటిలో లిబ్జెన్ నుండి డేటాను తొలగించడం “పైరేటెడ్/దొంగిలించబడినదిగా స్పష్టంగా గుర్తించబడింది” మరియు వినియోగాన్ని బహిరంగంగా పేర్కొనడం లేదు. “శిక్షణ ఇవ్వడానికి ఉపయోగించే లిబ్జెన్ డేటాసెట్ల వాడకాన్ని మేము వెల్లడించము” అని theekanath చెప్పినట్లు.

ఆచరణలో, ఈ ఉపశమనాలు “దొంగిలించబడినవి” లేదా “పైరేటెడ్,” వంటి పదాల కోసం లిబ్జెన్ ఫైళ్ళ ద్వారా దువ్వెనను కలిగి ఉన్నాయి దాఖలు ప్రకారం.

A పని చాట్కంబదూర్ పేర్కొన్నారు ఆ మెటా యొక్క AI బృందం “ఐపి రిస్కీ ప్రాంప్ట్‌లను నివారించడానికి” మోడళ్లను కూడా ట్యూన్ చేసింది- అనగా, ‘హ్యారీ పాటర్ అండ్ ది సోర్సెరర్స్ స్టోన్’ యొక్క మొదటి మూడు పేజీలను పునరుత్పత్తి చేయడానికి నిరాకరించడానికి మోడళ్లను కాన్ఫిగర్ చేసింది. మీకు శిక్షణ పొందిన పుస్తకాలు. ”

ఫైలింగ్స్ ఇతర ద్యోతకాలను కలిగి ఉంటాయి, ఆ మెటాను సూచిస్తుంది రెడ్డిట్ డేటాను స్క్రాప్ చేసి ఉండవచ్చు కొన్ని రకాల మోడల్ శిక్షణ కోసం, బహుశా మూడవ పార్టీ అనువర్తనం యొక్క ప్రవర్తనను అనుకరించడం ద్వారా పుష్ షిఫ్ట్. ముఖ్యంగా, రెడ్డిట్ అన్నారు ఏప్రిల్ 2023 లో మోడల్ శిక్షణ కోసం డేటాను యాక్సెస్ చేయడానికి AI కంపెనీలను వసూలు చేయడం ప్రారంభించాలని యోచిస్తోంది.

ఇన్ మార్చి 2024 నాటి ఒక చాట్. తగినంత శిక్షణ డేటా.

మెటా యొక్క మొదటి-పార్టీ శిక్షణా డేటాసెట్‌లు-ఫేస్‌బుక్ మరియు ఇన్‌స్టాగ్రామ్ పోస్ట్‌లు, మెటా ప్లాట్‌ఫామ్‌లపై వీడియోల నుండి లిప్యంతరీకరించబడిన వచనం మరియు కొన్ని అని నాయక్ సూచించారు వ్యాపారం కోసం మెటా సందేశాలు – సరిపోలేదు. “(W) మరియు మరింత డేటా అవసరం” అని ఆమె రాసింది.

2023 లో కాలిఫోర్నియాలోని ఉత్తర జిల్లా, శాన్ఫ్రాన్సిస్కో డివిజన్ కోసం యుఎస్ జిల్లా కోర్టులో ఈ కేసు దాఖలు చేసినప్పటి నుండి కాడ్రీ వి. మెటాలోని వాది వారి ఫిర్యాదును చాలాసార్లు సవరించారు. తాజా ఆరోపణలు మెటా, ఇతర వాదనలతో పాటు, క్రాస్-రిఫరెన్స్డ్ లైసెన్స్ కోసం కాపీరైట్ చేసిన పుస్తకాలతో కొన్ని పైరేటెడ్ పుస్తకాలు ప్రచురణకర్తతో లైసెన్సింగ్ ఒప్పందాన్ని కొనసాగించడం అర్ధమేనా అని నిర్ధారించడానికి లైసెన్స్ కోసం అందుబాటులో ఉంది.

అధిక మెటా చట్టపరమైన వాటాను ఎలా భావిస్తుందనే సంకేతంలో, సంస్థ, సంస్థ జోడించబడింది ఈ కేసుపై న్యాయ సంస్థ పాల్ వీస్ నుండి ఇద్దరు సుప్రీంకోర్టు లిటిగేటర్లు దాని రక్షణ బృందానికి.

వ్యాఖ్య కోసం చేసిన అభ్యర్థనకు మెటా వెంటనే స్పందించలేదు.



Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here