గత నెల, యుఎస్ ఆర్థిక మార్కెట్లు పడిపోయాయి డీప్సెక్ అని పిలువబడే ఒక చైనీస్ ప్రారంభం తరువాత ప్రపంచంలోని అత్యంత శక్తివంతమైన కృత్రిమ మేధస్సు వ్యవస్థలలో ఒకదాన్ని నిర్మించారు ఉపయోగించడం చాలా మంది నిపుణుల కంటే చాలా తక్కువ కంప్యూటర్ చిప్స్ సాధ్యం.

AI కంపెనీలు సాధారణంగా 16,000 ప్రత్యేక చిప్స్ లేదా అంతకంటే ఎక్కువతో నిండిన సూపర్ కంప్యూటర్లను ఉపయోగించి తమ చాట్‌బాట్‌లకు శిక్షణ ఇస్తాయి. కానీ డీప్సీక్ దీనికి సుమారు 2,000 మాత్రమే అవసరమని చెప్పారు.

డీప్సీక్ ఇంజనీర్లు a రీసెర్చ్ పేపర్ క్రిస్మస్ తరువాత ప్రచురించబడిన, ప్రారంభం దాని వ్యవస్థను నిర్మించే ఖర్చును గణనీయంగా తగ్గించడానికి అనేక సాంకేతిక ఉపాయాలను ఉపయోగించింది. దాని ఇంజనీర్లకు ముడి కంప్యూటింగ్ శక్తిలో సుమారు million 6 మిలియన్లు మాత్రమే అవసరం, మెటా తన తాజా AI సాంకేతిక పరిజ్ఞానాన్ని నిర్మించడానికి ఖర్చు చేసిన దానిలో పదోవంతు.

డీప్సీక్ సరిగ్గా ఏమి చేసాడు? ఇక్కడ ఒక గైడ్ ఉంది.

ప్రముఖ AI టెక్నాలజీస్ శాస్త్రవేత్తలు పిలిచే దానిపై ఆధారపడి ఉంటాయి నాడీ నెట్‌వర్క్‌లుఅపారమైన డేటాను విశ్లేషించడం ద్వారా వారి నైపుణ్యాలను నేర్చుకునే గణిత వ్యవస్థలు.

అత్యంత శక్తివంతమైన వ్యవస్థలు నెలలు గడుపుతాయి ఇంటర్నెట్‌లోని అన్ని ఆంగ్ల వచనాన్ని విశ్లేషించడం అలాగే చాలా చిత్రాలు, శబ్దాలు మరియు ఇతర మల్టీమీడియా. దీనికి అపారమైన కంప్యూటింగ్ శక్తి అవసరం.

సుమారు 15 సంవత్సరాల క్రితం, గ్రాఫిక్స్ ప్రాసెసింగ్ యూనిట్లు లేదా GPU లు అని పిలువబడే ప్రత్యేక కంప్యూటర్ చిప్స్ ఈ రకమైన డేటా విశ్లేషణ చేయడానికి సమర్థవంతమైన మార్గం అని AI పరిశోధకులు గ్రహించారు. సిలికాన్ వ్యాలీ చిప్‌మేకర్ ఎన్విడియా వంటి సంస్థలు మొదట కంప్యూటర్ వీడియో గేమ్‌ల కోసం గ్రాఫిక్‌లను అందించడానికి ఈ చిప్‌లను రూపొందించాయి. కానీ GPUS నాడీ నెట్‌వర్క్‌లను నడిపించే గణితాన్ని నడపడానికి ఒక నేర్పును కలిగి ఉంది.

కంపెనీలు తమ కంప్యూటర్ డేటా సెంటర్లలో ఎక్కువ GPU లను ప్యాక్ చేస్తున్నప్పుడు, వారి AI వ్యవస్థలు మరింత డేటాను విశ్లేషించగలవు.

కానీ ఉత్తమమైన GPU ల ధర సుమారు, 000 40,000, మరియు వారికి భారీ మొత్తంలో విద్యుత్ అవసరం. చిప్‌ల మధ్య డేటాను పంపడం చిప్‌లను నడపడం కంటే ఎక్కువ విద్యుత్ శక్తిని ఉపయోగించవచ్చు.

ఇది చాలా పనులు చేసింది. ముఖ్యంగా, ఇది “నిపుణుల మిశ్రమం” అనే పద్ధతిని స్వీకరించింది.

కంపెనీలు సాధారణంగా ఒకే న్యూరల్ నెట్‌వర్క్‌ను సృష్టించాయి, ఇవి ఇంటర్నెట్‌లోని అన్ని డేటాలోని అన్ని నమూనాలను నేర్చుకుంటాయి. ఇది ఖరీదైనది, ఎందుకంటే GPU చిప్‌ల మధ్య ప్రయాణించడానికి అపారమైన డేటా అవసరం.

ఒక చిప్ ఒక కవితను ఎలా రాయాలో నేర్చుకుంటే, మరొకటి కంప్యూటర్ ప్రోగ్రామ్‌ను ఎలా రాయాలో నేర్చుకుంటే, వారు ఇంకా ఒకరితో ఒకరు మాట్లాడటం అవసరం, ఒకవేళ కవిత్వం మరియు ప్రోగ్రామింగ్ మధ్య కొంత అతివ్యాప్తి ఉంటే.

నిపుణుల పద్ధతి మిశ్రమంతో, పరిశోధకులు వ్యవస్థను అనేక నాడీ నెట్‌వర్క్‌లుగా విభజించడం ద్వారా ఈ సమస్యను పరిష్కరించడానికి ప్రయత్నించారు: కవిత్వం కోసం ఒకటి, కంప్యూటర్ ప్రోగ్రామింగ్ కోసం ఒకటి, జీవశాస్త్రం కోసం ఒకటి, భౌతిక శాస్త్రానికి ఒకటి మరియు మొదలైనవి. ఈ చిన్న “నిపుణుల” వ్యవస్థలు 100 ఉండవచ్చు. ప్రతి నిపుణుడు దాని ప్రత్యేక రంగంపై దృష్టి పెట్టవచ్చు.

చాలా కంపెనీలు ఈ పద్ధతిలో కష్టపడ్డాయి, కాని డీప్సీక్ దీన్ని బాగా చేయగలిగింది. ఆ చిన్న “నిపుణుల” వ్యవస్థలను “జనరలిస్ట్” వ్యవస్థతో జత చేయడం దీని ఉపాయం.

నిపుణులు ఇంకా ఒకదానితో ఒకటి కొంత సమాచారాన్ని వర్తకం చేయాల్సిన అవసరం ఉంది, మరియు సాధారణవాది – ప్రతి సబ్జెక్టుపై మంచి కానీ వివరణాత్మక అవగాహన లేనిది – నిపుణుల మధ్య పరస్పర చర్యలను సమన్వయం చేయడంలో సహాయపడుతుంది.

ఇది స్పెషలిస్ట్ రిపోర్టర్లతో నిండిన న్యూస్‌రూమ్‌ను ఎడిటర్ పర్యవేక్షించడం వంటిది.

చాలా ఎక్కువ. కానీ డీప్సీక్ చేసిన ఏకైక పని అది కాదు. అతని లేదా ఆమె ప్రాథమిక పాఠశాల గణిత తరగతిని గుర్తుంచుకునే ఎవరైనా అర్థం చేసుకోగలిగే దశాంశాలతో కూడిన సాధారణ ఉపాయాన్ని కూడా ఇది స్వాధీనం చేసుకుంది.

మీ గణిత ఉపాధ్యాయుడు PI యొక్క భావనను వివరిస్తూ గుర్తుంచుకోండి. పై, π అని కూడా సూచించబడుతుంది, ఇది ఎప్పటికీ ముగుస్తుంది: 3.14159265358979…

వృత్తం యొక్క చుట్టుకొలతను నిర్ణయించడం వంటి ఉపయోగకరమైన లెక్కలు చేయడానికి మీరు ఉపయోగించవచ్చు. మీరు ఆ లెక్కలు చేసినప్పుడు, మీరు కొన్ని దశాంశాలకు తగ్గిస్తారు: 3.14. మీరు ఈ సరళమైన సంఖ్యను ఉపయోగిస్తే, మీరు సర్కిల్ యొక్క చుట్టుకొలత యొక్క మంచి అంచనాను పొందుతారు.

డీప్సీక్ ఇలాంటిదే చేసాడు – కాని చాలా పెద్ద ఎత్తున – దాని AI సాంకేతిక పరిజ్ఞానాన్ని శిక్షణ ఇవ్వడంలో.

వచనంలో నమూనాలను గుర్తించడానికి న్యూరల్ నెట్‌వర్క్‌ను అనుమతించే గణితం నిజంగా గుణకారం మాత్రమే – చాలా మరియు మా మరియు చాలా గుణకారం. మేము వేలాది కంప్యూటర్ చిప్‌లలో నెలల గుణకారం మాట్లాడుతున్నాము.

సాధారణంగా, చిప్స్ 16 బిట్స్ మెమరీకి సరిపోయే సంఖ్యలను గుణించాలి. కానీ డీప్సీక్ ప్రతి సంఖ్యను 8 బిట్స్ మెమరీకి మాత్రమే పిండుకుంది – సగం స్థలం. సారాంశంలో, ఇది ప్రతి సంఖ్య నుండి అనేక దశాంశాలను కోల్పోయింది.

దీని అర్థం ప్రతి గణన తక్కువ ఖచ్చితమైనది. కానీ అది పట్టింపు లేదు. లెక్కలు నిజంగా శక్తివంతమైన న్యూరల్ నెట్‌వర్క్‌ను ఉత్పత్తి చేసేంత ఖచ్చితమైనవి.

బాగా, వారు మరొక ఉపాయాన్ని జోడించారు.

ప్రతి సంఖ్యను 8 బిట్స్ మెమరీగా పిండిన తరువాత, ఆ సంఖ్యలను కలిసి గుణించేటప్పుడు డీప్సీక్ వేరే మార్గాన్ని తీసుకున్నాడు. ప్రతి గుణకారం సమస్యకు సమాధానాన్ని నిర్ణయించేటప్పుడు – న్యూరల్ నెట్‌వర్క్ ఎలా పనిచేస్తుందో నిర్ణయించడంలో సహాయపడే కీలక గణనను చేయడం – ఇది 32 బిట్స్ మెమరీ అంతటా సమాధానంను విస్తరించింది. మరో మాటలో చెప్పాలంటే, ఇది మరెన్నో దశాంశాలను ఉంచింది. ఇది సమాధానం మరింత ఖచ్చితమైనది.

బాగా, లేదు. డీప్సీక్ ఇంజనీర్లు తమ పేపర్‌లో చాలా క్లిష్టమైన కంప్యూటర్ కోడ్‌ను రాయడంలో చాలా మంచివారని చూపించారు, ఇది GPUS కి ఏమి చేయాలో చెబుతుంది. ఈ చిప్స్ నుండి మరింత సామర్థ్యాన్ని ఎలా పిండేయాలో వారికి తెలుసు.

కొద్దిమందికి ఆ రకమైన నైపుణ్యం ఉంది. కానీ తీవ్రమైన AI ల్యాబ్‌లు ప్రతిభావంతులైన ఇంజనీర్లను డీప్సీక్ చేసిన వాటికి సరిపోయేలా ఉన్నాయి.

కొన్ని AI ల్యాబ్‌లు ఇప్పటికే కనీసం కొన్ని ఉపాయాలను ఉపయోగిస్తాయి. ఓపెనాయ్ వంటి కంపెనీలు మూసివేసిన తలుపుల వెనుక వారు ఏమి చేస్తున్నారో ఎల్లప్పుడూ వెల్లడించవు.

కానీ ఇతరులు డీప్సీక్ పని చూసి స్పష్టంగా ఆశ్చర్యపోయారు. స్టార్ట్-అప్ చేయడం సులభం కాదు. ఇలాంటి పురోగతిని కనుగొనడానికి అవసరమైన ప్రయోగం విద్యుత్ శక్తిలో మిలియన్ల డాలర్లు – బిలియన్లు కాకపోయినా – ఉంటుంది.

మరో మాటలో చెప్పాలంటే, దీనికి అపారమైన ప్రమాదం అవసరం.

“క్రొత్త విషయాలను ప్రయత్నించడానికి మీరు చాలా డబ్బును లైన్‌లో ఉంచాలి – మరియు తరచుగా, అవి విఫలమవుతాయి” అని సీటెల్‌లోని అలెన్ ఇన్స్టిట్యూట్ ఫర్ ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ పరిశోధకుడు టిమ్ డెటెమర్స్ అన్నారు, సమర్థవంతమైన AI వ్యవస్థలను నిర్మించడంలో నైపుణ్యం కలిగి ఉన్నారు మరియు గతంలో పనిచేశారు మెటాలో AI పరిశోధకుడు.

“అందుకే మేము చాలా ఆవిష్కరణలను చూడలేము: పని చేయనిదాన్ని ప్రయత్నించడానికి ప్రజలు చాలా మిలియన్ల మందిని కోల్పోతారని భయపడతారు,” అన్నారాయన.

చాలా మంది పండితులు డీప్సీక్ యొక్క million 6 మిలియన్లు సిస్టమ్ యొక్క తుది సంస్కరణకు శిక్షణ ఇచ్చేటప్పుడు ప్రారంభమైన వాటిని మాత్రమే కవర్ చేశారని అభిప్రాయపడ్డారు. వారి కాగితంలో, డీప్సీక్ ఇంజనీర్లు తుది శిక్షణ పరుగుకు ముందు పరిశోధన మరియు ప్రయోగాలపై అదనపు నిధులు ఖర్చు చేశారని చెప్పారు. కానీ ఏదైనా అత్యాధునిక AI ప్రాజెక్ట్ విషయంలో కూడా ఇది వర్తిస్తుంది.

డీప్సీక్ ప్రయోగాలు చేసింది మరియు అది చెల్లించింది. ఇప్పుడు, చైనీస్ స్టార్ట్-అప్ తన పద్ధతులను ఇతర AI పరిశోధకులతో పంచుకున్నందున, దాని సాంకేతిక ఉపాయాలు AI ని నిర్మించే ఖర్చును గణనీయంగా తగ్గించడానికి సిద్ధంగా ఉన్నాయి



Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here