Inteligjenca artificiale është “mezi e mjaftueshme” për punë, sipas një studimi
MIT testoi 41 modele gjuhësore në 11,000 detyra pune. Përfundimi? Inteligjenca artificiale funksionon po aq mirë sa një praktikant i frustruar.
Javën e kaluar, MIT publikoi rezultatet paraprake nga një studim në të cilin 41 modele gjuhësore – duke përfshirë versionet e Claude, Gemini dhe ChatGPT – u testuan në më shumë se 11,000 detyra pune kryesisht të bazuara në tekst, të grupuara sipas profesionit nga Regjistri i Punës i SHBA-së. Rezultatet u vlerësuan nga njerëz me përvojë në botën reale në ato profesione. Qëllimi ishte të përcaktohej se sa shpesh IA mund të prodhonte një rezultat që një mbikëqyrës do ta pranonte pa ndërhyrje njerëzore.
Përgjigja: rreth 65% të rasteve, nota kaluese është “minimalisht e mirë”, që do të ishte dy në arsimin maqedonas. Në një shkallë nga 1 deri në 9, një rezultat prej 7 përcaktohet si punë që është e përdorshme ashtu siç është, pa nevojë për korrigjime. Dy të tretat e kohës, pra, IA kalon atë prag, gjë që tingëllon solide, të paktën derisa të shohim se çfarë ndodh kur pragu rritet. Kur një modeli i kërkohet të performojë “në mënyrë superiore” – një rezultat prej 9 – probabiliteti i suksesit nuk e kalon kurrë 50%, pavarësisht se sa kohë ka në dispozicion modeli. Me fjalë të tjera, kur detyra kërkon më shumë hapa, kreativitet ose saktësi, IA dështon më shpesh sesa ka sukses.
Studiuesit e përshkruan rezultatin në një formulim që meriton të vendoset në kornizë dhe të varet në murin e çdo CEO-je që po mendon të zvogëlojë personelin: Performanca e modeleve aktualisht të disponueshme është e krahasueshme me atë të një “praktikanti të zhgënjyer” – që përmbush minimumin e kërkuar, por që përpiqet të prodhojë punë cilësore që do të ishte e përdorshme pa ndërhyrje shtesë.
Nëse kjo duket në kundërshtim me atë që kemi dëgjuar prej vitesh, nuk jeni vetëm. Historia që po na tregohet, jo vetëm nga modeluesit e IA-së, por edhe nga konsulencat, mediat e biznesit dhe Silicon Valley në përgjithësi, është një histori progresi eksponencial, modelesh që do të jenë mjaftueshëm të mira për të zëvendësuar departamente të tëra “vitin tjetër”. Të dhënat e MIT sugjerojnë diçka thelbësisht të ndryshme: progresi po ndodh, por është gradual dhe, më e rëndësishmja, ekziston një kufi që ende nuk dimë si ta thyejmë.
Le të marrim disa shembuj nga bota reale, sepse nuk ka mungesë të tyre. Vitin e kaluar, Deloitte prodhoi dy raporte mbi klientët qeveritarë në Australi dhe Kanada, të cilat u përmbytën me trillime. CNET dhe Sports Illustrated u kapën duke botuar artikuj të gjeneruar nga IA plot me gabime faktike nën emrat e autorëve fiktivë. Një firmë avokatie amerikane kërkoi falje publikisht pasi u zbulua se referenca ligjore të gjeneruara nga IA që nuk ekzistonin ishin përdorur në një kërkesë falimentimi. Në të gjitha këto raste, dikush vendosi që IA ishte “mjaftueshëm e mirë” – dhe ata gaboheshin.
Është veçanërisht interesante të shqyrtohet se ku modelet e IA-së performojnë më mirë dhe më keq. Të dhënat e MIT tregojnë se normat mesatare të suksesit janë më të ulëta për rolet e kualifikuara në sektorët ligjorë dhe të IT-së, ndërsa modelet performojnë më mirë në detyrat e bazuara në tekst në ndërtim dhe mirëmbajtje. Siç pritej, sa më komplekse të jetë puna dhe sa më serioze të jenë pasojat e një gabimi të mundshëm, aq më pak e besueshme është IA.
Kompanitë, logjikisht, së pari po automatizojnë atë që mund të bëjë IA – detyra të thjeshta dhe pozicione fillestare – ndërsa punët komplekse, ato ku kursimet do të ishin më të mëdha, mbeten të paarritshme për momentin. Rezultati është një treg pune në të cilin dy faktorë thelbësorë po zhduken: hapi i parë në një karrierë dhe rutina që ua mësoi njerëzve zanatin. Në të njëjtën kohë, ekspertët e shtrenjtë vazhdojnë të mos kenë zëvendësim. Kur pas pesë vitesh do të ketë mungesë ekspertësh të rinj sepse askush nuk i ka kaluar pozicionet dikur të ulëta, rrethi do të mbyllet në mënyrën më të keqe të mundshme.
Studiuesit e MIT vlerësojnë se deri në vitin 2029, shumica e modeleve do të jenë në gjendje të kryejnë 80% deri në 95% të detyrave të bazuara në tekst në një nivel “minimalisht të përshtatshëm”. Rreth dy sekonda tingëllojnë mbresëlënëse, derisa të mendojmë për konceptin e “minimalisht të përshtatshëm”, i cili është një standard që shumica prej nesh nuk do ta pranojnë kur bëhet fjalë për punën tonë. Tonën, por edhe atë të të tjerëve. A do të “shtrinit në një shtrat” me një mjek që bën minimumin e domosdoshëm? Apo me një avokat që është i trajnuar për të trajtuar rastin tuaj? “Minimalisht i përshtatshëm” është, sipas përkufizimit, niveli më i ulët i pranueshëm; për çdo gjë mbi këtë, sipas MIT, inteligjenca artificiale aktualisht nuk ka përgjigje.
Së fundmi, është pyetja që bëjnë studiuesit e MIT-it, por nuk japin përgjigje: A do të jetë ndonjëherë në gjendje IA të arrijë një performancë të shkëlqyer ose të përsosur? Kjo është e vetmja gjë që ka rëndësi në këtë histori. Askush nuk e kundërshton që IA mund të kryejë shumë detyra rutinë. Por kur na shesin rrëfimin e IA-së që transformon tregun e punës, ata nuk përmendin mjetin që përmbush minimumin absolut të pranueshëm në dy të tretat e kohës. Ata na paraqesin një vizion në të cilin IA e bën punën më mirë se një njeri.
Rezulton se shumica prej nesh kanë përvoja të ngjashme duke punuar me IA-në: e dobishme për versionin e parë, e nevojshme për përshpejtimin e detyrave të përsëritura, por e paaftë për të prodhuar asgjë që klienti do ta miratonte pa kaluar me kujdes nëpër gjithçka që IA ka analizuar. Në një farë mënyre, është me të vërtetë një rast i praktikantit të zhgënjyer, përveçse praktikanti përfundon duke u bërë koleg, ndërsa IA ende nuk e ka provuar veten në këtë drejtim./denar.mk.








