Modelet e reja GPT-4.1 të AI fokusohen në programim

A15.04.2025

341 2 minutes read

Në fillim të kësaj jave, OpenAI zbuloi një gjeneratë të re të modeleve të saj të inteligjencës artificiale të quajtur GPT-4.1, e cila përfshin variante mini dhe nano. Këto modele janë veçanërisht të optimizuara për detyra që lidhen me programimin dhe ekzekutimin e udhëzimeve. Megjithëse ato nuk janë të disponueshme përmes ChatGPT, ato mund të përdoren përmes OpenAI API. Një nga karakteristikat e tyre kryesore është aftësia për të përpunuar tekstin deri në 750,000 fjalë.

Modelet e reja vijnë në një kohë kur kompanitë konkurruese si Google dhe Anthropic po bëjnë përpjekje shtesë për të zhvilluar zgjidhje të avancuara të automatizuara të kodimit. Gemini 2.5 Pro i Google dhe Soneti Claude 3.7 i Anthropic, si dhe modeli V3 i DeepSeek, kanë arritur tashmë rezultate të dukshme në testet e programimit.

Qëllimi i OpenAI dhe liderëve të tjerë të teknologjisë është të zhvillojnë modele që mund të zgjidhin në mënyrë të pavarur detyra komplekse në fushën e inxhinierisë softuerike. Lëvizja në këtë drejtim është ambicia për të krijuar një sistem të inteligjencës artificiale që mund të funksionojë si një “inxhinier-agjent softuerësh” i pavarur i aftë për të krijuar aplikacione të plota, duke përfshirë testimin, dokumentacionin dhe kontrollin e cilësisë.

OpenAI pretendon se GPT-4.1 është përmirësuar ndjeshëm falë reagimeve të përdoruesve. Fokusi ishte te mbështetja më e mirë për programimin e përparmë, reduktimi i ndryshimeve të panevojshme, ndjekja e saktë e formateve standarde dhe përdorimi më i besueshëm i mjeteve. E gjithë kjo mundëson zhvillimin e agjentëve më efikas të inteligjencës artificiale për detyra inxhinierike në botën reale.

Sipas të dhënave të brendshme të OpenAI, GPT-4.1 tejkalon modelet e mëparshme si GPT-4o dhe variacionet e tij në shumicën e testeve të zhvilluesve. Versionet mini dhe nano të modelit të ri sjellin shpejtësi më të madhe dhe konsum më të ulët të burimeve, por me pak më pak saktësi. GPT-4.1 nano është gjithashtu modeli më i përballueshëm në ofertën e tyre.

Çmimet për përdorimin e modelit varen nga sasia e përpunimit: GPT-4.1 kushton 2 dollarë për milion shenja hyrëse dhe 8 dollarë për milion argumente dalëse, ndërsa çmimet për versionet mini dhe nano janë dukshëm më të ulëta.

Në testin SWE-bench Verified, GPT-4.1 arriti rezultate midis 52% dhe 54.6%, pak më të ulëta se konkurrentët Google dhe Anthropic, modelet e të cilëve kalojnë 60%. Dallimi buron pjesërisht nga kufizimet teknike të platformës në të cilën janë kryer testet.

Përveç kësaj, modeli u testua edhe në detyrat e kuptimit të përmbajtjes së videos, ku tregoi rezultate të jashtëzakonshme – veçanërisht në kategorinë e videove të gjata pa titra.

Pavarësisht përmirësimeve të tij, GPT-4.1 ndan disa kufizime të modeleve të tjera të avancuara. Ai ende mund të bëjë gabime në detyrat që profesionistët me përvojë do t’i trajtonin lehtësisht, të tilla si zbulimi ose rregullimi i dobësive të sigurisë në kod. Gjithashtu, saktësia e tij bie gjatë përpunimit të sasive të mëdha të argumenteve – nga 84% në 8000 tokena në 50% në 1 milion argumente. OpenAI pranon se modeli mund të jetë shumë i drejtpërdrejtë, duke kërkuar shpesh pyetje shumë specifike dhe të formuluara saktësisht.