
GDPval je nova evaluacija kojom OpenAI meri sposobnost veštačke inteligencije da preuzme ljudske poslove, navodi se u najnovijoj analizi kompanije Sema Altmana. Iako su rezultati izazvali veliko interesovanje, brojni stručnjaci i dalje izražavaju sumnju u mogućnost potpune automatizacije, posebno imajući u vidu sklonost četbotova, poput ChatGPT-a, halucinacijama i netačnim informacijama.
Nova metoda procene: GDPval
Prema objašnjenju OpenAI-a, GDPval (Generalized Deployment Productivity Evaluation) predstavlja sistem koji omogućava kvantitativno merenje toga koje poslove veštačka inteligencija već sada može da obavlja na nivou industrijskih standarda. Cilj je, kako ističe kompanija, da se razgovor o razvoju AI tehnologije „zasnuje na dokazima, a ne na pretpostavkama“.
„Ljudi često spekulišu o ukupnom uticaju AI na društvo, ali najjasniji način da se razume njen potencijal jeste ispitivanje šta modeli već mogu da urade“, naveo je startap OpenAI u zvaničnom blog postu.
OpenAI tvrdi: ChatGPT dostiže stručni nivo
OpenAI ističe da najnoviji modeli GPT serije, uključujući GPT-5, već u mnogim slučajevima „približavaju kvalitetu rada koji proizvode stručnjaci iz industrije“. Ipak, iako direktor OpenAI-ja Sem Altman tvrdi da GPT-5 poseduje „inteligenciju na nivou doktorata“, početni testovi pokazuju da su te izjave pretenciozne i netačne.
nastavak na sledećoj stranici