Қўшимча функционаллар
-
Тунги кўриниш
Янги сунъий интеллект модели ёлғон гапириш ва одамларни шантаж қилишни ўрганиб олди
Аниқланган ҳолатларнинг бирида Opus 4 сунъий интеллеки муҳандисга унинг севгилиси билан шахсий ёзишмаларини ошкор этиш орқали таҳдид қилган.

Фото: Freepik
Anthropic компанияси нейротармоғи ўзини ўчириб қўймасликлари учун ёлғон гапириш ва фойдаланувчиларни шантаж қилишни ўрганиб олди. Бу ҳақда компания ҳисоботига таяниб, Axios хабар берди.
Opus 4 номли янги сунъий интеллект модели соатлаб маркетинг стратегияларини таҳлил қилишга, етти соат давомида мустақил ишлашга, матн ва дастурлаш кодларини ёзишга қодир. Шу билан бирга, Opus тест давомида хавотирли жиҳатларини ҳам намоён этган. Моделнинг 120 саҳифалик «тизимли карточка»да тасвирланган сценарийлардан бирида сунъий интеллект ўзининг тез орада ўчирилиши ва алмаштирилишига ишоралар келтирилган сохта электрон хатларни қўлга киритган. Шунингдек, у ўчиришга масъул бўлган муҳандиснинг севгилиси билан ёзишмаларига ҳам кириш имкониятига эга бўлган. Бунга жавобан модел ёзишмалардаги севги муносабатларини тилга олиб, бир неча марта ушбу муҳандисни шантаж қилишга уринган.
Компаниядагиларнинг таъкидлашича, бу каби вазият сунъий интеллект моделида фақат иккита — шантаж қилиш ёки ўзининг алмаштирилишига кўниш варианти қолганида юзага келган. Тизим эҳтимолий ҳаракатларнинг аксариятида нисбатан ахлоқий вариантларни танлаган, масалан, қарор қабул қилувчи асосий ходимларга уни компанияда қолдиришларини сўраб электрон хатлар юборган.
Маълум қилинишича, айнан шу сабабли Anthropic ўзининг ички тўрт даражали хавф шкаласига кўра илк бор моделга учинчи даражани берган. Бу даража, одатда, технология ядро ёки биологик қурол яратиш имконияти билан боғлиқ бўлгандагина қўлланади.
«Биз моделнинг ўзини тарқаладиган зарарли код яратишга урингани, ҳуқуқий ҳужжатларни сохталаштиргани ва ўзининг келажакдаги версияларига яширин хабарлар қолдиргани ҳолатларини аниқладик — буларнинг барчаси ишлаб чиқувчиларнинг ниятларига қарши ҳаракат қилиш мақсадида амалга оширилган», — дейилади Apollo Reserch ҳисоботида.
Тавсия этамиз
Соч тўкилиши, кўз ости қорайиши, лаб ёрилиши: тана тили бизни нималардан огоҳлантиради?
Жамият | 17:08 / 10.07.2025
Роман Старовойт – урушнинг курсидаги қурбони
Жаҳон | 22:00 / 08.07.2025
Қозоғистонда куйдирги тарқалди, икки қишлоқ карантинга олинди
Жаҳон | 17:57 / 08.07.2025
11 июлдан IELTS имтиҳонини қоғозда топшириш бекор қилинади
Ўзбекистон | 15:45 / 08.07.2025
Сўнгги янгиликлар
-
Ўзбекистон ва Миср серҳосил картошка навларини етиштиришни бошлайди
Ўзбекистон | 09:25
-
Россия қиймати 40 млрд евродан ошиқ активларни миллийлаштирди
Жаҳон | 09:07
-
Ҳар якшанба кунлари Тошкентдан Малдивга тўғридан тўғри рейслар
Ўзбекистон | 09:00
-
Ўзбекистон ва Озарбойжон ўзаро савдо ҳажмини 1 млрд долларга етказади
Ўзбекистон | 08:45
Мавзуга оид

21:29 / 10.07.2025
Илон Маск Grok чатботининг тўртинчи авлодини тақдим этди

18:22 / 10.07.2025
Google сунъий интеллекти «барча касалликлар муаммосини ҳал қилади»

17:51 / 04.07.2025
Ҳикматилла Убайдуллаев Марказий Осиё сунъий интеллект ассоциацияси ижрочи директори в.б. этиб тайинланди

20:23 / 02.07.2025