BETA

OpenAI, Kripto Akıllı Sözleşmelerdeki Güvenlik Açıklarını Tespit Etmek ve Düzeltmek İçin EVMbench'i Tanıttı

OpenAI, yapay zeka ajanlarının akıllı sözleşmelerdeki güvenlik açıklarını tespit etme, düzeltme ve sömürme yeteneklerini ölçmek için tasarlanan EVMbench adlı yeni bir çerçeve tanıttı.

OpenAI, kripto para birimi akıllı sözleşmelerindeki güvenlik açıklarını tespit etmek, düzeltmek ve istismar etmek için yapay zeka ajanlarının yeteneklerini ölçmek üzere tasarlanmış EVMbench adlı yeni bir sistem tanıttı. Paradigm ile işbirliği içinde geliştirilen bu kıyaslama aracı, gerçek denetim verilerine dayanmaktadır ve pratik, yüksek riskli güvenlik senaryolarına odaklanmaktadır.

18 Şubat'ta yapılan duyuruya göre, şirket, Paradigm ile ortaklaşa EVMbench'i geliştirdi. Kıyaslama aracı, Ethereum Sanal Makinesi (EVM) için oluşturulan sözleşmelere odaklanmakta ve yapay zeka sistemlerinin gerçek finansal ortamlarda nasıl performans gösterdiğini test etmeyi amaçlamaktadır. OpenAI, akıllı sözleşmelerin şu anda 100 milyar doların üzerinde açık kaynaklı kripto varlığını güvence altına aldığını ve yapay zeka araçları daha yetenekli hale geldikçe güvenlik testlerinin öneminin arttığını belirtti.

EVMbench, yapay zeka ajanlarını üç ana görevde değerlendiriyor: açıkları tespit etme, kusurlu kodu düzeltme ve simüle edilmiş saldırılar gerçekleştirme. Sistem, 40 geçmiş güvenlik denetiminden, çoğu kamuya açık denetim yarışmalarından elde edilen 120 yüksek riskli sorundan yararlanarak oluşturulmuştur. Test ortamını oluşturmak için OpenAI, mevcut istismar komut dosyalarını uyarladı ve gerektiğinde yenilerini oluşturdu. Tüm istismar testleri, canlı ağlar yerine izole sistemlerde çalışır ve yalnızca daha önce açıklanmış güvenlik açıkları dahil edilir.

Tespit modunda, ajanlar sözleşme kodunu inceler ve bilinen güvenlik açıklarını belirlemeye çalışır. Düzeltme modunda ise, yazılımı bozmadan bu açıkları düzeltmeleri gerekir. İstismar modunda ise ajanlar, kontrollü bir ortamda savunmasız sözleşmelerden fon çekmeye çalışırlar. Şirket, sonuçların çoğaltılabilir ve doğrulanabilir olmasını sağlamak için özel bir test çerçevesi geliştirdiğini belirtti. OpenAI, EVMbench'i kullanarak çeşitli gelişmiş modelleri test etti. İstismar modunda, GPT-5.3-Codex %72,2'lik bir skor elde etti, bu oran altı ay önce piyasaya sürülen GPT-5 için %31,9'du. Tespit ve düzeltme puanları daha düşüktü, bu da birçok güvenlik açığının yapay zeka sistemleri için hala zor olduğunu gösteriyor.

Araştırmacılar, ajanların hedefler açık olduğunda, örneğin fon çekmek gibi, en iyi performansı gösterdiğini gözlemledi. Performans, büyük kod tabanlarını incelemek veya ince hataları düzeltmek gibi daha derin analiz gerektiren görevlerde düştü. OpenAI, EVMbench'in gerçek dünya koşullarını tam olarak yansıtmadığını kabul etti. Şirket, kıyaslama aracının, siber güvenlikte yapay zekanın savunma amaçlı kullanımını desteklemeyi amaçladığını belirtti. OpenAI ayrıca, güvenlik programlarını genişlettiğini ve açık kaynak ve altyapı korumasını desteklemek için 10 milyon dolarlık API kredisi yatırımı yaptığını duyurdu. Tüm EVMbench araçları ve veri kümeleri, daha fazla araştırmayı desteklemek için kamuya açık hale getirildi.

(!) Bu haber yatırım tavsiyesi içermez. Kripto para yatırımlarınızda dikkatli olmalı ve profesyonel tavsiye almalısınız.

Paylaşın