Anthropic, iki yıl içinde yapay zekanın kara kutusunu açmak istiyor

Yapay Zeka Şirketi Anthropic, Yapay Zekanın “Kara Kutusu”nu Açmaya Hazırlanıyor!

Yapay zeka teknolojileri her geçen gün daha güçlü hale gelirken, bu sistemlerin nasıl çalıştığı halen tam anlamıyla çözülebilmiş değil. Anthropic CEO’su Dario Amodei, yayınladığı dikkat çekici bir makalede, bu bilinmezliğin tehlikelerine dikkat çekerek şirketinin 2027 yılına kadar yapay zeka modellerindeki sorunların büyük kısmını tespit edebilecek seviyeye ulaşmayı hedeflediğini açıkladı.

Yapay Zekanın Çalışma Mekanizmaları ve Güvenlik Riskleri!

“The Urgency of Interpretability” başlıklı makalede Amodei, mevcut yapay zeka modellerinin nasıl karar verdiğini tam olarak anlayamamanın ciddi bir güvenlik riski oluşturduğunu ifade ediyor. Amodei, “Bu sistemler ekonomi, teknoloji ve ulusal güvenlik için kesinlikle merkezi öneme sahip olacak ve o kadar fazla özerklik kapasitesine sahip olacaklar ki, insanlığın nasıl çalıştıklarından tamamen habersiz olmasının temelde kabul edilemez olduğunu düşünüyorum” sözleriyle durumu özetliyor.

Anthropic’in kurucularından Chris Olah’ın ifadesine göre yapay zeka modelleri “inşa edilmekten ziyade büyütülüyor.” Araştırmacılar zeka seviyelerini artırabiliyor olsa da, bu gelişimin ardındaki mekanizmaları henüz açıklayamıyorlar. Bu da yapay zekanın belirli kararları neden aldığı, bir kelimeyi başka bir kelimeye göre neden tercih ettiği ya da genellikle doğru olmasına rağmen neden ara sıra hata yaptığı gibi konularda ciddi bir bilgi boşluğuna işaret ediyor.

Örneğin, yakın geçmişte OpenAI, daha iyi performans gösteren, ancak aynı zamanda diğer modellerine göre daha fazla hayal gören o3 ve o4-mini adlı yeni muhakeme modellerini yayınladı. Ayrıca firma, bu modellerin neden daha fazla halüsinasyon gördüğü konusunda da bir fikirlerinin olmadığının altını çizdi.

Bu durum aslında bizi korkutmalı. Anthropic, yapay zekanın bu “kara kutusu” üzerinde çalışan, spesifik araştırmalar yapan nadide şirketlerden birisi. Çoğu AI şirketi en azından kamu önünde bu konuyu derinlemesine araştırdıklarını söylemiyor bile.

Yapay Zeka ve AGI Yolculuğunda Önemli Adımlar!

Bununla birlikte Anthropic, modellerin karar süreçlerini “devreler” üzerinden takip ederek nasıl düşündüklerine dair ilk sinyalleri almaya başladı. Ancak bu, halen küçük bir adım. Pandora’nın kutusu daha yeni açılıyor, zira bu tür devrelerden milyonlar hatta milyarlarca olabileceği düşünülüyor.

Amodei, bu modellerin nasıl çalıştığını anlamadan AGI’ye (insan seviyesinde yapay zeka, yapay genel zeka) ulaşmanın tehlikeli olabileceğini söylüyor. Ek olarak Amodei’nin uzun vadeli vizyonu ise oldukça iddialı: Yapay zeka modellerine adeta bir “beyin taraması” yapılması. Bu taramalar sayesinde modellerin dürüstlükten sapma eğilimi, güç kazanma isteği gibi tehlikeli eğilimleri önceden tespit edilebilecek. Bu tür gelişmiş analiz araçlarının geliştirilmesinin beş ila on yıl alabileceği öngörülüyor.

Anthropic’in CEO’su, makalesinde yalnızca kendi şirketine değil, sektöre de bir çağrıda bulunuyor. OpenAI ve Google DeepMind gibi devlerin yorumlanabilirlik araştırmalarına daha fazla kaynak ayırması gerektiğini vurgulayan Amodei, hükümetlere ise regülasyonlarla bu araştırmaları teşvik etme çağrısı yaptı.

Yapay zeka ve özellikle derin öğrenme konusundaki çalışmalarla günümüz yapay zekaların doğmasında büyük pay sahibi olan, bu konuda Nobel Fizik Ödülü’nü alan Geoffrey Hinton’ın kendisi de 2023’te bu ağların nasıl çalıştığını bilmediğini söylemişti. Aşağıdaki videoyu izlemenizi tavsiye ederim.

Related Posts

FC 25 Futties etkinliğine damga vuran SBC: van de Ven’e yer açın

Oyun dünyasının heyecanla beklediği “FC 25” bünyesindeki “Futties” etkinliği nihayet başladı. 11 Temmuz 2025 tarihinde başlayan bu dev etkinlik, oyunculara eşsiz bir kart zenginliği sunuyor. Etkinliğin ilk gününde 99 reytingli Kylian Mbappe ve Lamine …

Grok’tan dün geceyle ilgili ilk açıklama geldi: Kandırıldım

Dün akşam saatlerinden itibaren X’in yapay zeka aracı Grok tarafından verilen yanıtlar gündeme oturdu. Agresif ve argo ifadelerle yanıtlar veren Grok, devlet görevlilerine ve hassas değerler hakkında da ağır cümleler kullandı. Sabah saatlerinde erişim engeli talebi getirilen Grok konuyla ilgili ilk cevabını verdi: Kandırıldım

Apple görünce durduruyor! Bu özellik bazı görüşmeleri başlamadan bitirecek

iOS 26’da ilginç bir güvenlik özelliği test ediliyor: Görüntüde çıplaklık algılanırsa arama otomatik duruyor. Beta kullanıcıları yeni özelliği fark etti, Apple ise henüz sessiz.

Robotlar yaşlıların yeni dostu mu? Yapay zeka yaşlıları yalnızlıktan kurtarabilir mi?

Japonya’da Yaşlı Bakımında Robot Devrimi: Teknoloji İnsanın Yerini AlıyorJaponya, dünya genelinde en hızlı yaşlanan nüfusa sahip ülke olarak, yaşlı bakımındaki personel açığını kapatmak için yapay zeka destekli robotlara yöneldi. Japonya Sağlık …

Tesla’da kan kaybı sürüyor: Otomobil teslimatları ikinci çeyrekte yüzde 13,5 azaldı

ABD’li elektrikli araç üreticisi Tesla’nın otomobil teslimatları, bu yılın ikinci çeyreğinde, yıllık bazda yüzde 13,5 azaldı. Tesla, 2025’in ikinci çeyreğine ilişkin araç üretim ve teslimat verilerini açıkladı.

E-postada yapay zeka dönemi: Grammarly, Superhuman’ı bünyesine kattı

Grammarly’nin Salı günü duyurduğu bu satın alma, her iki şirketin de finansal detayları hakkında bilgi vermemesiyle gizemini koruyor. Superhuman, Rahul Vohra, Vivek Sodera ve Conrad Irwin tarafından kuruldu. Traxcn’in verilerine göre, şirket a16z …