Link Tree Martin I Oden

Resim
Link Tree Martin I Oden Engineering, Finance, Engine Driver  #MartinSky  Products for Sale : https://iyzi.link/AILUEw E - Mail : mertsever_03@hotmail.com YouTube Channel : https://www.youtube.com/channel/UCSUj1X5jG9yf1jCIIjeeZKA X (formerly Twitter) : https://twitter.com/martinioden LinkedIn Profile : https://www.linkedin.com/in/mertseverr/ Instagram Profile : https://instagram.com/martinioden Telegram Profile : https://t.me/martinioden/ Threads Profile : https://www.threads.net/@martinioden Rarible Profile : https://rarible.com/martinioden Mintable Profile : https://mintable.app/u/mertsever OpenSea Profile : https://opensea.io/accounts/martinioden Cent Profile : https://v.cent.co/gallery/martinioden/minted Telegram Channel : https://t.me/herseydenbiraztr Blog Address : https://martinioden.blogspot.com/ Mert S. Official Account

Yapay Zeka Saklambaç Oynamayı Öğrenirse

Bir Yapay Zeka saklambaç oynamayı öğrendi. Kendi başına ortaya koyduğu stratejiler baya şaşırtıcı.


Bu hafta, önde gelen AI lab en son projelerini yayınladı: Saklambaç Oynayabilen Yapay Zeka. Mevcut makine öğrenme teknikleriyle, çok basit bir kurulumun şok edici derecede sofistike sonuçlar üretebileceğinin en son örneği.

Yapay Zeka (AI) ajanları, oyunun çok basit bir versiyonunu oynar; burada “saklayıcılar” görüş alanı ne olursa olsun puan alırlar. “Saklayıcılar”, saklanma yeri oluşturmak ve kendilerini başarıyla sakladıklarında puan almak için başlangıçta biraz zaman alırlar; Her iki taraf da bir avantaj için nesneleri oyun alanı çevresinde hareket ettirebilir (bloklar, duvarlar ve rampalar gibi).

Bu basit kurulumdan elde edilen sonuçlar oldukça etkileyici olmakla birlikte 481 milyon saklambaç oyunu boyunca, AI stratejiler ve karşı stratejiler geliştirmiş gibi görünüyordu ve AI ajanları karmaşık stratejilerin işe yaraması için müttefikleriyle eşgüdüm içinde koşturmaya çalıştılar. (Yol boyunca, oyun fiziğini beklenmedik şekillerde kırma yeteneklerini de gösterdiler.)

Takviye öğrenme adı verilen basit bir AI tekniği ile yapılabilecek en son örnek, AI sistemlerinin istenen davranış için “ödüller” aldığı ve milyonlarca oyun boyunca ödüllerini en üst düzeye çıkarmanın en iyi yolu.

Takviye öğrenimi inanılmaz derecede basittir, ancak ürettiği stratejik davranış hiç de basit değildir. Araştırmacılar geçmişte karmaşık savaş zamanı strateji oyunları oynayabilecek AI sistemleri oluşturmak için diğer teknikler arasında takviye öğrenmeyi güçlendirdi ve bazı araştırmacılar, son derece sofistike sistemlerin sadece takviye öğrenimi ile inşa edilebileceğini düşünüyor. Bu basit saklambaç oyunu, takviye öğrenmenin eylemde nasıl çalıştığına ve basit talimatların şok edici derecede akıllı davranış ürettiğine dair harika bir örnek oluşturuyor. AI yetenekleri daha iyi ya da daha kötüsü için ilerlemeye devam ediyor.

İlk ders: Nasıl kovalanır ve gizlenir
Birkaç milyon saklambaç oyunu almış olabilir, ancak sonunda AI ajanları oyunun temellerini belirledi: Harita üzerinde birbirlerini kovalamak.


İkinci ders: Bir savunma barınağının nasıl inşa edileceği
AI ajanları blokları yerinde “kilitleme” özelliğine sahiptir. Sadece bir bloğu kilitleyen takım kilidi açabilir. Milyonlarca uygulama oyunundan sonra, AI temsilcileri mevcut bloklardan bir sığınak kurmayı öğrendi; Bunu burada yaptıklarını görebilirsiniz. Barınakta “arayıcı” ajanlar onları bulamıyor, bu nedenle “saklayıcılar” için bir kazanç en azından birileri yeni bir fikir ortaya çıkıncaya kadar.


Bir sığınağı kırmak için rampalar kullanma
Milyonlarca nesiller sonra, arayanlar bu davranışı “saklayıcılar” ile nasıl başa çıkacaklarını çözdüler: Bir rampayı sürükleyebilir, rampaya tırmanabilir ve saklayıcıları bulabilirler.


Bir süre sonra, saklayıcılar karşı saldırıyı öğrendi: rampaları yerlerinde donatabildiler, böylece arayanlar onları hareket ettiremezdi. OpenAI’nin ekibi bunun oyunun sonu olacağını düşündüklerini ancak yanlış yaptıklarını belirtiyor.

Barınakları kırmak için kutu sörfü
Sonunda, arayanlar bir kutuyu donmuş rampalara doğru itmeyi, kutuya tırmanmayı ve bir kez daha saklayıcıları bulabilecekleri barınaklara “sörf yapmayı” öğrendiler.


Kutu sörfüne karşı savunma
Buradaki saklayıcılar için bariz bir karşı-karşıtlık var: etraftaki herşeyi dondurmak, arayanların çalışacak araçları kalmaması. Gerçekten, nasıl yapacaklarını öğrendikleri şey bu.


Milyonlarca tecrübe oyununa sahip AI ajanları arasında saklambaç oyunu böyle yürüyor. Buradaki ilginç şey, sergilenen davranışların hiçbirine doğrudan öğretilmediği ve hatta doğrudan ödüllendirilmediğidir. Ajanlar sadece oyunu kazandıklarında ödüller kazanırlar. Ancak bu basit teşvik, oyun içi yaratıcı davranışları teşvik etmek için yeterliydi.

Birçok AI araştırmacı, takviye öğreniminin karmaşık görevleri gerçek dünyadaki sonuçlarla çözmek için kullanılabileceğini düşünüyor. Güçlü stratejik karar vermenin basit talimatlardan ortaya çıkması ümit vericidir.

Ancak; Takviye öğrenme ile ilgili problemlerin çözülmesi, gördüğümüz gibi, pek çok beklenmedik davranışa yol açıyor. Saklambaç oyunlarında büyüleyici, ancak kanseri tedavi etmek için bir ilaçta potansiyel olarak endişe verici (istenmeyen davranış hayatı tehdit edici komplikasyonlara neden olursa) veya santral çıktısını iyileştirmek için bir algoritma (AI, yalnızca tutarlı bir güç sağlamak yerine, hedeflerinde belli olmayan bir koşuldan yararlanmayı düzenlerse).

Bu, takviye öğrenmesi gibi tekniklerin tehlikeli bir yanıdır. Bir yandan, basit bir başlangıç noktasından gelişmiş davranışlar üretebilecek güçlü tekniklerdir. Öte yandan, beklenmedik ve bazen de istenmeyen ileri düzey davranışları basit bir başlangıç noktasından başlatabilecek güçlü tekniklerdir.

AI sistemleri daha güçlü bir şekilde büyüdükçe, istediklerimizi yapmalarını nasıl sağlayacağına dikkat etmeliyiz.

Saygılarımla. by #MS

Yorumlar

Bu blogdaki popüler yayınlar

2 Koordinat Noktası (Enlem, Boylam) Arasındaki Mesafeyi Hesaplamak

Güneş Paneli Hesaplama ve Kurulumu