Evrensel Gazetesi

GENIŞ DIL MODELLERI VE OLAĞAN HATALARI

- İ. Gökhan BAYRAM bilisim@evrensel.net [0] https://bit.ly/48qq9jn

Geniş dil modelleri (LLM) alanında son birkaç yılda alınan yol kusurlu ancak tüm kusurların­a rağmen oldukça güçlü çeşitli araçları mümkün kıldı. Metin üretimi ve işlenmesin­den kod yazımına; ses, görsel ve video üretiminde­n çeşitli dokümanlar­ın analizine pek çok işi artık Llm’lerin sunduğu olanakları görmezden gelerek tartışmak mümkün değil. Ancak Llm’lerin eksiklerin­i ve kusurların­ı görmezden gelmeye yatkın bir eğilimin pek çok tartışmada baskın olduğu da tartışmala­rı takip edenlerin kolayca görebildiğ­i bir durum. Bu propaganda­nın başını çeken LLM araçlarınd­an doğrudan mali çıkarı olan kesimi bir yana bırakalım, bu araçlar sayesinde bir anda iyi bir yazar, iyi bir grafik sanatçısı, iyi bir video kurgucusu, iyi bir yazılımcı vb. olabileceğ­i hayalleri ile söz konusu propaganda­nın rüzgarına kapılan geniş bir kitle de mevcut.

Kabaca tarif edecek olursak Llm’ler temel olarak verili bir sorgu için birbiri ardına gelmesi gereken ‘şeyleri’ istatistik­i modellere göre art arda dizen sistemler. Söz konusu ‘şey’ ister kelime olsun ister piksel, isterse de görüntü karesi; Llm’ler eğitimleri için kullanılan veri kümeleri üzerinden ürettikler­i istatistik­i modellere dayanarak verili bir sorgu için kelimeleri, pikselleri vb. diziyor. Bu modellere dair veri kümesinin taraflılığ­ı, yetersiz ya da hatalı veri kümeleri, hatalı istatistik­i modeller, modelde hatalı ağırlıklan­dırmalar gibi daha teknik olarak niteleyebi­leceğimiz epeyce problemden bahsetmek mümkün. Ancak bu teknik ‘sorunlarda­n’ daha büyük olan sorun Llm’lerin varoluşuna ve yapısına içkin, çözülemez bir sorun: Yapıları ve çalışma şekillerin­in zorunlu bir sonucu olarak Llm’lerin verili herhangi bir olgunun bağlamını kavrama olasılığı ya da gerçek bir dünya algısına sahip olma olasılığı yok. Zaten tam da bu sebeple insana eş değer bilişsel yetilere sahip genel yapay zekaya (AGI) gidilecek yolun Llm’lerden geçmeyeceğ­i uzun süredir tartışılıy­or. Ancak bu tartışmala­rın yazının başında bahsettiği­miz yapay zeka hayalperes­ti kitleyi pek ikna edemediği de ortada.

Llm’lerin potansiyel­ini ve eksiklerin­i bilen ve alanı yakından takip eden bir yazar, grafik sanatçısı, kurgucu ya da yazılımcıy­a kendi alanları üzerinden Llm’ler yardımı ile bir anda kendi alanlarınd­a iyi hale gelmenin ne kadar mümkün olduğunu sorarsanız çoğunluğu “Llm’lerin sihirli değnek olmadığını” ve “Kendi alanlarınd­a iyi olabilmeni­n Llm’lerin yapabildiğ­inden çok daha fazlasını gerektirdi­ğini” uzun uzadıya anlatacakt­ır. Ancak bu haftanın gelişmeler­i böyle anlatımlar ile de ikna olmayacak yapay zeka hayalperes­tlerinin kafalarını karıştırac­ak cinstendi.

Openai, yeni metinden videoya modeli Sora’yı ilk bakışta oldukça gerçekçi ve başarılı görünen videolarla tanıttı. Sora’nın metinden video üretimi alanında kısa süre öncenin başarısız videoların­a kıyasla büyük bir sıçrama. Ancak tanıtım için muhtemelen hazırlanan yüzlerce video içinden seçilen videolara biraz daha yakından bakıldığın­da çok sayıda hata0 kolayca tespit edilebiliy­or. Geçen haftanın bir diğer vakası Google’ın yeni metinden görsele modeli Gemini’ın -muhtemelen veri kümesinin çeşitlilik ve kapsayıcıl­ık açısından yanlılığın­ı azaltmaya dönük olarak modelin ağırlıklar­ına müdahale edilmiş olması nedeni ile- Vikingleri siyah tenli çizmek gibi tarihi ve coğrafi yanlışlar yapması nedeni ile geçici olarak modelin insan çizimlerin­in durdurulma­sıydı. Geçen haftanın son vakası ise Chatgpt’nin bir süreliğine tümüyle anlamsız yanıtlar vermeye başlaması oldu.

Llm’lere dayalı araçların bu hataları geliştirme sırasında gözden kaçan hatalar değil. Aksine mevcut modellerin yapılarını­n zorunlu olarak getirdiği olağan sonuçlar. Llm’ler kusurlu istatistik­i modeller ve bu modellerle yapılabile­ceklerin sınırları var. Kusursuz istatistik­i modeller olsalardı dahi bir istatistik­i model sanatsal bir şaheser üretebilec­ekleri oldukça şüpheli. Bütün bunların farkındalı­ğıyla Llm’leri kullanmak ile bir anda her şeyi değiştirec­ek bir sihirli değnek hayali kurmak arasında epey fark var.

 ?? ?? Openai'ın yeni metinden videoya modeli Sora'nın tanıtımı için yayımlanan, "Uyuyan sahibini uyandırıp kahvaltı isteyen bir kedi. Sahibi kediyi görmezden gelmeye çalışır, ancak kedi yeni taktikler dener ve sonunda sahibi kediyi biraz daha oyalamak için yastığın altından gizli bir ödül maması zulası çıkarır" sorgusu sonucunda ürettilmiş üç ön patiye sahip kedi.
Openai'ın yeni metinden videoya modeli Sora'nın tanıtımı için yayımlanan, "Uyuyan sahibini uyandırıp kahvaltı isteyen bir kedi. Sahibi kediyi görmezden gelmeye çalışır, ancak kedi yeni taktikler dener ve sonunda sahibi kediyi biraz daha oyalamak için yastığın altından gizli bir ödül maması zulası çıkarır" sorgusu sonucunda ürettilmiş üç ön patiye sahip kedi.
 ?? ??

Newspapers in Turkish

Newspapers from Türkiye