Yapay zekânın gelişimi, sorunları beraberinde getirmeye devam ediyor

Google’ın geçtiğimiz günlerde gizlilik ilkeleri ve kullanım şartlarında yaptığı değişikliklerin, yapay zekâ teknolojilerinin geliştirilmesi için internetin her yerinden veri çekebilmesini mümkün kılan maddelerden meydana gelmesi dikkat çekti. Yapay zekâ yarışında Google’a geniş kapsamlı bir avantaj sağlayacağı öngörülen bu gelişmenin internet gizliliği üzerindeki etkileri tartışma konusu oldu.

08.07.2023 20:30

Mansur Ali Bilgiç - mansuralibilgic@intell4.com

Google’ın bu ay başında güncellenen gizlilik politikaları, internetteki her veriyi yapay zekâ (YZ) uygulamalarını geliştirirken kullanacağına ilişkin ifadeler içeriyor.

İlk olarak Gizmodo’dan Thomas Germain tarafından raporlanan gelişme, kullanıcıların internete yüklediği her türlü içeriğin Google LLC’ye ait olduğu anlamını taşıyor.

Germain, bu durumu, “Eğer Google kelimelerinizi okuyabiliyorsa kelimelerinizin artık şirkete ait olduğunu ve bir chatbot’un [sohbet robotu] bağırsaklarında yuvalanmış olduğunu varsayın” diyerek açıklıyor.

Değiştirilen politika metninde, “Google, hizmetlerimizi iyileştirmek ve kullanıcılarımıza ve kamuya fayda sağlayan yeni ürünler, özellikler ve teknolojiler geliştirmek için bilgileri kullanır. Örneğin, Google'ın yapay zekâ modellerinin eğitilmesine yardımcı olmak ve Google Translate, Bard ve Cloud AI özellikleri gibi ürün ve özellikleri oluşturmak için kamuya açık bilgileri kullanıyoruz" ifadelerine yer verildiği görüldü.

Önceleri sadece “dil modelleri” olarak belirtilen ve Google Translate için kullanılan bu veri kazıcılığı yöntemi, artık Google’ın yapay zekâ modelleri olan Bard ve Cloud AI için de kullanılacak.

Germain; bu maddenin olağan dışı olduğunu, Google’ın bütün internete “kendi oyun alanı” muamelesi yapıyormuş gibi göründüğünü yazdı.

The Register’a konuşan bir Google sözcüsü, güncelleme ile temelde herhangi bir değişikliğin gerçekleşmediğini belirtti.

Sözcü, açıklamasında, “Gizlilik politikamız, Google'ın Google Translate gibi hizmetler için dil modellerini eğitmek amacıyla açık web'den kamuya açık bilgileri kullandığını uzun zamandır şeffaf bir şekilde ortaya koymaktadır. Bu son güncelleme, Bard gibi daha yeni hizmetlerin de dahil edildiğini açıklığa kavuşturuyor. Yapay Zekâ İlkelerimiz doğrultusunda, yapay zekâ teknolojilerimizin geliştirilmesine gizlilik ilkelerini ve önlemlerini dahil ediyoruz” ifadelerini kullandı.

Yapay zekâ uygulamalarının geliştirilmesi için internetin kamuya açık alanından elde edilen her türlü verinin kullanılması, özellikle yazılı ve görsel içerik üreticileri için fikrî mülkiyet ihlali sorunları oluşturuyor.

Bu şekilde elde edilen verinin bu şekilde kullanılmasının yasal olup olmadığının açık olmadığını belirten Germain, ileriki yıllarda telif hakkı ihlallerinden ötürü çok sayıda dava görülebileceğini yazdı.

ChatGPT’nin üreticisi OpenAI, şimdiden kişisel bilgilerin izinsiz kullanılması ve telif hakkı ihlali konulu davalarla karşı karşıya kalmaya başladı.

Yaşanan bu gelişmeler ışığında, Twitter ve Reddit gibi büyük oranda yazılı içerik barındıran sosyal medya siteleri, kendilerini korumak için Uygulama Programlama Arayüzlerinin (API) erişimlerine kısıtlamalar getirdi.

Geçtiğimiz günlerde Twitter’a getirilen kısıtlamaların bu veri kazıcılığını engellemek amacıyla tanıtıldığı belirtildi.

Twitter CEO'su Elon Musk, Google’ın gizlilik politikasını güncellediği 1 Temmuz’da yaptığı bir Twitter paylaşımında;

“Aşırı boyutlara ulaşan veri kazıcılığı ve sistem manipülasyonlarını engellemek amacıyla geçici olarak aşağıdaki sınırlandırmaları uyguladık:

- Doğrulanmış hesaplara günde 6000,
- Doğrulanmamış hesaplara günde 600,
- Yeni ve doğrulanmamış hesaplara ise günde 300 gönderi okuma sınırı getirildi” ifadelerini kullandı.

New York Times’ın bir haberine göre ise Reddit, YZ sistemlerinin geliştirilmesine katkıda bulunmak için finansal karşılık beklediğini aktardı.

NBC’ye konuşan Reddit CEO’su Steve Huffman, Elon Musk’ın aldığı tedbirde haklı olduğunu vurguladı. Kısa süre içinde Reddit de Twitter gibi API’sine ücretsiz erişimi kaldırdı.

YAPAY ZEKÂ VE İNTERNET GİZLİLİĞİNİN GELECEĞİ

YZ uygulamalarının doğurma potansiyeli taşıdığı etik sonuçlar; etik bilimi, felsefe, hukuk, mühendislik gibi birçok farklı daldan uzman ve bilim insanının dikkatini çekiyor.

Araştırmacılar; şirketleri, devletleri, geliştiricileri ve kullanıcıları, yapay zekânın potansiyel tehlikelerine karşı uyarıyor.

Veriler, paylaşan kullanıcıların açık rızası olmadan toplanılıyor ve kullanılıyor. Google hizmetlerini kullanabilmek için onaylanması zorunlu olan bu gizlilik politikasını kabul etmek, paylaşılan verilerin YZ uygulamalarını beslerken kullanılacağı anlamına geliyor.

Bu durum, yazılı veya görsel içerik üreticilerinin ürettiği içeriğin direkt bir izin alınmadan, yapay zekâyı geliştirmekte kullanılan veri havuzuna dahil edileceğine işaret ediyor.

Yapay zekâ uygulamalarının “intihal” olarak nitelenebilecek bu davranışı, çoğunlukla eserlerini internette paylaşan yazılı ve görsel içerik üreticilerini etkiliyor.

Popular Science’a yazan Sandra Gutierrez’in yapay zekâ uzmanı Jessica Brandt’tan aktardığına göre; kullanılan bu verilerin ne amaçla kullanıldığı, nasıl toplandığı, kamuya açık olmayan verilerin toplanması gibi gizlilik temelli şeffaflık sorunları da YZ’nin gelişiminde öne çıkıyor.

Aynı yazıda siber güvenlik uzmanı Ivana Bartoletti’den yapılan alıntıda, bu tarz veri kazıcılığı pratiklerinin, insanların kendi verileri üzerindeki kontrollerini yitirmesine sebep olduğu belirtiliyor.

Bu veriler, internet sitelerinde hesap oluşturmak için kullanılan kişisel bilgilerden sosyal medyada yapılan paylaşımlara kadar geniş bir yelpazede yer alıyor.

Gizlilik endişelerinden ötürü, Google’ın Bard AI adlı yapay zekâ programının Avrupa Birliği’nde piyasaya çıkışı ertelendi.

Bard AI, AB’nin yapay zekâya ilişkin yaptığı yasal düzenlemelere takıldı. Verilerin toplanması ve işlenmesine ilişkin şeffaflık ve güvenlik gibi kriterleri sağlayamayan Google, dünyanın geri kalanında mayıs ayında hizmete aldığı Bard’ı Avrupa’da hayata geçiremedi.

Sanal veri güvenliği meselesi hem bireysel açıdan kişileri hem de kurumsal açıdan devletleri ilgilendiriyor. Özellikle yapay zekâ programlarının geliştirilmesinde kullanılan veri girdilerinin, devletlere sorun teşkil etme potansiyeli bulunuyor.

İnternetin her yerindeki veri tabanlarına erişimi olan Google gibi monopol bir şirketin, yapay zekâ uygulamasını beslerken kullandığı veri havuzunda, “devlet sırrı” niteliğindeki gizli dökümanların bulunma olasılığı da bulunuyor.

Önemli dokümanların sızmasına yol açabilecek bu ihtimale karşı, devletlerin bu uygulamalara kısıtlama getirmesi gerekiyor.

Buna ek olarak bu kadar veriyle beslenen algoritmalar için doğru ve yanlış kavramları bulunmuyor.

Arka arkaya anlamlı bir bütün oluşturacak şekilde sıralanan kelimelerin dünyanın gerçekliğiyle uyuşmaması, yani yapay zekâ uygulamalarının yanlış bilgi üretmesi gibi problemlerle şimdiden karşılaşılmaya başlandı.