Akıllı Telefonlarımızın IQ’su Artık Daha mı Yüksek ?

Teknolojiye Farklı Bir Bakış

Son dönem yazılarımda sıklıkla bahsetmeye çalıştığım bir konu var: bildiğimiz anlamda akıllı telefon tasarım konspeti artık yolun sonuna geldi ve yenilik sunma konusunda ciddi manada kısır döngüye girdi. Nispeten daha kısa sürelerde aritmetik bir oranda gelişen teknolojileri (işlemci, ekran, ekran koruma camı..vs) her sene yeni modellere entegre ederek tüketicilerin ilgisi çekilmeye çalışılıyor.

 

Telefonlarımızda kısır döngüye giren bir başka bileşen de kameralar. Teknolojinin bizi getirdiği nokta ile, ilk kameralı telefon arasındaki farka baktığımızda aradaki fark muazzam. Amma velakin son yıllarda, bir önceki model bir telefon ile sonraki modeli kıyasladığınızda aralarında fark görmek neredeyse imkansız. Peki her yeni modelde kamera konusunda da gelişme olduğuna tüketicileri ikna etmek isteyen üreticiler ne yapacak ?

 

Bu konuda üreticilerin çok büyük bir bölümü Sony firmasına bağlı. Kullandıkları kamera sensörü Sony imzalı. Telefon boyutlarından dolayı kullanılabilecek sensör büyüklüğü sınırlı. Bir başka alternatif lens kalitesini arttırmak. Bu da kamera bölgesinde ciddi bir çıkıntıya neden olduğu için makul seviyede tutulmaya çalışılıyor.

 

                                                            

 

Telefonlarının fotoğraf çekim kalitesi dillere destan olan Nokia N8 ve 1020 modellerindeki lens çıkıntıları durumu anlatmaya yetiyor.

 

Son dönemde ise üst seviye modellerde standart hale gelen, hatta olmadığı zaman isyan ettiğimiz optik görüntü sabitleyiciler başka bir donanımsal geliştirme olarak karşımıza çıktı.

 

 

Şekilde de gördüğünüz gibi (her ne kadar DSLR makineler için olsa da) lens katmanına eklenen yeni katmanlar anlamına geliyor OIS. Bu da gerçekten son zamanlarda “kamera çıkıntısı” diye dillendirilmeye başlanan bir tasarım değişikliğine neden oluyor.

 

Tek kamera ile yapılabilecek her şey yapıldıktan sonra ikinci kamera ilave edilerek yeni görüntü çekim opsiyonları ilave edildi. O da yetmemeye başlayınca 3 kamera, derken yok mu arttıran sorusuna, ihaleyi kazanmak için en uçuk teklifi veren alıcı misali 16 lense sahip telefonu da gördük.

 

Telefon kameraları için fotoğraf çekim kalitesinde donanımsal sınıra ulaşılmış durumda. Geriye yazılımsal düzenlemeler kalıyor.

 

Buna en bariz örnek olarak arka planı bulanıklaştırıp özneyi ön plana çıkaran fotoğraf modlarını verebiliriz. Bunun da havası sönmeye başlayınca son pazarlama hamlesi yapay zeka geldi. Peki gerçekten yapay zeka işlemleri yapabilecek ilave donanımlar mı geliyor telefonlarla birlikte ? Akıllı telefonlarımız artık zeki telefon mu oldu?

 

İşte tam da bu noktada yazının yazılma amacından bahsetme zamanı geldi. Yazı, geçmişten günümüze telefon kameraları yazısı olmayacak. Üreticilerin ne yaptıklarını bilemez halde sürekli yenilik üretme zorunluluğuna giden yapay zeka kavramının çarpıtılarak tüketicilerin kandırılmaya çalışılması konusuna dikkat çekmek.

 

Kameralarına yapay zeka (artificial intelligence – AI) lafını pelesenk eden firmalardan LG ve Huawei’nin tanıtımlarına baktığımızda:

 

 

 

Fotoğrafını çektiğimiz nesneyi tanıyıp, o nesneler için önceden tanımlanmış hazır ayarları uygulanarak fotoğraf çekimi vaat ediyorlar. Peki işin kandırmaca kısmı vaatlerinin gerçek olmaması mı? Hayır. Portre çekimi yapılacağı zaman arka planın bulanık hele getirilip kişinin yüzünün ön plana çıkarılması, bu esnada yüzdeki kusurları belli etmeyecek kadar detayların gizlenmesi daha güzel bir fotoğraf karesi elde etmemiz anlamına gelecektir. Ya da doğa fotoğrafı çekilirken ışık koşullarına göre detayların mümkün olduğunca korunması…

 

İşin kandırmaca olan kısmı, tüm bunların yapay zeka işlemcisi eklenerek telefonun bu özelliği kazanması şeklinde insanlara lanse edilmesi. Evet Huawei, Apple gibi firmalar işlemcilerine nueral engine (sinirsel makine diye çevirmek saçma olacak beyindeki nöronların çalışma mantığını taklit eden işlemci birimi diyelim) dedikleri yapıları entegre ettiler. Bu birimlerin amacınım yapay zeka uygulamaları ve makine öğrenimi ile ilgili işlemleri gerçekleştirmek olduğu söylendi.

 

Peki gerçekte telefon kamerasını doğrulttuğunuz nesnenin ne olduğunun tanımlanabilmesi, bir yapay zeka mıdır?

 

Dilerseniz önce yapay zeka kavramını irdelemek ile işe başlayalım. Uluslararası toplumda kabul görmüş enternasyonel ansiklopedi wikipedia’nın yapay zeka tanımı:

 

 

“Yapay zeka (AI), yer yer makine zekası olarak da tanımlanır, insanlar ve hayvanlarda görülen doğal zekanın aksine makinelerde görülen zekadır. Bilgisayar biliminde AI araştırması ise çevresini algılayıp hedeflerini başarılı bir şekilde gerçekleştirme ihtimalini azamiye çıkartmak için aksiyon alan tüm cihazlar olan akıllı faktörler ile ilgili çalışmadır. Halk dilinde ise yapay zeka kavramı, insanların diğer insanların düşünceleri ile elde ettiği öğrenme ve problem çözme gibi bilişsel işlevlerin taklit edilmesi durumunda kullanılmaktadır. “

 

Bu tanım oldukça kitabî ve teknik olsa da kısaca şöyle özetleyebiliriz: yapay zeka makinenin çevresini algılayıp bunun sonucunda edindiği bilgilerle kendisine verilen görevi, mümkün olan en doğru şekilde gerçekleştirmek için kullanmasıdır.
Gerçek hayatta da durum bundan çok farklı değil aslında. Bir insanı “Zeki” tanımladığımızda, onun söylenen şeyleri çok çabuk kavradığını (kolay öğrenme) bu bilgiler ile fikir üretme konusunda başarılı olduğunu söylemiş oluruz.

 

Yapay zekanın insanların yerine kendi kendine insanların faydasına (fayda kısmı tartışmalı) karar verebilmesi gerektiğini söyleyenler de var. Benim görüşüm, makinenin kendi kendine öğrenebilme yeteneği kazanabilmesi en önemli unsur. İş, öğrenebilme ile sınırlı kalmıyor. Eni sonu o makinenin bize öğrendikleri ile ilgili bir çıktı, hatta işime yarar bir çıktı vermesi gerekir ki makinelere öğrenme yetisi kazandırmanın bir anlamı olsun.

 

Makine ve insan öğreniminin ayrıldığı noktalardan birisi de burada karşımıza çıkıyor. Konuyu; Sokrates’in “insan doğuştan bilgilerle gelir zamanla bu bilgiler ortaya çıkar” tezine karşılık John Locke’un “Tabula Rasa (Boş Levha)” tartışması gibi felsefi konulara getirmeyeceğim. Günümüz insanı, yani bizler, işimize yarayacak olsun/olmasın çok fazla bilgi öğreniyoruz. Yaşamımızın ileriki safhalarında bu bilgilerin bir kısmını kullanarak hayatımızı idame ettiriyoruz. Örnek vermek gerekirse okuma-yazma ve 4 işlem gibi çok temel bilgiler dışında iklimler, bitkiler, bakteriler, şiirdeki aruz vezni gibi bilgilerle mezun olduktan sonra reklam ajansında metin yazarı işe başlıyoruz ve buradaki çalışma hayatımızda bize yarayacak bilgileri/tecrübeyi o andan itibaren edinmeye başlıyoruz.

 

Makine öğreniminde ise hep bir amaç söz konusu. Yani o cihazdan bizim için yapmasını istediğimiz işlem için gerekli bilgileri toplamasını istiyoruz. Örnek vermek gerekirse: amacı telefonun kullanım hızını arttırmak olan bir üretici telefonun yazılımına, kullanıcının en sık kullandığı yazılımları ve bunu hangi sıklıkta kullandığını ölçen bir kod dizisi ekler. Bunun sonucunda o yazılımlar tamamen kapatılmak yerine arka plana atılır, kullanıcı bunlara erişmek istediğinde daha çabuk erişim sağlar.

 

İşin esası bu süreç ilkel insanların öğrenme süreciyle çok benzer. (Tarihin yalancısyım bu konuda) Amacı hayatta kalmak olan bir kişi beslenmek zorundadır. Bunun için besin elde etmesi gerekir ve bunu elde etmek için bitkileri toplayıp onları yer. Bu bitkileri yiyen kişinin öldüğünü gören bir başkası aynı bitkiye yemez. Etrafındaki hayvanı öldürür. Onun etini yiyemez ve ateşle pişirmeyi dener… şeklinde çok fazla döngüden bahsedilebilir.

 

Cem Yılmaz gibi duayen bir komedyenin başarısının sırrını da bu şekilde açıklayabiliriz:
Türk halkı neye güler ? —> Cinsellik ve kendi gündelik yaşantısı ile ilgili anlatılanlar
Halkın gündelik yaşantısı nasıl öğrenilir? —> Gözlem yaparak.
Gözlem yapmak için ne yapmak gerekir? —> Halkın arasına karışmak.

 

Şeklinde kabaca özetlenebilir bu süreç.
Bir bilgisayardan komedyen yaratıp halkın karşısına çıkaracak olsak, yazılacak programın algoritması bu şekilde olur.

 

İşte yapay zeka ile bilgisayar programlanın farkı da burada ortaya çıkıyor. Bilgisayara belli koşullar altında belirli esprileri yapmasını söylemek programlama, yukarıda saydığımız süreçleri bilgisayarların kendi kendine yapabilmesini sağlayacak bir programlama sonunda bilgisayarın espri yapabilir hale gelmesi ise yapay zeka olarak söylenebilir.

 

Peki dijital fotoğrafçılığın temeli olan görüntü işleme nedir. Buradaki  tanıma bakacak olursak:

 

Görüntü işleme: Dijital ortama aktarılmış görseller üzerinden ilgili ihtiyaca göre faydalı bilgiler elde etmek için farklı tekniklerle özdeşleştirebilen bir yöntemdir. Görüntü işleme yöntemi, kaydedilmiş olan belirli görüntülerin işlenip mevcut resim ve grafiklerin değiştirilerek yabancılaştırılması veya iyileştirilmesi için kullanılmaktadır.

 

Bu iki tanımı yan yana koyduğumuzda kamerasını doğrulttuğumuz telefonun, nesnenin kedi mi elma mı olduğunu söylemesi yapay zeka mıdır, yoksa başarılı bir görüntü işleme midir. Sanırım çoğumuz görüntü işleme olduğu konusunda hemfikiriz. Bakıldığında görüntü işlemenin geçmişi bir hayli eski ve bu ve benzeri uygulama örneklerini gündelik hayatımızda fazlasıyla görüyoruz. Başımızın belası trafik radarları öyle noktalara geldiler ki, aynı anda 4 şeritteki aracın plakasını okuyup araç sınıfını belirleyebiliyor. Pek çok yerde güvenlik için parmak izi tarama sektör standardı oldu. Çekilen fotoğrafların önümüze görüntü olarak gelmesi zaten başlı başına bir görüntü işleme süreci. Bu örnekleri çoğaltmak mümkün. Hatta bunlara ilave olarak Google’ın translate servisine entegre ettiği telefon kamerası tarafından görünen yazıların anlık çevirisinin yapılmasını sağlayan “Word Lens” özelliğini söyleyebiliriz. Dikkat ettiyseniz sayfada yapay zeka ile ilgili bir ibare yok. (Bu aşamada; Google’ın çeviri hizmetinde her geçen gün yapay zekanın daha fazla yer aldığını ama bu bahsettiğimiz hizmetin ise görüntüdeki metinlerin algılanıp dijital olarak metne dönüştürülmesi kısmı olduğunu açıklığa kavuşturmakta yarar var. ) Yani kameraların gördüklerini algılayıp bize bununla ilgili geri dönüş sağlamalarının geçmişi eskiye dayanıyor.

 

 

Gelelim bizim akıllı telefon üreticilerinin iddialarına: Sayın üreticiler, telefonlarına entegre ettikleri özel bir birim ile yapay zeka desteği sayesinde fotoğrafı çekilen nesnenin ne olduğunu anlayıp bize ona göre çekim modu ayarlayacaklar ve bunun sonucunda daha güzel fotoğraflar çekebileceğiz. Kısaca,

 

if(kamerada gördüğün kedi)
{
     bıyık detaylarını öne çıkar;
     arka planı bulanıklaştır;
}

 

şeklindeki bir çalışma algoritmasına yapay zeka deniyor.

 

Fotoğrafçılık ile ilgili uygulamalarda yüz tanıma öteden beri aşina olduğumuz bir teknoloji. Burada örneklerini görebileceğiniz üzere, çekilen bir fotoğrafta insan yüzü olduğunu anlayıp ona göre bazı özel ayarlamaların yapılması şeklinde seçeneklere sahip kameraları gördük.

 

2011 yılında Apple Mac işletim sistemindeki iPhoto uygulamasına yüz tanımayı entegre etti. Olayın özü albümdeki fotoğrafları tarayıp içlerinden yüzleri çıkarmak, daha sonra kullanıcının o yüzlere girdiği insan isimlerini diğer fotoğraflarda da eşleştirmek.

 

 

Sorum şu? İnsan yüzlerine öteden beri uygulanan bu sistemin kedi, köpek, elma, armut gibi nesnelere uygulanıyor olması yapay zeka mıdır? Eğer öyleyse akıllı telefonlarımız çok önceden beri yapay zekiydi ve neden şimdi bu durum yeni bir şeymiş gibi pazarlanıyor.

 

Görünen o ki firmalar tarafından pazarlama yanıltmacasına maruz bırakılmaya çalışılıyoruz. Resmini çektiğimiz nesnelerin ne olduğunu dışarıdan birisinin girmesi ile birlikte daha sonra aynı nesneye denk geldiğinde onun ne olduğunu anlayıp çekim şartlarını ona göre düzenlemesi halinde buna yapay zeka diyebilirdik. Yapay zeka ile makine öğrenimi kavramlarının birlikte, hatta birbirinin yerine kullanılıyor olması da bu yüzden. İşin içinde bir öğrenme süreci olmalı. Aksi halde üçgen kulakları, bıyıkları olan görüntü olsa olsa kedi resmidir denince ortaya böyle görüntüler de çıkabiliyor.

 

                                  

 

Keza kameraların otomatik modları da yapay zekadan ziyade önceden programlanmış bilgilerin hangi şartta hangisinin kullanılacağı şeklinde bir karar verme mekanizmasından ibaret. Böyle bir durumda makinelerin, farklı koşullar altında çektiği fotoğrafların insanlar tarafından değerlendirilmesi sonrasında kendi içinde güzel fotoğraf tanımını oluşturduktan sonra başka hiç bir ayara gerek kalmadan bizim için fotoğraf çekmesi bir yapay zeka örneği olurdu. Aksi halde insan zekasının programlama diline aktarımı oluyor.

 

Google’ın ülkemizde son kullanıcıya yönelik ürün satışı yapmıyor oluşundan dolayı görme şansımız henüz olmasa da Geçen yıllarda  Clips adlı bir ürün tanıttılar.

 

 

Bu minik aksiyon kamerası kılıklı cihazın amacı, yakalamaya değer bir anı tespit edip bizim için kaydetmek. Böyle bir dertten muzdarip olan kişi sayısı ne kadardır bilemiyorum ama teknolojinin bir diğer hedefi de ihtiyacımız olan cihazlara ihtiyacımız varmış gibi hissettirmek değil mi. Bu cihazdan bahsetme nedenimiz incelemesini yapmak değil. Clips, yukarıda bahsettiğimiz firmaların sözde yapay zeka özde programlama olan çalışma felsefesini gerçekten uygulayan bir cihaz. Kayıt süresince küçük küçük klipler çekip bunlar arasından güzel olanları seçiyor. İncelemesindebu özelliğin çok başarılı olmadığı söylense de çalışma mantığı bizler için önemli. The Verge incelemesinin şu satırlarına göz atalım.

 

 

Denildiğine göre Clips’i özel yapan içindekiler: bilindik yüzleri ve “ilginç” aktiviteleri tanıyabilmek için Google’ın insan tanıma algoritmalarını çalıştırıyor ve sonra otomatik olarak önem verme ihtimaliniz olan anları yakalıyor. Fakat Clips ses yada video kaydetmiyor, teknik olarak bir grup seri fotograf çekiyor ve bunları 7 saniyelik bir klibe ekliyor. 

 

Clips uygulamasında yakalama sıklığını ayarlayabilirsiniz ve ayrıca Google Fotoğraflar hesabınıza bağlayarak sizin için önemli olan kişiler ile “eğitebilirsiniz”. Clip kamerasının, en sık maruz kalan kişileri önemli kişiler olarak yüzlerini öğrenmesi bekleniyor fakat Google’ın dediğine göre Fotoğraf (uygulamasının) verilerinin bu süreci hızlandırmakta.

 

Görüldüğü gibi “yapay zeka” kavramının hakkını veren bir cihaz. Yapması gereken işi çok iyi yapıyordur/yapmıyordur, bu kısmı hiç önemli değil. İşin içinde bir öğrenme süreci var bunun sonucunda ortaya çıkan çıktılar değişebiliyor.

 

Yapay zeka ile programlamanın farkı tam olarak burada ortaya çıkıyor: önceden hazırlanmış bir programda; bir süre boyunca aynı verileri girdi olarak verdiğinizde size çıktı olarak aynı çıktıları verecektir. İşin içinde yapay zeka varsa öğrenmeye bağlı olarak bir süre sonra aynı çıktıları alamamaya başlarsınız.

 

Son olarak Apple ve Huawei gibi, telefonlarına yapay zeka ünitesi eklemelerine kısaca değinelim. Bu da afili kandırmacalarından birisi. Söyle düşünün, çalıştığınız işyerinde başka bir departmanın da sorumluluğunu üstlenmeniz isteniyor. Bu iş için kendiniz kafa yorup süreçleri öğrendikten sonra atacağınız adımlar sayesinde o departmanın başarısının artması ile yanınıza bu konularda çok yetenekli bir çalışan verildikten sonra birlikte aldığınız kararlar sonunda o departmanın başarısının artması arasında bir fark var mı?

 

Tek başına yapmanız ile başka birisiyle çalışmanız arasında, sizin diğer işlere vakit ayırıp oradaki performansınızı düşürmemek gibi avantajlarından bahsederiz sadece.

 

Nitekim bu işler için ayrı bir birim kullanılmaya başlanması sizin telefonunuzun performansına ve pil ömrüne olumlu yansıyacaktır. İstenildiği takdirde bu özelliklerden mahrum kalmayacaktı telefonlar.

 

Yazıyı toparlamak gerekirse: Yapay zeka, telefonlara sanki daha önceden var olmamış bir özelliğin yeni yeni cihazlara getirilmesi şeklinde sıkça lanse edilmeye başlandı. İşin özü yapılan birkaç programlama hilesinden ibaret. Siz siz olun, (en azından günümüz için) yapay zeka desteği ile daha iyi fotoğraf çekeceğinizi düşünerek telefon almayın.

 

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir