Yapay Zekanın Yol Haritası
Ticari yapay zeka (AI) servisleri artık karşımıza sıkça çıkmaya başladılar. Artık AI işlerinizi yürütmek için de önceden eğitilmiş makine öğrenim kümelerini çağırabilirsiniz.
Bir API kullanarak, yüzler, logolar veya servis şartları ihlallerinin saniyeler içinde görüntülenmesi için Google Cloud Vision veya Amazon Rekognition’a bir resim kütüphanesini yükleyebilir ve resim başına cüzi paralar ödeyebilirsiniz. Artık herhangi bir işletme, Google Photos ve Amazon Prime Photos tarafından kullanılan teknolojiyi, akıllı telefon snap’lerini otomatik olarak kategorilere ayırıp, bunların içindeki insanlar, nesneler ve işaretler temelinde dağıtabilir. Emlak şirketleri, muhtemel ev alıcılarına onları memnun edecek evleri aramalarına izin vermek için görüntü tanımayı kullanıyorlar. Kia gibi otomobil şirketleri, insanların sosyal medyada yayınladıkları fotoğraflara dayanan pazarlama kampanyalarını özelleştirmek için AI’ı kullanıyor. Şehirler, trafik modellerini anlamak ve altyapı projeleri hakkında daha iyi kararlar almak için teknolojiyi kullanabilirler. Bunlar gibi örnekleri çoğaltmak mümkün. Tüm bunlar harika, devrimci ve ölçeklenebilir görünüyor, ancak diğer metalaştırılmış teknolojilerde olduğu gibi, hazır olan, her şeye tek boyutlu yaklaşım tüm şirketler veya iş hedefleri için işe yaramamaktadır, bu da şu soruyu gündeme getirmektedir: AI ihtiyaçlarınız için, ticari bir bulut AI servisini mi seçersiniz yoksa daha kapsamlı bir özel çözümü mü tercih edersiniz? AI, kurumlar için giderek daha kritik hale geldikçe, üç temel seçenek ortaya çıktı:
1. Amazon AI (Rekognition’ı içeriyor), Clarifai, CloudSight, Google Cloud Vision, IBM Watson veya Microsoft Cognitive Services gibi ticari bir AI-aaS servisinin kullanımı. Bunlar, doğal dil işlemenin (NLP) yanı sıra, metin ve görüntü tanıma için çoğunlukla API’lar yoluyla izin verilen, nispeten dar bir AI fonksiyonları yelpazesi sunuyorlar.
2. Daha geniş ve daha özelleştirilmiş bir dizi dikey AI servisinde uzmanlaşmış üçüncü parti uygulamacı AI şirketlerinin kullanımı. Bu, bazen verilerini bulutta paylaşmak istemeyen veya finans, sağlık hizmetleri, pazarlama veya perakende gibi belirli bir sektöre odaklanan şirketler için kendi içlerinde bir çözümü içerir.
3. Kendi uzmanlarınızı ve verilerinizi kullanarak eksiksiz bir makine öğrenme sistemini sıfırdan oluşturma. Bu, en karmaşık seçeneklerden biridir ve öncelikle AI’ın, çekirdek değerleri ve gelirleri için temel oluşturduğu kuruluşlar içindir.
Bu seçeneklerin her biri, belirli türde kurumsal kullanıcılar için anlamlıdır. Tam olarak hangisinin sizin için en iyi seçenek olduğu ise, aşağıdaki soruları nasıl yanıtladığınıza bağlıdır.
1. Ne tür AI işlerinin yapılmasına ihtiyacınız var?
AI, tahmini analitik, öngörme, süreç optimizasyonu, kişiselleştirme ve diğerleri gibi geniş bir iş durumları yelpazesinde yardımcı olur. Ancak, IBM Watson, bazı ek analitik ve dil işleme araçları sunarken, birçok ticari AIaaS üreticisi, makine öğrenimi ile en yaygın şekilde ilişkilendirilen görevlere odaklanmışlar:
metin ve görüntü tanıma. Bunlar, AI çevresinde dönmeyen ana işlevlere sahip kuruluşlar için belirli, dar görevler için kullanıma hazır çözümler olarak hizmet vermektedir – diyelim ki, yüz tanıma yoluyla bir fotoğrafa karşı resim veritabanlarını hızlı bir şekilde taramak isteyen bir yerel kanun uygulayıcı makama veya sakıncalı içerik için yorum bölümlerini (veya görüntüleri) denetlemek isteyen içerik sitelerine servis verebilirler. Açıkça tanımlanmış görevlere veya muazzam miktardaki verilere (tescilli veya başka bir şekilde) ek olarak, başka herhangi bir veya daha fazla karmaşık AI gereksiniminiz varsa, uygulamacı bir AI iş ortağı ile etkileşimde bulunmak veya kendi dahili tam istifli AI kurulumunuza başlamak isteyeceksiniz.
2. Ne kadarlık bir hacime çıkabilirsiniz?
Görüntü ve metin tanıma hizmetleri giderek ticarileşmektedir ve bazen de düşük hacimlerde ücretsizdir. Fakat bunları büyük ölçekte yapıyorsanız, maliyetler katlanarak büyüyebilir. Küçük bir fotoğraf paylaşım servisi çalıştırdığınızı ve sakıncalı içerik içermediğinden emin olmak için ayda 10.000 adet görüntü taramanız ve analiz etmeniz gerektiğini varsayalım. Amazon Rekognition’da bu 10 dolara mal olacak; Google Cloud Vision sizden $13,50 ücret alacaktır, ancak bunlar aynı zamanda etiket tespitini de içerirler (yani, resmin bir kedinin, bir bisikletin, bir simitin, vb. resmi olup olmadığının belirlenmesini de). Etiket tespiti, örneğin, belirli tipte kabinleri veya tezgahı olan mutfakları işaretlemek isteyen emlakçılar veya farklı cilt bozukluklarını belirlemek isteyen doktorlar için de yararlı olacaktır. Ancak, kullanıcılarının günde 14 milyon resmi yükledikleri Pinterest ölçeğinde çalışıyorsanız, güvenli görüntü aramasının ekonomisi önemli ölçüde değişecektir. Büyük hacimli görüntüler için sunulan daha düşük fiyatlı tekliflerde bile, bu büyüklükteki bir hizmet günde Google Cloud Vision ile $16.500, yani yılda $5,1 milyonun üzerinde bir maliyete sahip olacaktır. Amazon’un kullanımı günde $10,600’ü ve yılda da $2.3 milyon doları bulacaktır.
Tabii ki, AI’den sağlamasını istediğiniz bilginin ne kadar olduğuna bağlı olarak maliyeti de artar. En büyük indirimde Google Cloud Vision, metni bulmak için resim başına başka bir $0.0006’ı, artı yüzleri, logoları ve işaretleri saptamak için de aynı tutarı ekler. Bunlara etiketleme ve içerik taramasını da ekleyin, Pinterest ölçeğindeki bir servis yılda 17,6 milyon dolardan fazla harcama yapacaktır. Bu ucuz ticari bulut servisleri artık çok ucuz görünmüyorlar.
3. Sonuçlar ne kadar iyi olmak zorunda?
Ticari AI-aaS makine öğrenim modelleri çok büyük veri setlerine karşı eğitilmiş olsa da - Google’ın Metropolitan Sanat Müzesi’nden BigQuery motorunu eğitmek için 200.000 görüntüyü kullanması gibi - bu her zaman doğru sonuçlar üretecekleri anlamına gelmez. Upwork yakın zamanda, hayvanların, insanların, metinlerin ve nesnelerin resimlerini etiketlemede ne kadar doğru olduklarını değerlendirmek için önde gelen altı görüntü tanıma API’ının bir karşılaştırmasını yayınladı. Test bilimsel değildi, ancak sonuçlar büyüleyici idi. Her bir AI motorunun tahminleri, bazı resimleri ve uzaktaki yerleri hedefliyordu. Örneğin, hepsi bir caddede park edilmiş bir arabayı belirlemekte başarılı oldular, ancak bazıları iki kedi, Büyük Kanyon, bir şişe şarap ya da bir kaldırımda duran üç kişi gösterildiğinde tökezlediler. Bir yük atını süren Batılı bir göçmenin gerçekçi portresi gösterildiğinde, Google CV bunu bir resim olarak tanımlarken, Watson bunun bir “deve yarışı” olduğunu söylüyor ve Microsoft’un en iyi tahmini ise “bir kitabın üzerinde sörf yapan gerçekçüstü bir kişi” oluyordu. Uygulamalı bir AI çözümleri sağlayıcısı veya bir danışman ile (ya da kendi AI istifinizi çalıştırırken) yola devam etmenin büyük bir avantajı, makine öğrenim modellerini daha özelleştirilmiş yollarla eğitme ve sonuçların doğruluğunu artırmak için ince ayar yapma yeteneğidir. Örneğin, bir şarap önerileri uygulaması oluşturuyorsanız, bir şişeyi “şarap” veya “kırmızı” olarak etiketlemek yerine, üretici, bölge veya mahsul gibi daha ayrıntılı bilgiler vermek isteyebilirsiniz. Ya da, eğer sadece kısmi olarak gösterildiklerinde bile sosyal medya görüntülerinde bira logonuzun otomatik olarak tanınmasını (yüz ve görüntü tanıma sürecinde zor bir durum) isteyen bir bira üreticisi iseniz, o zaman uygulamalı AI veya DIY tam istifli bir çözümden faydalanabilirsiniz.
4. Ne kadar bir esnekliğe ihtiyacınız var?
Ticari AI-aaS, uygulamalı bir AI veya kurum içinde geliştirilen tam istifli bir çözümden çok daha az kontrol ve esneklik sağlar. Örneğin, Amazon Rekognition binlerce görüntü etiketi sunar, ancak bunlar her zaman işinizin gereksinimlerini karşılamaz. Amazon, örneğin “mutfak” veya “lavabo” etiketini kullanabilir, ancak mutlaka “Kohl musluğu” veya “karo panosu” olarak adlandıramaz. Yeni etiketler eklemek veya Amazon’un görüntüleri potansiyel olarak sakıncalı içerikleri işaretleme şeklini değiştirmek için, istekte bulunmanız gerekir. Amazon, yeni türdeki yumuşatılmış içerikleri eklemek için altı ila sekiz haftaya ihtiyaç duyuyor ve tüm istekleri karşılamaya da söz vermiyor. bGoogle Cloud Vision, herhangi bir zamanda API aracılığıyla sağlayabileceğiniz resimlerin boyutuna ve sayısına her zaman sınırlar getirir ve tüm servisler kabul edebilecekleri dosya türlerini
ve tanıyabilecekleri veri türlerini sınırlarlar. Amazon, örneğin sadece PNG ve JPEG dosyalarını kabul eder. Burada bahsedilen altı AI-aaS üreticisinden sadece üç tanesi, görüntü tanıma ile birlikte optik karakter tanıma (OCR) da sunmaktadır; Sadece Clarifai, videoların yanı sıra fotoğrafları da kabul eder. Başka bir deyişle, tüm gayrimenkul resimleriniz RAW formatında ise, önce bunları dönüştürmeniz gerekebilir. Şarap şişelerinin resimlerindeki etiketleri okuyan bir hizmet istiyorsanız, OCR isteyeceksiniz. Herhangi bir renkteki (siyah olduğu sürece) bir Model T’ye nasıl sahip olabileceğiniz hakkındaki eski Henry Ford montaj hattı, bir hizmet olarak AI ‘ye uygulanır - seçenekleriniz sınırlı olacaktır.
5. Ne tür bir performansa ihtiyaç duyuyor sunuz?
Gecikme, hemen hemen gerçek zamanlı görüntü veya metin işlemeyi gerektiren uygulamalar için sinsi bir katildir. Clarifai, API’ının ABD içinden gönderilen tek bir resim için 200 ila 400 milisaniyede yanıt verdiğine dikkati çekiyor; daha fazla resim veya video ekleyin veya mesafeyi artırın, gecikme süresi kötüleşir. Öte yandan, CloudSight’ın, muhtemelen bazı görüntüleri elle etiketlemek için insan kitle kaynağına güvendiğinden, yanıt vermek için 6 - 12 saniye süreye ihtiyacı var. Tüm bulut servislerinde olduğu gibi, güvenilirlik de bir sorun; metin veya görüntü işleme yeteneğiniz tamamen üçüncü taraf sunucuların kullanılabilirliğine bağlıdır. Nadir AWS veya Google kesintisi nedeniyle zorluk çeken herkes bunun ne kadar sinir bozucu olabileceğini söyleyebilir. Bir uzamış kesinti bile çok fazladır. Yerinde bir AI istifine sahip olmak, gecikme sorununu büyük ölçüde ortadan kaldıracak ve kullanılabilirlik konusunda size daha fazla kontrol sağlayacaktır.
6. Kurum içinde ne kadar uzmanlığınız var?
AI mühendisleri büyük talep görüyor. Pek çok kuruluşun elinde gerekli yetenekler yok ve bu yeteneklerin işe alınması, AI alanına agresif bir şekilde yatırım yapan ve yenilikler yapan Google, Microsoft, Facebook ve Amazon gibi şirketler ile yarışmak demek. En iyi AI mühendislerini işe almak için gereken kaynaklara sahip olsanız bile, belirli işlerinizde uzmanlığa sahip olanları bulmakta sorun yaşarsınız. Yalnızca AI’ı işinize katmayı deniyorsanız veya müşterilere servis olarak temel düşük hacimli AI fonksiyonlarını sunmak istiyorsanız, bulut tabanlı servisler işe başlamak için iyi bir yol olabilir. Ancak, daha fazla ölçek, daha fazla esneklik, alan uzmanlığı, veri gizliliği veya bir ticari bulut servisinin sunmadığı servislere ihtiyacınız varsa ve tam bir AI ekibini şirket içinde oluşturmak ve elemanları işe almak için gereken istek ve kaynaklara sahip değilseniz, daha sonra üçüncü taraf bir uygulamalı AI sağlayıcısı bulmak muhtemelen daha iyi bir yol olacaktır.
Yükselmek bir iş ve teknolojik zorunluluk olsa da, AI sizin temel değeriniz ise, kendi tam AI istifinizi oluşturmak, uzun vadede kuruluşunuz için önemli ölçüde avantaj sağlayabilir. Ancak herkes için bir AI-aaS çözümü veya uygulamalı AI iş ortağı ile birlikte çalışmak çok önemlidir.
Harvard Business Review tarafından belirtildiği gibi, AI, buhar motoru, elektrik ve internet ile eşit bir dönüşümsel teknoloji olmaya hazırlanıyor. O trenin önünde gitmeyen kuruluşlar, tükenme tehlikesiyle karşı karşıya kalacaklardır.