Google'ın TurboQuant Duyurusu Donanım Talebini Azaltmayacak
Google'ın TurboQuant duyurusu, donanım talebini azaltmayacak, piyasa tepkileri ise abartılı olabilir.
SETA araştırmacısı ve ETAI Direktörü Dr. Gloria Shkurti Özdemir, Google'ın "TurboQuant" duyurusunun ardından oluşan spekülasyonları değerlendirdi. Özdemir, bu spekülasyonların teknik detayların tam anlaşılamamasından ve Cloudflare CEO'su Matthew Prince gibi önemli figürlerin abartılı kıyaslamalarından kaynaklandığını belirtti. Prince, bu duyuruyu "Google'ın DeepSeek anı" olarak nitelendirmişti ve piyasa, bu tür sinyallere oldukça duyarlı bir tepki verdi.
Google'ın TurboQuant'ı, donanım ihtiyacını tamamen ortadan kaldıran bir teknoloji değil. Dr. Özdemir, bu teknolojinin, büyük dil modellerinin çıkarımı sırasında oluşan KV önbelleğini optimize eden bir vektör kuantizasyon algoritması olduğunu vurguladı. Bu algoritma, modelin tamamı yerine geçici bağlam bilgisini depolayan önbelleği hedef alıyor. Özdemir, "Teknoloji bellek gereksinimlerini 6 kat azaltabilir, ancak bu, veri merkezlerinin tüm maliyetlerini aynı oranda düşürmez," dedi. Kuantizasyon teknikleri, modellerin daha düşük bit hassasiyetiyle çalışmasını sağlayarak çıkarım maliyetlerini düşürse de, Google'ın yaptığı şey bu süreci daha verimli hale getirmek.
"RAM üreticilerinin hisselerindeki düşüş abartılı olabilir"
Özdemir, piyasanın bu teknolojiye tepkisinin, özellikle RAM üreticilerinin hisselerindeki düşüşün, abartılı ve kısa vadeli bir yorum olabileceğini söyledi. "Bu teknolojiler daha az donanım ihtiyacı anlamına gelmez, aynı donanımla daha fazla iş yapılabilmesi anlamına gelir," diyen Özdemir, bunun uzun vadede talebi azaltmaktan ziyade genişletebileceğine dikkat çekti.
Özdemir, yapay zeka piyasalarının şu anda yüksek beklentilerle ve anlatılarla hareket ettiğini belirtti. "DeepSeek'in model duyurusunda gördüğümüz gibi, TurboQuant ile benzer bir durum oluştu. Piyasa, teknik gelişmeleri mevcut iş modelleri veya donanım talebi üzerindeki etkisi üzerinden değerlendiriyor, bu da bellek ve yarı iletken gibi sektörlerde ani fiyat hareketlerine neden oluyor," dedi. Yapay zeka alanında sürekli bir ilerleme olduğunu, ancak piyasa beklentilerinin genelde büyük sıçramalar yönünde olduğunu vurguladı.
RAM Krizinin Karmaşık Nedenleri
Özdemir, dünyada uzun süredir devam eden RAM krizinin çok katmanlı bir sorun olduğunu belirtti. Bu krizin en büyük nedenlerinden biri, yapay zeka uygulamaları ve büyük dil modellerinin hızla yaygınlaşmasıyla artan bellek talebi. "Bu sistemler, yalnızca işlem gücü değil, aynı zamanda yüksek bant genişliğine sahip bellek gerektiriyor ve mevcut üretim kapasitesi üzerinde ciddi baskı yaratıyor," diye ekledi.
Yarı iletken üretiminin maliyetli ve esnekliği sınırlı bir alan olduğunu belirten Özdemir, "Yeni üretim tesislerinin devreye alınması yıllar alıyor. Talep hızla artarken arz aynı hızda genişleyemiyor," dedi. Jeopolitik gerilimler ve tedarik zinciri kısıtları da bu sorunu daha kırılgan hale getiriyor. Bu durum, veri merkezleri ve yapay zeka sektörü başta olmak üzere, tüketici elektroniği ve otomotiv gibi sektörleri de etkiliyor.
Özdemir, Moore Yasası'nın, yani transistör yoğunluğunun düzenli artışının fiziksel sınırlarına yaklaştığını belirterek, "Donanım tarafındaki ilerleme ile yapay zeka alanındaki talep artışı arasında bir uyumsuzluk oluşmuş durumda," dedi. Bu uyumsuzluk, RAM krizini geçici bir arz sorunundan daha yapısal bir gerilime dönüştürüyor.
Özdemir, kısa vadede dalgalanmaların devam etmesinin muhtemel olduğunu, ancak orta ve uzun vadede üretim kapasitesindeki artışlar, verimli model tasarımları ve yeni bellek teknolojilerinin devreye girmesiyle daha dengeli bir yapının oluşacağını söyledi. Verimlilik artışlarının genellikle talebi azaltmak yerine artırdığını belirten Özdemir, bu krizin tamamen ortadan kalkmasından ziyade daha yüksek talep seviyesinde yeniden şekillenmesinin olası olduğunu ifade etti.
Yorumlar (0)
Yorum Yaz
Henüz yorum yapılmamış. İlk yorumu siz yapın!