Washington Üniversitesi laboratuvarında çalışan araştırmacılardan biri olan Nate Bennett, “Bu teknolojinin en güçlü yanlarından biri, DALL-E gibi, ona yapmasını söylediğiniz şeyi yapmasıdır” dedi. “Tek bir bilgi isteminden sonsuz sayıda tasarım üretilebilir.”
OpenAI’nin Yükselişi
San Francisco merkezli şirket, dünyanın en iddialı yapay zeka laboratuvarlarından biridir. İşte bazı son gelişmelere bir bakış.
DALL-E, görüntüler oluşturmak için, yapay zeka araştırmacılarının sinir ağı dediği, beyindeki nöronlar ağına gevşek bir şekilde modellenmiş bir matematiksel sistem olan şeye güvenir. Bu, akıllı telefonunuza verdiğiniz komutları tanıyan, sürücüsüz arabaların yayaları tanımlamasını (ve bunlardan kaçınmasını) sağlayan ve Skype gibi hizmetlerde dilleri çeviren teknolojinin aynısıdır.
Bir sinir ağı, büyük miktarda dijital veriyi analiz ederek becerileri öğrenir. Örneğin, binlerce corgi fotoğrafında desenler bularak bir corgi’yi tanımayı öğrenebilir. DALL-E’yi kullanan araştırmacılar, milyonlarca dijital görüntüyü ve bu görüntülerin her birinin neyi temsil ettiğini açıklayan metin başlıklarını analiz ederken kalıpları arayan bir sinir ağı oluşturdu. Bu sayede görseller ve kelimeler arasındaki bağlantıları görmeyi öğrendi.
DALL-E için bir görüntüyü tanımladığınızda, bir sinir ağı, görüntünün içerebileceği bir dizi temel özellik üretir. Bir oyuncak ayının kulağının eğriliği bir özellik olabilir. Bir diğeri kaykayın kenarındaki çizgi olabilir. Ardından, difüzyon modeli adı verilen ikinci bir sinir ağı, bu özellikleri gerçekleştirmek için gereken pikselleri oluşturur.
Difüzyon modeli, gürültünün – kusurların – rastgele bir piksel denizi haline gelene kadar bir fotoğrafa kademeli olarak eklendiği bir dizi görüntü üzerinde eğitilmiştir. Model bu görüntüleri analiz ederken bu işlemi tersten gerçekleştirmeyi öğrenir. Rastgele pikselleri beslerseniz, gürültüyü kaldırır ve bu pikselleri tutarlı bir görüntüye dönüştürür.
Washington Üniversitesi’nde, diğer akademik laboratuvarlarda ve yeni girişimlerde, araştırmacılar yeni proteinler yapmak için benzer teknikler kullanıyor.
Proteinler, daha sonra davranışlarını tanımlayan üç boyutlu şekillere bükülen ve katlanan kimyasal bağ zincirleri olarak başlar. Son yıllarda, Google ile aynı ana şirket olan Alphabet’in sahibi olduğu DeepMind gibi yapay zeka laboratuvarları, sinir ağlarının yalnızca içerdiği daha küçük bileşiklere dayanarak vücuttaki herhangi bir proteinin üç boyutlu şeklini doğru bir şekilde tahmin edebildiğini göstermiştir. muazzam bilimsel ilerleme.
OpenAI’nin Yükselişi
San Francisco merkezli şirket, dünyanın en iddialı yapay zeka laboratuvarlarından biridir. İşte bazı son gelişmelere bir bakış.
DALL-E, görüntüler oluşturmak için, yapay zeka araştırmacılarının sinir ağı dediği, beyindeki nöronlar ağına gevşek bir şekilde modellenmiş bir matematiksel sistem olan şeye güvenir. Bu, akıllı telefonunuza verdiğiniz komutları tanıyan, sürücüsüz arabaların yayaları tanımlamasını (ve bunlardan kaçınmasını) sağlayan ve Skype gibi hizmetlerde dilleri çeviren teknolojinin aynısıdır.
Bir sinir ağı, büyük miktarda dijital veriyi analiz ederek becerileri öğrenir. Örneğin, binlerce corgi fotoğrafında desenler bularak bir corgi’yi tanımayı öğrenebilir. DALL-E’yi kullanan araştırmacılar, milyonlarca dijital görüntüyü ve bu görüntülerin her birinin neyi temsil ettiğini açıklayan metin başlıklarını analiz ederken kalıpları arayan bir sinir ağı oluşturdu. Bu sayede görseller ve kelimeler arasındaki bağlantıları görmeyi öğrendi.
DALL-E için bir görüntüyü tanımladığınızda, bir sinir ağı, görüntünün içerebileceği bir dizi temel özellik üretir. Bir oyuncak ayının kulağının eğriliği bir özellik olabilir. Bir diğeri kaykayın kenarındaki çizgi olabilir. Ardından, difüzyon modeli adı verilen ikinci bir sinir ağı, bu özellikleri gerçekleştirmek için gereken pikselleri oluşturur.
Difüzyon modeli, gürültünün – kusurların – rastgele bir piksel denizi haline gelene kadar bir fotoğrafa kademeli olarak eklendiği bir dizi görüntü üzerinde eğitilmiştir. Model bu görüntüleri analiz ederken bu işlemi tersten gerçekleştirmeyi öğrenir. Rastgele pikselleri beslerseniz, gürültüyü kaldırır ve bu pikselleri tutarlı bir görüntüye dönüştürür.
Washington Üniversitesi’nde, diğer akademik laboratuvarlarda ve yeni girişimlerde, araştırmacılar yeni proteinler yapmak için benzer teknikler kullanıyor.
Proteinler, daha sonra davranışlarını tanımlayan üç boyutlu şekillere bükülen ve katlanan kimyasal bağ zincirleri olarak başlar. Son yıllarda, Google ile aynı ana şirket olan Alphabet’in sahibi olduğu DeepMind gibi yapay zeka laboratuvarları, sinir ağlarının yalnızca içerdiği daha küçük bileşiklere dayanarak vücuttaki herhangi bir proteinin üç boyutlu şeklini doğru bir şekilde tahmin edebildiğini göstermiştir. muazzam bilimsel ilerleme.