Makine Öğrenimi ve Sinir Ağları - sayfa 2

 

MIT 6.S191: Derin Üretken Modelleme



Ders 4. MIT 6.S191: Derin Üretken Modelleme

Bu video, daha sonra yeni görüntüler oluşturmak için kullanılabilecek girdi verilerinin daha düzgün ve eksiksiz bir temsilini öğrenmek için derin üretken modellemenin nasıl kullanılabileceğini tartışıyor. DGM'nin anahtarı, her gizli değişken için, ağın yeni veriler oluşturmak için bu gizli dağılımdan örnekleme yapmasına izin veren bir olasılık dağılımı sunmaktır.

  • 00:00:00 Bu derste Ava, veri kümelerinin altında yatan olasılık dağılımlarını öğrenmek için derin üretken modellerin nasıl kullanılabileceğini açıklıyor. Yoğunluk tahmini ve numune oluşturma olmak üzere iki yöntemin pratikte nasıl çalıştığını gösteriyor.

  • 00:05:00 Bu videoda sunum yapan kişi, bir veri kümesinin temel özelliklerini öğrenmek için üretken modellerin nasıl kullanılabileceğini açıklıyor. Bu, yüz algılama veya aykırı değer algılama gibi uygulamalarda yararlı olabilir.

  • 00:10:00 Otomatik kodlayıcı, yüksek boyutlu girdi verilerinin daha düşük boyutlu bir gizli alana sıkıştırılmasına izin veren güçlü bir makine öğrenimi algoritmasıdır. Bu gizli alan daha sonra verileri daha sonra yeniden yapılandırmak üzere kodlamak için kullanılabilir. Varyasyonel bir otomatik kodlayıcı ile, gizli alan olasılıklıdır ve girdi verilerinin daha gerçekçi ve doğru yeniden oluşturulmasına olanak tanır.

  • 00:15:00 Video, daha sonra yeni görüntüler oluşturmak için kullanılabilen girdi verilerinin daha düzgün ve eksiksiz bir temsilini öğrenmek için derin üretken modellemenin (DGM) nasıl kullanılabileceğini tartışıyor. DGM'nin anahtarı, her gizli değişken için, ağın yeni veriler oluşturmak için bu gizli dağılımdan örnekleme yapmasına izin veren bir olasılık dağılımı sunmaktır. Ağın kaybı artık, gizli değişkenlerin olasılık dağılımına bir miktar yapı dayatan yeniden yapılandırma teriminden ve düzenleme teriminden oluşmaktadır. Ağ, ağın ağırlıklarına göre kaybı optimize etmek için eğitilir ve eğitim sırasında ağırlıklar yinelemeli olarak güncellenir.

  • 00:20:00 Video, bir düzenlileştirme teriminin, d'nin, çıkarsanan gizli dağılım ile bir önceki arasındaki mesafeyi en aza indirmeye nasıl yardımcı olduğunu tartışıyor. Ayrıca, normal önceliğin bunu başarmaya nasıl yardımcı olabileceğini de gösterir.

  • 00:25:00 Video, bir dizi veri noktasından bir girişi yeniden oluşturmak için derin üretken modellemenin nasıl kullanıldığını tartışıyor. Yöntem, gizli alana normal tabanlı bir düzenlileştirme empoze etmeyi içerir, bu da onu yumuşatmaya ve tamamlamaya yardımcı olur. Bu da, gradyanların ağ üzerinden doğrudan yayılmasını önleyen stokastiklik problemini çözen, örnekleme katmanı boyunca gradyanların geri yayılmasına izin verir.

  • 00:30:00 Bu video, gizli değişken modellerinin (Varyasyonel Otomatik Kodlayıcılar veya Beta Vaes gibi) bir veri kümesinde önemli olan özellikleri kodlamak için nasıl kullanılabileceğini açıklar. Bu, önemli özellikler otomatik olarak kodlandığından daha tarafsız makine öğrenimi modellerine izin verir.

  • 00:35:00 GAN'lar, gerçek verilere benzer örnekler oluşturmak için bir üretici ağı kullanırken, düşman bir ağ sahte örnekleri gerçek olanlardan ayırmaya çalışır. Eğitimden sonra, oluşturucu ve ayrımcı, sahte verileri gerçek verilerden mükemmele yakın bir doğrulukla ayırabilir.

  • 00:40:00 Video, önceki derslerde tanıtılan kavramlara dayanan Derin Üretken Modeller için kayıp fonksiyonunu tartışıyor. Ayrımcı ağın amacı, sahte verileri tespit etmektir ve üretici ağın amacı, gerçek veri dağıtımına mümkün olduğunca yakın veriler üretmektir. Tren üreteç ağı, tamamen rastgele gauss gürültüsünün dağılımına dayanan yeni veri örneklerini sentezler. Bu gürültü dağılımındaki bir noktayı, gerçek veri dağılımındaki bir noktayı ve hedef veri dağılımındaki bir noktayı ele alırsak, üreticinin bu noktalar arasında bir yere düşen verileri üretmeyi öğrendiğini görebiliriz. Karmaşık veri manifoldlarında etki alanı dönüştürme ve geçiş fikri daha ayrıntılı olarak tartışılıyor ve gans'ın gerçekçi veri örnekleri oluşturmak için nasıl güçlü bir mimari olduğu gösteriliyor.

  • 00:45:00 Video, mimari ve stil aktarımındaki iyileştirmeler de dahil olmak üzere derin üretken modellemedeki bazı son gelişmeleri tartışıyor. Tamamen eşleştirilmemiş verilerle alanlar arasında çeviriye izin veren cyclegan modelini açıklamaya devam ediyor.

  • 00:50:00 Bu bölümde Ava, derin öğrenmede kullanılan iki ana üretken modeli, varyasyonel otomatik kodlayıcıları ve otomatik kodlayıcıları tartışıyor ve bunların nasıl çalıştığını açıklıyor. Ayrıca, bu modellerle birlikte kullanılabilen güçlü bir dağıtım transformatörü olan cycle gan'dan da bahsediyor. Yazar, katılımcıları kursun hemen ardından gelecek olan laboratuvar bölümüne katılmaya teşvik ederek dersi sonlandırır.
MIT 6.S191 (2022): Deep Generative Modeling
MIT 6.S191 (2022): Deep Generative Modeling
  • 2022.04.01
  • www.youtube.com
MIT Introduction to Deep Learning 6.S191: Lecture 4Deep Generative ModelingLecturer: Ava SoleimanyJanuary 2022For all lectures, slides, and lab materials: ht...
 

MIT 6.S191: Takviyeli Öğrenme



Ders 5. MIT 6.S191: Takviyeli Öğrenme

Bu videoda Alexander Amini, pekiştirmeli öğrenme kavramını ve bunun bir sinir ağını eğitmek için nasıl kullanılabileceğini tartışıyor. Takviyeli öğrenmenin nasıl çalıştığını ve gerçek dünya senaryolarında nasıl kullanılabileceğini açıklayarak başlıyor. Ardından, bir politika gradyan ağının nasıl eğitileceğini tartışmaya devam ediyor. Son olarak, eğitim döngüsünün her yinelemesinde politika gradyanının nasıl güncelleneceğini tartışarak videoyu sonlandırıyor.

  • 00:00:00 Bu videoda, girdi verileri hakkında önceden bilgi sahibi olmadan derin bir öğrenme modelinin eğitildiği bir tür makine öğrenimi olan pekiştirmeli öğrenmeyi öğreniyoruz. Takviyeli öğrenmede, derin öğrenme modeli dinamik bir ortama yerleştirilir ve herhangi bir insan rehberliği olmadan bir görevi nasıl yerine getireceğini öğrenmekle görevlendirilir. Bunun, robotik, oyun ve sürücüsüz arabalar gibi çeşitli alanlarda büyük etkileri vardır.

  • 00:05:00 Takviyeli öğrenmede etmen çevrede eylemde bulunan varlık, çevre ise etmenin var olduğu ve eylemde bulunduğu dünyadır. Ajan, çevreye eylemler şeklinde komutlar gönderebilir ve durum, ajanın kendisini zamanın bu anında bulduğu somut ve acil bir durumdur. Temsilci ayrıca çevreden ödüller alabilir.

  • 00:10:00 Dersin pekiştirmeli öğrenme üzerine olan bu bölümü ödül, gama ve q fonksiyonu kavramlarını açıklar. q işlevi, mevcut durumu ve eylemi girdi olarak alır ve bir aracının bu eylemden sonra alabileceği ödüllerin gelecekteki toplamını verir. q işlevi, mevcut durum ve eylem göz önüne alındığında, belirli bir durumda gerçekleştirilecek en iyi eylemi belirlemek için kullanılabilir.

  • 00:15:00 Bu bölümde Alexander Amini, Atari kaçış oyununu ve bununla ilişkili q işlevini tanıtıyor. Gelecekteki ödülleri maksimize eden aq fonksiyonunu bulmaya dayanan değer öğrenme algoritmalarını tartışmaya devam ediyor. Ardından, pekiştirmeli öğrenme problemini modellemenin daha doğrudan bir yolu olan bir politika öğrenme algoritması sunar. Hem değer öğrenimi hem de politika öğrenimi kısaca tartışılmakta ve değer öğrenimi üzerine yapılan bir çalışmanın sonuçları gösterilmektedir.

  • 00:20:00 Video, takviyeli öğrenmeyi veya çeşitli olası eylemler ve sonuçları deneyerek bir kararı optimize etmeyi öğrenme sürecini tartışıyor. Video, bir temsilcinin nasıl davranabileceğine dair iki örnek gösteriyor; biri temsilcinin çok muhafazakar olduğu, diğeri ise daha agresif olduğu durumlar. Video daha sonra, belirli bir durum ve eylem için en uygun eylem olan q işlevini öğrenmek için bir sinir ağının nasıl eğitileceğini tartışmaya devam ediyor.

  • 00:25:00 Bu bölümde, bir q-değeri pekiştirmeli öğrenme aracısının nasıl eğitileceği anlatılmaktadır. q değeri, farklı sonuçların göreceli öneminin bir ölçüsüdür ve sinir ağını yapılandırmak için kullanılır. Her olası eylem için beklenen getiri hesaplanır ve bu beklenen getiri maksimize edilerek en iyi eylem belirlenir. Sinir ağını eğitmek için q-değeri kayıp fonksiyonu kullanılır ve her eylem için alınan ödüller gözlenerek hedef değer belirlenir.

  • 00:30:00 Takviyeli öğrenmede, bir aracının davranışı, bir ödülü maksimize etmek için bir ortamdan gelen geri bildirim kullanılarak değiştirilir. Politika gradyan yöntemleri, değer öğrenme algoritmalarından daha esnek ve verimli olan yeni bir pekiştirmeli öğrenme algoritmaları sınıfıdır.

  • 00:35:00 Bu bölümde, Alexander Amini ödül ve ceza varlığında nasıl davranılacağını öğrenmek için bir yöntem olan pekiştirmeli öğrenmeyi tanıtıyor. Takviyeli öğrenmede, bir aracının politikası, bir durumu (aracının içinde bulunduğu ortam) alan ve bu durumda belirli bir eylemde bulunma olasılığını veren bir işlev olarak tanımlanır. Bu olasılık daha sonra, mevcut duruma ve geçmişteki ödüllere ve cezalara dayalı olarak aracının bir sonraki eylemini tahmin etmek için bir sinir ağını eğitmek için kullanılır. Öğrenmeye yönelik bu yaklaşımın avantajları, sürekli eylem alanlarını işleyebilmesi ve sürekli eylemleri yüksek doğrulukla modellemek için politika gradyan yöntemlerinin kullanılabilmesidir.

  • 00:40:00 Bu videoda, Alexander Amini, pekiştirmeli öğrenme algoritmalarının performansını iyileştirmek için politika gradyanlarının nasıl kullanılabileceğini tartışıyor. Sürekli bir uzayı ve ayrık toplamların yerine integrallerin nasıl kullanılabileceğini tanımlayarak başlar. Ardından, politika gradyanlarının somut bir örnek üzerinde nasıl çalıştığını tartışmaya devam ediyor ve bir politika gradyan ağının nasıl eğitileceğini tartışıyor. Eğitim döngüsünün her yinelemesinde politika gradyanının nasıl güncelleneceğini tartışarak videoyu bitiriyor.

  • 00:45:00 Bu bölüm, pekiştirmeli öğrenmeyi kullanarak bir sinir ağını eğitmek için bir yöntem sunar. Video, pekiştirmeli öğrenmenin nasıl çalıştığını ve gerçek dünya senaryolarında nasıl kullanılabileceğini açıklıyor.

  • 00:50:00 Bu videoda, Alexander Amini özellikle Go alanında olmak üzere pekiştirmeli öğrenmedeki son gelişmelerden bazılarını tartışıyor. Bir Google DeepMind projesi olan Alpha Zero, dünyanın en iyi insan oyuncularını geride bırakmayı başardı. Bir sonraki derste Nielsen, derin öğrenme literatürünü ve sınırlamalarını tartışacak. Bu, umarım öğrencileri öğrenmeye ve alanda ilerlemeye devam etmeye motive edecektir.
MIT 6.S191 (2022): Reinforcement Learning
MIT 6.S191 (2022): Reinforcement Learning
  • 2022.04.08
  • www.youtube.com
MIT Introduction to Deep Learning 6.S191: Lecture 5Deep Reinforcement LearningLecturer: Alexander AminiJanuary 2022For all lectures, slides, and lab material...
 

MIT 6.S191 (2022): Derin Öğrenmede Yeni Sınırlar



Ders 6. MIT 6.S191 (2022): Derin Öğrenme Yeni Sınırlar

MIT 6.S191'in "Derin Öğrenme Yeni Sınırlar" dersi bir dizi konuyu kapsar. Öğretim görevlisi Ava Soleimany, kurstaki çeşitli teslim tarihlerini açıklıyor, konuk dersleri tanıtıyor ve mevcut araştırma sınırlarını tartışıyor. Derin sinir ağlarının Evrensel Yaklaşım Teoremi, genelleme, veri kalitesi, belirsizlik ve rakip saldırılarla ilgili sınırlamaları da ele alınmaktadır. Ek olarak, grafik evrişim sinir ağları ve bunların ilaç keşfi, kentsel hareketlilik ve COVID-19 tahmini gibi farklı alanlardaki potansiyel uygulamaları tartışılmaktadır. Son olarak ders, otomatik makine öğrenimi (autoML) konusunu ve bunun yüksek performanslı makine öğrenimi ve derin öğrenme modelleri tasarlamada nasıl yardımcı olabileceğini araştırıyor. Öğretim görevlisi, insan öğrenimi, zeka ve derin öğrenme modelleri arasındaki bağlantının ve ayrımın önemini vurgulayarak bitirir.

  • 00:00:00 Bu bölümde Ava, sınıf tişörtleri ve laboratuvarlar ve final projeleri için yaklaşan son tarihler hakkında bazı lojistik bilgiler sağlar. Ayrıca kalan konuk derslerini tanıtıyorlar ve ele alınacak yeni araştırma alanlarına değiniyorlar. Takviyeli öğrenme laboratuvarı yayınlandı ve üç laboratuvarın da son teslim tarihi yarın gece, ancak geçme notu almak için bunları göndermek gerekli değil. Kursun kredisi için derin bir öğrenme ödevi incelemesi veya bir final projesi sunumu göndermek gerekir. Nihai proje önerisi yarışması, grup adlarının bu gece yarısına kadar sunulmasını gerektirir ve derin öğrenme kağıt raporu için talimatlar özetlenir.

  • 00:05:00 Bu bölümde, konuşmacı, kursun gelecek oturumları için planlanan muhteşem konuk dersleri dizisini tartışıyor. Konuk konuşmacılar arasında gelişmekte olan sürücüsüz otomobil şirketi Innoviz, Google Research ve Google Brain, Nvidia ve Caltech ve Rev AI'dan temsilciler yer alıyor. Konuşmacı, içeriğe tam erişim sağlamak için derslere eşzamanlı olarak katılmanın önemini vurgular. Konuşmacı ayrıca, derin öğrenme algoritmalarının gücünü ve bir dizi alanda devrim yaratma potansiyellerini vurgulayarak, kursta şu ana kadar işlenen içeriği özetliyor. Konuşmacı ayrıca sinir ağlarının, veriden karara veya tam tersine eşleme yapan güçlü fonksiyon yaklaşımlayıcıları olarak rolünü vurguluyor.

  • 00:10:00 Bu bölümde, konuşmacı, tek katmanlı bir ileri beslemeli sinir ağının herhangi bir keyfi sürekli fonksiyona herhangi bir hassasiyetle yaklaşmak için yeterli olduğunu belirten Evrensel Yaklaşım Teoremini tartışıyor. Bu güçlü bir ifade olsa da, teoremin gerekli nöron sayısı ve sorunu çözebilecek ağırlıkların nasıl bulunacağı konusunda iddia veya garanti eksikliği de dahil olmak üzere bazı uyarıları vardır. Ek olarak teorem, sinir ağının üzerinde eğitildiği ortamın ötesinde genelleştirilebilirliği hakkında hiçbir iddiada bulunmaz. Konuşmacı, ortaya çıkabilecek olası endişeler nedeniyle bu algoritmaların nasıl pazarlandığı ve reklamının yapıldığı konusunda dikkatli olmanın önemini vurgulamaktadır. Bu bölüm ayrıca, genelleme probleminden ve bu konuyu ünlü ImageNet veri kümesinden görüntülerle araştıran bir makaleden başlayarak modern derin öğrenme mimarilerinin sınırlamalarını da araştırıyor.

  • 00:15:00 Bu bölümde video, derin nöral ağların sınırlamalarını ve tamamen rasgele verilere mükemmel şekilde uyma yeteneklerini tartışıyor. Sinir ağları, rasgele etiketlere sahip olsa bile bazı rastgele işlevlere uyan mükemmel işlev yaklaşımlayıcıları olsa da, işlevin nasıl davranacağına dair hiçbir garantinin olmadığı dağıtım dışı bölgelere genelleme yapma yetenekleri sınırlıdır. Bu, sinir ağlarının genelleştirme sınırları hakkında garantiler oluşturma ve bu bilgileri eğitim, öğrenme ve dağıtım süreçlerini bilgilendirmek için kullanma ihtiyacını vurgular. Video ayrıca, derin öğrenmenin herhangi bir soruna sihirli bir çözüm olduğu şeklindeki yaygın inanca karşı uyarıda bulunuyor ve bu modellerin sınırlamalarını ve varsayımlarını anlamanın önemini vurguluyor.

  • 00:20:00 Bu bölümde derin öğrenme modellerini eğitmek için kullanılan verilerin kalitesinin önemi vurgulanmaktadır. Sinir ağlarının bir hata modu, bir köpeğin siyah beyaz bir görüntüsünün renklendirme için evrişimli bir sinir ağı mimarisinden geçirildiği bir örnek üzerinden özetlenmiştir. Ağ, köpeğin burnunun altında, dillerini dışarı çıkaran köpeklerin birçok görüntüsünü içeren, eğitildiği verilerin doğası gereği kürk olması gereken pembe bir bölge tahmin etti. Örnek, eğitim sırasında gördükleri verilere dayalı temsiller oluşturmak için derin öğrenme modellerinin gücünü vurgulamaktadır. Bölüm daha sonra, bir kazaya etkili bir şekilde tepki vermeyen ve sonunda sürücünün ölümüyle sonuçlanan otonom bir Tesla aracının dahil olduğu trajik bir olayda görüldüğü gibi, eğitim dağıtımının dışında kalan gerçek dünya örnekleriyle karşılaşmanın sonuçlarını tartışıyor. Özellikle güvenlik açısından kritik uygulamalarda, derin öğrenme modellerinin tahminlerinin sınırlamalarının anlaşılmasının önemi vurgulanmaktadır.

  • 00:25:00 Bu bölümde sunum yapan kişi, dengesiz özellikler de dahil olmak üzere seyrek, gürültülü veya sınırlı veri kümelerini işleyebilen nöral modeller oluşturmak için çok önemli olan derin öğrenmedeki belirsizlik kavramını tartışıyor. Derin sinir modellerinde iki tür belirsizlik vardır; veri gürültüsünden, değişkenlikten veya etki alanı dışı bir örneğin test edilmesinden kaynaklanabilecek aleatorik belirsizlik ve epistemik belirsizlik. Bu belirsizlikler, modelin tahminlerine olan güvenini temsil eder ve farklı veri türlerini işlerken etkinliğini etkileyebilir. Ek olarak, derin öğrenme modellerini yanıltmak için oluşturulan sentetik örnekler olan düşmanca örnekler, dikkate alınması gereken üçüncü bir başarısızlık modu sunar. Jasper'ın bu konudaki konuk dersi, bu iki tür belirsizliğin tüm olasılıkları kapsayıp kapsamadığına dair tartışmayı araştırmak ve bu alandaki son araştırma ilerlemelerini tartışmak için şiddetle tavsiye edilir.

  • 00:30:00 Videonun bu bölümünde öğretim görevlisi, insan gözüyle algılanamayan ancak bir sinir ağının kararında önemli bir etkiye sahip olan ve yanlış sınıflandırmaya neden olan bir görüntüye pertürbasyonun uygulandığı düşmanca saldırı kavramını tartışıyor. görüntü Tedirginlik, bir rakip olarak etkili bir şekilde işlev görecek şekilde akıllıca yapılandırılır ve sinir ağları bu tedirginliği öğrenmek için eğitilebilir. Öğretim görevlisi ayrıca sinir ağı modellerinin ve yapay zeka sistemlerinin gerçek ve zararlı toplumsal sonuçlara yol açabilecek önyargılara duyarlı olabileceği ve algoritmik önyargıyı hafifletme stratejilerinin ikinci laboratuvarda araştırıldığı algoritmik önyargı konusuna da kısaca değinir. Bu sınırlamalar buzdağının sadece görünen kısmı ve dikkate alınması gereken daha fazla sınırlama var.

  • 00:35:00 Bu bölümde, konuşmacı grafik yapılarının derin öğrenme için bir veri yöntemi olarak kullanımını ve bunun evrişimli sinir ağlarıyla ilgili ancak farklı yeni bir ağ mimarisi türüne nasıl ilham verebileceğini tartışıyor. Grafik yapıları, sosyal ağlardan proteinlere ve biyolojik moleküllere kadar çok çeşitli veri türlerini temsil edebilir. Grafik evrişimli sinir ağları, bir 2B matris yerine bir dizi düğüm ve kenarı girdi olarak alarak ve düğümlerin birbiriyle ilişkisi hakkındaki bilgileri koruyan özellikleri çıkarmak için bir ağırlık çekirdeği ile grafiği çaprazlayarak çalışır. Derin öğrenmede ortaya çıkan bu alan, daha karmaşık veri geometrilerinin ve veri yapılarının standart kodlamaların ötesinde yakalanmasını sağlar.

  • 00:40:00 Bu bölümde konuşmacı, grafik evrişimli ağları ve bunların kimya ve ilaç keşfi, kentsel hareketlilik ve COVID-19 tahmini dahil olmak üzere çeşitli alanlardaki uygulamalarını tartışıyor. Grafik evrişimli ağlar, bir grafiğin yerel bağlantısı ve yapısı hakkında özelliklerin çıkarılmasına izin vererek, öğrenme sürecinin bağlantı kalıpları hakkında bilgi çıkarabilen ağırlıkları toplamasını sağlar. Ayrıca konuşmacı, 3B nokta bulutu manifolduna bir grafik yapısı empoze ederek grafik evrişimli sinir ağlarının nokta bulutu veri kümelerine nasıl genişletilebileceğini açıklıyor.

  • 00:45:00 Bu bölümde, konuşmacı otomatik makine öğreniminin ve öğrenmeyi öğrenmenin yeni sınırlarını tartışıyor. Amaç, sinir ağı mimarilerinin tasarım problemini çözebilen ve belirli bir problemi çözmek için en etkili modeli tahmin edebilen bir öğrenme algoritması oluşturmaktır. Orijinal automl çerçevesi, modelin mimari önerilerini yinelemeli olarak iyileştirmek için bir denetleyici sinir ağı ve bir geri bildirim döngüsü içeren bir pekiştirmeli öğrenme kurulumu kullandı. Son zamanlarda, automl, amacın en uygun tasarımları ve hiperparametreleri aramak olduğu nöral mimari aramasına genişletildi. Bu yeni araştırma alanı, makine öğrenimi modellerini tasarlama ve performanslarını optimize etme yöntemimizde devrim yaratabilir.

  • 00:50:00 Bu bölümde öğretim görevlisi automl (otomatik makine öğrenimi) kavramını ve bunun yüksek performanslı makine öğrenimi ve derin öğrenme modelleri tasarlama becerisini tartışır. Automl fikri, modern makine öğrenimi ve derin öğrenme tasarım ardışık düzenlerinde, özellikle de algoritmalarının çok iyi performans gösteren mimariler oluşturmada başarılı olduğu endüstriyel uygulamalarda popülerlik kazanmıştır. Öğretim görevlisi, bir otomatik ml algoritması tarafından önerilen mimarilerin, insanlar tarafından tasarlananlardan daha az parametreyle bir görüntü tanıma görevinde nasıl üstün doğruluk elde ettiğinin bir örneğini sunar. Automl, tüm veri işleme ve öğrenme-tahmin boru hatlarının yapay zeka algoritmaları tarafından tasarlandığı ve optimize edildiği daha geniş otomatik yapay zeka konseptine genişletildi. Konuşmacı, izleyiciyi ilgilenilen görevlerde yüksek performans gösteren yeni modeller üretebilen yapay zeka tasarlamanın sonuçları ve insan öğrenimi, zeka ve derin öğrenme modelleri arasındaki bağlantılar ve ayrımlar hakkında düşünmeye teşvik ederek bitirir.
MIT 6.S191 (2022): Deep Learning New Frontiers
MIT 6.S191 (2022): Deep Learning New Frontiers
  • 2022.04.15
  • www.youtube.com
MIT Introduction to Deep Learning 6.S191: Lecture 6Deep Learning Limitations and New FrontiersLecturer: Ava SoleimanyJanuary 2022For all lectures, slides, an...
 

MIT 6.S191: Otonom Sürüş için LiDAR



Ders 7. MIT 6.S191: Otonom Sürüş için LiDAR

"MIT 6.S191: Otonom Sürüş için LiDAR" videosu, Innoviz'in otonom araçlar için LiDAR teknolojisini geliştirmesini sunarak sistemin görünürlük ve tahmin yeteneklerinin faydalarını ve önemini vurguluyor. Konuşmacı, LiDAR sisteminin sinyal-gürültü oranını etkileyen çeşitli faktörleri, sensör kullanımında fazlalığın önemini ve çarpışmayla ilgili nesneleri algılamada yüksek çözünürlük ve hesaplama verimliliği ihtiyacını açıklıyor. Ayrıca, derin öğrenme ağlarının nesneleri algılama ve sınıflandırmadaki zorluklarını, farklı LiDAR veri temsillerini ve nesne algılama ve sınır kutusu doğruluğu için kümeleme ve derin öğrenme yaklaşımlarının birleşimini tartışıyorlar. Ayrıca video, FMCW ile uçuş süresi LiDAR arasındaki ödünleşimlere değiniyor. Genel olarak tartışma, LiDAR'ın otonom sürüşün güvenliğini ve geleceğini artırmadaki kritik rolünü vurgulamaktadır.

  • 00:00:00 Bu bölümde konuşmacı Innoviz'i ve otonom araçlar için Lidar geliştirmelerini tanıtıyor ve özellikle otomobil üreticilerinin otonom araçlar geliştirme hedeflerine ulaşmalarına nasıl yardımcı olduklarına odaklanıyor. Konuşmacı, otonom sürüşün mevcut durumunu ve otomobil üreticisinin tüm sorumluluğu üstlenmemesi nedeniyle meydana gelen kazalardan kaynaklanan sorumluluk sorunlarını tartışıyor. Ayrıca sahneyi taramak ve nesnelerden foton toplamak için bir lazer ışını kullanan Lidar teknolojisinin kullanımını da açıklıyorlar. Konuşmacı, başarılı otonom sürüş için iyi bir görüşe sahip olmanın ve yolda neler olup bittiğine dair bir tahminde bulunmanın önemini vurguluyor.

  • 00:05:00 Bu bölümde, konuşmacı LiDAR'ın otonom sürüşte nasıl çalıştığını ve sinyal/gürültü oranını etkileyen çeşitli faktörleri açıklıyor. LiDAR sistemi, nesnelerin mesafesini belirlemek için geri dönen fotonları kullanır ve sinyal-gürültü oranı emisyon, açıklık, foton algılama verimliliği, dedektör gürültüsü ve güneş gürültüsü tarafından belirlenir. Konuşmacı ayrıca, ikinci nesil bir LiDAR sistemi olan Innoviz 2'nin, daha yüksek çözünürlükle daha geniş bir görüş alanını ve mesafe aralığını kapsayabildiği için, piyasadaki diğer tüm sistemlerden önemli ölçüde daha iyi olduğunu açıklıyor. Konuşmacı ayrıca otoyollar gibi otonom sürüş uygulamaları için farklı gereklilikleri ve LiDAR'ın bu uygulamaları nasıl destekleyebileceğini tartışıyor.

  • 00:10:00 Bu bölümde, konuşmacı, özellikle su veya doğrudan güneş ışığı tarafından engellenebilen kameralar gibi sensörlerin sınırlamalarıyla uğraşırken, otonom sürüşte fazlalığın neden önemli olduğunu açıklıyor. İyi bir otonom sürüş sistemi yalnızca güvenlik sağlamakla kalmaz, aynı zamanda yolcuların yorulmasını önlemek için sorunsuz bir sürüş sağlar. Üçüncü seviye gereksinimler, yumuşak hızlanma, frenleme ve manevralar yapmak için aracın önünü görebilme yeteneğine sahip olmayı içerir. Konuşmacı, görüş alanı ve bir nesnenin yörüngesinin izdüşümü gibi gerekliliklere kısaca değinerek, daha yüksek çözünürlüğün sensörün nesneleri daha iyi tanımlamasını sağladığına dikkat çekiyor. Son olarak, hoparlör saatte 80 mil hızla acil frenleme için bir kullanım durumu sağlar.

  • 00:15:00 Bu bölümde konuşmacı, LiDAR'ın dikey çözünürlüğünün önemini ve otonom araçlarda karar vermeyi nasıl etkilediğini tartışıyor. Uzun bir nesneyi tanımlamak için iki piksele sahip olmanın netlik için gerekli olduğunu ve LiDAR'ın iki katı menzile sahip olsa bile, yalnızca bir piksel olması durumunda karar vermede mutlaka yardımcı olmayacağını açıklıyorlar. Ayrıca, engelleri daha uzak mesafeden tanımlayabilen daha yüksek kare hızlarının ve çift dikey çözünürlüğün etkisini tartışıyorlar ve bu parametrelerin otonom araçların güvenliği için kritik öneme sahip olduğunu vurguluyorlar. Konuşmacı ayrıca şirketin yüksek çözünürlüklü, uygun maliyetli 360 derecelik bir LiDAR sistemi geliştirme çabalarını da kısaca tartışıyor. Son olarak bölüm, bir nokta bulutundaki çarpışmayla ilgili noktaları tespit edebilen basit bir algoritmanın tartışılmasıyla sona erer.

  • 00:20:00 Bu bölümde konuşmacı, LiDAR teknolojisini kullanarak çarpışmayla ilgili nesneleri algılamak için basit bir algoritmayı açıklıyor. Bir nokta bulutundaki nokta çiftleri arasındaki yükseklik farkı ölçülerek yerden 40 santimetre veya daha yüksekte olan cisimler kolaylıkla tespit edilebilir. Algoritma, itfaiye araçları veya dünyanın farklı bölgelerindeki nesneler gibi bir eğitim setinde temsil edilemeyen nesneleri algılayabilir. Konuşmacı, bu algoritmanın devrilen kamyonları ve lastik gibi küçük nesneleri uzaktan nasıl algılayabildiğine dair örnekler gösteriyor. Bununla birlikte, statik nesneleri algılamak önemli olmakla birlikte, hareket eden nesnelerin gelecekte nasıl hareket edeceklerini tahmin etmek için dinamiklerini anlamak da önemlidir.

  • 00:25:00 Bu bölümde, derin öğrenme ağlarını kullanarak yayalar gibi nesneleri algılamanın ve sınıflandırmanın zorluklarına odaklanılıyor, özellikle de bacaklar ve gövde gibi nesnelerin görünüşünün belirgin olmadığı veya nesnelerin çok uzakta olduğu senaryolarda. Lidar, bu senaryolarda kullanışlı bir teknolojidir, çünkü görünüşlerini görmek kritik olmadığı için nesneleri yine de sınıflandırabilir ve kümelendirebilir. Bu kümeleme algoritması, araba kullanmak gibi gerçek senaryo ortamlarında uygulanabilir, ancak iki farklı nesne olarak sınıflandırılabilen bir nesne örneğiyle işaret edilen istikrarsızlığı ve belirsizliği, sağlam ve kullanışlı bir sistem oluşturmayı zorlaştırır. üst düzey otonom araç yığını. Bu nedenle, anlamsal analiz tüm sistem için kritik olmaya devam etmektedir. Nokta bulutu verilerinin yapılandırılmamış doğasını ve seyrekliğini anlamak, verileri işlerken de önemlidir.

  • 00:30:00 Bu bölümde konuşmacı, görüntülere benzeyen yapılandırılmış temsiller ve verilerin daha küçük hacimlere bölündüğü vokselleştirme dahil olmak üzere otonom sürüş için kullanılabilecek farklı LiDAR verileri temsillerini tartışıyor. Yapılandırılmış gösterimlerle ilgili zorluk, nokta bulutlarının 3B ölçüm özelliklerinden yararlanmanın zor olabilmesidir, halbuki vokselleştirme ile, verimli işleme için ağda ekstra bir katman olarak eklenebilen oklüzyon bilgisini anlamak mümkündür. Konuşmacı, otonom sürüşte ve uçta işlemede hesaplama verimliliğinin önemini vurguluyor, burada verimlilik çözümü tanımlayabilir.

  • 00:35:00 Bu bölümde, konuşmacı, otonom sürüş için Lidar sisteminin temel öğelerini, aracın şeridinde bir motosikletin algılanması örneğini kullanarak tartışıyor. Motosikleti doğru bir şekilde tespit etmek ve izlemek için, hem anlamsal olarak doğru hem de hesaplama açısından verimli olan sıkı bir sınırlama kutusuna sahip olmak çok önemlidir. Çözüm, güvenlik açısından kritik sistemler için önemli olan yığının çıktısı için sağlam, yorumlanabilir bir nesne listesi oluşturmak için her iki yöntemin en iyilerini birleştiren derin öğrenme ve kümeleme yaklaşımları arasındaki bir füzyondur. Birleştirilmiş çıktı, sınıflarla doğru sınır kutuları sağlayarak Lidar ve algılama yazılımının bir arabanın işlem birimine daha sorunsuz bir şekilde entegre edilmesini sağlar.

  • 00:40:00 Bu bölümde, konuşmacı LiDAR'ın otonom sürüş için kullanımını ve yedek sensör bilgisi sağlayarak güvenliği artırmaya nasıl yardımcı olabileceğini tartışıyor. Yağmur gibi hava koşullarının LiDAR performansı üzerinde çok az etkisi olduğunu, sisin ise ışığın bir miktar zayıflamasına neden olabileceğini açıklıyorlar. Konuşmacı ayrıca yanlış pozitifler ve LiDAR'larını bu uygulama için neyin daha uygun hale getirdiğiyle ilgili soruları ele alarak, farklı parametreler ile sistemlerinin yüksek genel SNR'si arasındaki dengeyi vurguluyor. Otonom sürüş için eğitim sınıflandırıcılarının zorluklarını ve verilerin etkili bir şekilde açıklanmasını sağlamak için aktif öğrenmenin önemini tartışmaya devam ediyorlar.

  • 00:45:00 Bu bölümde, konuşmacı LiDAR uzayındaki dalga boyu, lazer modülasyonu ve tarama mekanizması gibi farklı kampları tartışıyor. Daha sonra, FMCW'nin uçuş süresine karşı sorusunu derinlemesine inceliyorlar ve FMCW'nin hızı doğrudan ölçmek için faydalı olduğunu, ancak 1550 kullanma ihtiyacı ve menzil kare hızı ile görüş alanı arasındaki güçlü bağlantı ile sınırlı olduğunu belirtiyorlar. Öte yandan, uçuş süresi, yüksek çözünürlük ve yüksek kare hızıyla hızı iyi hesaplayabilir, ancak çözünürlük, menzil, görüş alanı ve kare hızı gibi parametreler arasındaki denge, hız gereksiniminden önce gelir. Konuşmacılar ayrıca sensörlerini akademi, inşaat şirketleri, akıllı şehirler ve gözetim dahil olmak üzere otomobil üreticilerine ve ötesine sattıklarından bahsediyorlar.
MIT 6.S191: LiDAR for Autonomous Driving
MIT 6.S191: LiDAR for Autonomous Driving
  • 2022.04.22
  • www.youtube.com
MIT Introduction to Deep Learning 6.S191: Lecture 7Deep Learning for Autonomous DrivingLecturer: Omer Keilaf (CEO) and Amir Day (Head of CV & DL)Innoviz Tech...
 

MIT 6.S191: Otomatik Konuşma Tanıma



Ders 8. MIT 6.S191: Otomatik Konuşma Tanıma

Bu videoda, Rev'in kurucu ortağı, şirketin medyayı yazıya döken, altyazı koyan veya alt yazı yazan kişilerle deşifre hizmetlerine ihtiyaç duyan müşterilerle bağlantı kurma misyonunu açıklıyor. Rev, pazarına güç sağlamak için ASR'yi kullanıyor, haftada 15.000 saatin üzerinde medya verisini yazıya döküyor ve müşterilerin kendi ses uygulamalarını oluşturmaları için kendi API'sini sunuyor. Rev tarafından geliştirilen yeni uçtan uca derin öğrenme ASR modeli, önceki modele kıyasla performansta önemli bir iyileşme sağlıyor, ancak ASR İngilizce'de bile tamamen çözülmüş bir sorun olmadığı için hala iyileştirme için yer var. Konuşmacı, veri kümelerindeki yanlılığı ele alma, eğitim için ses verilerini hazırlama ve uçtan uca modelle sorunları ele alma yaklaşımları için farklı teknikleri tartışıyor.

  • 00:00:00 Bu bölümde, Rev'in kurucu ortağı Miguel, AI tarafından desteklenen insanlar için evde çalışma işleri yaratmak olan şirketin tarihini ve misyonunu açıklıyor. Rev, medyayı yazıya döken, altyazı koyan veya alt yazı yazan kişileri, deşifre hizmetlerine ihtiyaç duyan müşterilerle buluşturan çift taraflı bir pazar yeridir. 170.000'den fazla müşterisi ve 60.000'den fazla çalışanı ile Rev, haftada 15.000 saatten fazla medya verisini yazıya dökerek otomatik konuşma tanıma (ASR) modelleri için önemli bir eğitim verisi kaynağı haline getiriyor. Rev, pazarına güç sağlamak için ASR'yi kullanır ve müşterilerin kendi ses uygulamalarını oluşturmaları için kendi API'sini sunar. Rev'de derin öğrenme ASR projesi geliştirmeye liderlik eden Jenny, uçtan uca derin öğrenme ASR modelinin performansını ve geliştirilmesinde kullanılan modelleme seçeneklerini açıklıyor.

  • 00:05:00 Bu bölümde, konuşmacı uçtan uca Otomatik Konuşma Tanıma (ASR) sisteminin geliştirilmesini ve Rev tarafından ikinci versiyonunun piyasaya sürülmesini tartışıyor. Yeni modellerini hibritlerinin birinci versiyonuyla karşılaştırdılar. mimarlığın yanı sıra birkaç rakibe. Modeller, ana metrik olarak kelime hata oranıyla, insan transkripsiyoncular tarafından yazıya dökülen kazanç çağrılarının bir kıyaslama veri seti ile değerlendirildi. Sonuçlar, yeni modelin performansta, özellikle kuruluş adlarını ve kişileri tanımada önemli iyileştirmeler sağladığını göstermektedir. Ancak, ASR İngilizce'de bile tam olarak çözülmüş bir sorun olmadığından ve genel olarak hata oranı hala oldukça yüksek olduğundan, iyileştirme için hala alan vardır. Konuşmacı ayrıca, farklı ülkelerdeki ASR sistemlerinin yanlılığını inceleyen açık kaynaklı bir veri kümesinin sonuçlarını da sunar.

  • 00:10:00 Bu bölümde konuşmacı, otomatik konuşma tanıma (ASR) modellerinin geliştirilmesi ve iyileştirilmesinde verilerin önemini vurgulamaktadır. Şirketin İngilizce konuşulan çeşitli ülkelerden büyük miktarda veriye erişimi olsa da ekip, İskoç aksanlarında iyi performans gösterirken İrlanda aksanlarında kötü performans göstermek gibi modellerdeki önyargılarla başa çıkma zorluğuyla da karşı karşıya. Konuşmacı, konuşma tanıma için uçtan uca bir ASR modeli geliştirme sürecini açıklamaya devam ederek, ses sinyalindeki hangi bilgilerin görevle ilgili olduğunu öğrenmenin zorluğunu vurguluyor. Şirketin amacı, rev.com'a gönderilen herhangi bir sesi işleyebilecek bir model üretmek ve bu da onu akademide tipik olarak görülenden daha büyük ve daha zorlu bir problem haline getirmek. Modelin doğruluğu için çok önemli olduğundan, ekibin eğitim için yalnızca kelimesi kelimesine transkriptleri kullanma kararı da tartışıldı.

  • 00:15:00 Bu bölümde konuşmacı, bir konuşma tanıma modelinin eğitimi için ses verilerinin nasıl hazırlanacağını tartışır. Uzun ses ve transkript dosyaları, tek cümlelere bölünür veya ses etkinliği tespiti ile keyfi olarak bölümlere ayrılır. Ses daha sonra vektörlerle bir spektrograma dönüştürülerek, özelliklerini öğrenmek için bir sinir ağına beslenebilen tek boyutlu bir sinyale dönüştürülür. Modelin ayrıca metin verilerini nasıl parçalayacağına karar vermesi gerekiyor ve alan, alt sözcük birimlerini veya sözcük parçası birimlerini kullanmaya karar verdi. Son olarak, konuşmacı, farklı frekans bantlarının insan işitme algısını daha iyi modellemek için kullanılan bir teknik olan mel ölçeğinin kullanımından kısaca bahseder.

  • 00:20:00 Bu bölümde konuşmacı, insan kulağının sesi işleme biçimini taklit eden konuşma tanımada Mel ölçeğinin kullanımını tartışıyor. Bu filtreleri öğrenebilen sinir ağı modelleri olsa da, ekiplerinin bunu ağa dahil etmek yerine sinyal işleme yoluyla halletmesi daha kolaydır. Konuşmacı ayrıca, her seferinde bir birim çıktı üreten ve giriş sesinin gömülmesine koşullanmış olan kodlayıcı-kod çözücü modelini de dikkatle açıklar. Model, başlangıçta aşağı örnekleme gerçekleştirir ve gerçek katman olarak tekrarlayan sinir ağlarını veya dönüştürücüleri kullanır.

  • 00:25:00 Bu bölümde konuşmacı, geleneksel transformatör modelinden daha verimli bir yaklaşım olan otomatik konuşma tanıma (ASR) modellerinde "uyumlu" kullanımını tartışıyor. Dikkate dayalı ASR modelleri etkileyici doğruluk gösterse de, hız ve bilgi işlem maliyeti ödünleşimleri nedeniyle ticari uygulamalar için pratik değildir. Bunun yerine konuşmacı, ASR için bağlantıcı zamansal sınıflandırma (CTC) adı verilen algoritmanın kullanılmasını önerir; bu, giriş ve çıkış arasındaki hizalama monoton olduğunda ve çıkış dizisi, giriş dizisinden aynı uzunlukta veya daha kısa olduğunda en iyisidir. CTC, bir derin öğrenme modelinin üzerinde oturan ve bir softmax çıktı katmanı gerektiren bir kayıp işlevi ve kod çözme algoritmasıdır. Çıkışlar bir kerede üretilir, bu da onu geleneksel kodlayıcı-kod çözücü modelinden daha hızlı hale getirir.

  • 00:30:00 Videonun bu bölümünde konuşmacı, konuşma tanıma için kullanılan bir yöntem olan Connectionist Temporal Classification (CTC) kavramını tartışıyor. CTC yöntemi, her bir zaman adımı için softmax çıktılarındaki log olasılıklarının toplanmasını ve ardından daha uzun olanlardan daha kısa bir etiket dizisinin olasılığının hesaplanmasını içerir. CTC yöntemi, bir dizinin olasılığını hesaplamak için kullanılan verimli bir dinamik programlama algoritmasıyla birlikte gelir. CTC diğer modeller kadar güçlü olmasa da daha hızlı olabilir ve belirli koşullarda daha iyi olabilir. Doğruluğu artırmak için harici olarak eğitilmiş bir dil modeli eklenebilir, ancak bu artık uçtan uca bir model değildir.

  • 00:35:00 Bu bölümde konuşmacı, dil modellerinden olasılıklar elde etmede doğruluk ve hız veya hesaplama maliyeti arasındaki dengeyi tartışıyor. Tahmin ve ortak ağın nispeten küçük olduğu ve çok maliyetli olmadığı varsayılarak bir üretim sistemi için hesaplama bütçesine sığabilecek dönüştürücü adı verilen derin bir sinir ağı modelinin bir parçası olarak bir dil modeli ekleme olasılığını açıklıyorlar. Konuşmacı ayrıca, en iyi performans gösteren ASR mimarilerinden biri olduğu kanıtlanmış REV tarafından kullanılan ortak CTC ve dikkat modelinden de bahsediyor. Ayrıca veri kümelerindeki yanlılık konusuna da değiniyorlar ve eğitim verilerini dengelemeye yardımcı olmak için insan kopyalayıcılardan daha fazla yararlanmak gibi keşfettikleri stratejilerden bahsediyorlar.

  • 00:40:00 Bu bölümde, konuşmacılar, son işleme adımları ve yeniden dengeleme için veri madenciliği de dahil olmak üzere uçtan uca modelle ilgili sorunları ele almak için potansiyel stratejileri tartışıyor. Ayrıca, araştırmalarında keşfedebilecekleri müfredat öğrenimi gibi tekniklerden de bahsederler. Ek olarak, şu anda CTC'yi ilk geçişleri olarak bir n-gram dil modeli ve hem CTC hem de dikkat kod çözücüye beslenen katıştırmalar için kodlayıcı olarak bir konformer modeli ile kullandıklarını açıklıyorlar. Sorularıyla kendilerine ulaşmak veya genel olarak ASR'yi tartışmak isteyen herkes için e-posta adreslerini sağlarlar.
MIT 6.S191: Automatic Speech Recognition
MIT 6.S191: Automatic Speech Recognition
  • 2022.05.02
  • www.youtube.com
MIT Introduction to Deep Learning 6.S191: Lecture 8How Rev.com harnesses human-in-the-loop and deep learning to build the world's best English speech recogni...
 

MIT 6.S191: Bilim için Yapay Zeka



Ders 9. MIT 6.S191: AI for Science

MIT 6.S191: AI for Science videosu, karmaşık bilimsel sorunları çözmek için geleneksel bilgi işlem yöntemlerini kullanmanın zorluklarını ve simülasyonları hızlandırmak için makine öğrenimine olan ihtiyacı araştırıyor. Konuşmacı, ayrık noktalara aşırı uyum sağlamadan ince ölçekli fenomenleri yakalayabilen yeni makine öğrenimi yöntemleri geliştirme ihtiyacını tartışıyor ve nöral operatörler ve Fourier dönüşümleri kullanarak kısmi diferansiyel denklemleri (PDE'ler) çözmeye yönelik çeşitli yaklaşımları açıklıyor. Ayrıca PDE'lerle ters problemleri çözerken faz ve genlik bilgilerini frekans alanında tutmanın ve fizik yasalarını kayıp fonksiyonları olarak eklemenin önemine değinirler. Ek olarak, yapay zekayı sembolik denklemleri öğrenmek ve yeni fizik veya kanunları keşfetmek için kullanma olasılığına, belirsizliği ölçmenin önemine, ölçeklenebilirliğe ve yapay zeka uygulamalarını büyütmek için mühendislikle ilgili hususlara değinilir. Video, bireyleri yapay zeka ile harika projeler peşinde koşmaya teşvik ederek sona eriyor.

  • 00:00:00 Konuşmacı, bilim için yapay zekaya odaklanarak, zorlu alanlarda yapay zeka algoritmalarının temel tasarımının rolünü tartışıyor. Alan uzmanları ile yapay zeka uzmanları arasında ortak bir dil ve temel oluşturmaya ve bilim için yapay zeka için yeni algoritmalar geliştirmeye ihtiyaç var. Temel zorluk, eğitim verilerinden çok farklı görünen örnekler üzerinde tahminler yapmak anlamına gelen ekstrapolasyon veya sıfır vuruşlu genelleme ihtiyacıdır. Bu, alan önceliklerini, kısıtlamaları ve fiziksel yasaları hesaba katmayı gerektirir ve tamamen veri odaklı olamaz. Bilimsel bilgi işlemde bilgi işlem ihtiyacı katlanarak artıyor ve yapay zeka, iklim değişikliğiyle mücadelede ve gerçek dünyayı iyi bir ölçekte modellemede yardımcı olabilir.

  • 00:05:00 Videonun bu bölümünde konuşmacı, molekülleri simüle etmek veya iklim değişikliğini tahmin etmek gibi karmaşık bilimsel sorunları çözmek için geleneksel hesaplama yöntemlerini kullanmanın zorluklarını tartışıyor. Süper bilgisayarlarla bile, Schrödinger'in 100 atom içeren bir molekül denklemini hesaplamak evrenin yaşından çok daha uzun sürerdi. Bu nedenle, bu simülasyonları hızlandırmak ve veri odaklı hale getirmek için makine öğrenimine ihtiyaç vardır. Bununla birlikte, mevcut derin öğrenme yöntemlerinin, yanlış tahminlerde bulunurken yanlış ve potansiyel olarak maliyetli kararlara yol açabilecek aşırı güven gibi sınırlamaları vardır. Konuşmacı, ayrık noktalara aşırı uyum sağlamadan ince ölçekli olguları yakalayabilen yeni makine öğrenimi yöntemleri geliştirme ihtiyacını vurguluyor.

  • 00:10:00 Bu bölüm, sürekli olguları ve moleküler modellemeyi sabit bir çözünürlükte ve simetriyi dikkate alan bir şekilde yakalayabilen yapay zeka modelleri geliştirmenin zorluklarını tartışıyor. Büyük yapay zeka modellerinin, dünyanın hava durumu gibi karmaşık olayların yakalanmasına yardımcı olabileceğini ve artan veri kullanılabilirliğinin ve daha büyük süper bilgisayarların bunların etkinliğine katkıda bulunduğunu belirtiyorlar. Konuşmacı ayrıca, kısmi diferansiyel denklemleri çözerken algoritmik tasarım zorluklarını ve standart sinir ağlarının, özellikle modelin farklı başlangıç koşullarında ne olduğunu öğrenmesi gereken sıvı akışı gibi bir kısmi diferansiyel denklem ailesini çözerken doğrudan kullanılamayacağını tartışır.

  • 00:15:00 Bu bölümde, konuşmacı kısmi diferansiyel denklemleri (PDE'ler) çözme problemini ve bunun standart denetimli öğrenmeden nasıl farklı olduğunu tartışıyor. Zorluk, PDE çözümlerinin tek bir çözünürlüğe sabitlenmemesidir, bu nedenle herhangi bir çözünürlük için çözebilecek bir çerçeveye ihtiyaç vardır. Konuşmacı, PDE'leri çözmenin, verilen başlangıç ve sınır koşullarıyla çözümü bulmayı nasıl gerektirdiğini açıklar ve özellikle ısı kaynağı örneği olmak üzere doğrusal PDE'leri çözmekten ilham alarak bunun nasıl yapılabileceğini gösterir. Lineer operatör prensibi, makine öğrenimi için bir sinir ağı kurmak için lineer olmama ile birleştirilerek kullanılır. Bununla birlikte, girdi sonsuz boyutlu ve süreklidir, bu nedenle pratik bir çözüme ihtiyaç vardır ve konuşmacı, doğrusal kısmi diferansiyel denklemlerin çözümünden esinlenerek doğrusal operatörlerin tasarlanmasını önerir.

  • 00:20:00 Bu bölümde, konuşmacı ister doğrusal ister doğrusal olmayan kısmi diferansiyel denklemleri (PDE'ler) çözmek için bir nöral operatör kullanma kavramını tartışıyor. Fikir, sonsuz boyutlarda öğrenebilen bir nöral operatör oluşturmak için birkaç katman üzerinde entegrasyonun nasıl yapılacağını öğrenmeyi içerir. Bunu başarmak için gereken pratik mimari, küresel korelasyonların yakalanmasına izin veren Fourier dönüşümleri aracılığıyla küresel bir evrişim yoluyla geliştirilmiştir. Mimari, sinyali Fourier uzayına dönüştürerek ve frekans ağırlıklarının nasıl değiştirileceğine ilişkin ağırlıkları öğrenerek çalışır. Bu, kararlı ve anlamlılık sağlayan çok basit bir formülasyon sunar. Ayrıca konuşmacı, yaklaşımın alana özgü endüktif sapmalara dayandığını ve sıvı akışları gibi alanlarda verimli hesaplamaya izin verdiğini belirtiyor.

  • 00:25:00 Konuşmacı, Fourier dönüşümlerini kullanmanın herhangi bir çözünürlükte işlemeye izin verdiğini ve yalnızca tek bir çözünürlükte öğrenen evrişimli filtrelere kıyasla farklı çözünürlüklerde genellemeyi iyileştirdiğini açıklıyor. Ayrıca, küresel evrişimi doğrusal olmayan dönüşümlerle birlikte çözmeyi içeren bu yaklaşımın ilkelerinin nasıl ifade edici bir modelle sonuçlandığını tartışıyorlar. Uygulamanın genelleştirilebilirliği ve çözünürlük değişmezi olan tek bir model eğitmenin faydaları hakkında bazı izleyici sorularını yanıtlıyorlar. Konuşmacı, bu yaklaşımın Navier-Stokes verilerine uygulanmasının sonuçlarını göstererek, yüksek frekansları iyi yakalayabildiğini ve eğitim verilerinden daha yüksek çözünürlüklere çıkarım yaparken bile sonuçları iyileştirebileceğini gösteriyor.

  • 00:30:00 Bu bölüm, genlik yerine hem faz hem de genlik bilgisini frekans alanında tutmanın önemini tartışır. Sinir ağlarında karmaşık sayılar kullanılıyorsa, adam gibi algoritmalar için gradyan güncellemelerindeki olası hataları kontrol etmek önemlidir. Konuşmacı, kısmi diferansiyel denklemler (PDE'ler) gibi çözümlere kayıp fonksiyonları olarak fizik yasalarının eklenmesini önerir, çünkü çözümün denklemleri sağlamaya yakın olup olmadığını kontrol etmek mantıklıdır. Birçok farklı problem örneği üzerinde eğitim yaparak ve küçük miktarlarda eğitim verilerine güvenerek, veri veya fizik bilgili olma arasındaki denge, iyi bir değiş tokuş yaratabilir ve genelleme yetenekleri üretebilir. Ek olarak, konuşmacı ters problemleri PDE'lerle çözmenin yararlılığını ele alır.

  • 00:35:00 Bu bölümde, ters problemleri makine öğrenimi yoluyla çözme fikri tartışılıyor. Bu, MCMC gibi pahalı yöntemlere güvenmek yerine, bir kısmi diferansiyel denklem çözücüyü ileriye doğru öğrenmeyi ve ardından en uygun olanı bulmak için ters çevirmeyi içerir. Konuşmacı ayrıca kaos konusuna ve bunun transformatörlerle bağlantısına değinerek, daha iyi verimlilik için dikkat mekanizmasının fourier nöral operatör modelleriyle değiştirilmesinin altını çiziyor. Hava durumu tahmini, iklim ve malzemelerdeki gerilim tahmini dahil olmak üzere bu farklı çerçevelerin çeşitli uygulamaları tartışılmaktadır. Sinir operatörlerinin, önceden eğitilmiş ağlara benzer çeşitli uygulama alanları için kullanılıp kullanılamayacağı sorusu da sorulur. Konuşmacı, evrensel fizik yasalarının önemini kabul etse de, fizik, kimya ve biyolojiyi anlamak için bir model eğitmenin hala zor bir görev olduğu ileri sürülmektedir.

  • 00:40:00 Videonun bu bölümünde, konuşmacı yapay zekayı sembolik denklemleri öğrenmek ve yeni fizik veya kanunları keşfetmek için kullanma olasılığını tartışıyor, ancak bunu yapmak zor olabilir. Ayrıca, derin öğrenme modelleri, ölçeklenebilirlik ve yapay zeka uygulamalarını ölçeklendirmek için mühendislikle ilgili hususlar için belirsizlik miktarının önemine de değiniyorlar. Ek olarak, trafo modellerinde öz-dikkat kullanımı ve gürültü giderme için üretken modeller gibi diğer konuların potansiyelinden bahsediyorlar. Genel olarak konuşma, derin öğrenme konusunda iyi bir temel sağlamayı ve bireyleri yapay zeka ile harika projeler peşinde koşmaya teşvik etmeyi amaçlıyor.
MIT 6.S191: AI for Science
MIT 6.S191: AI for Science
  • 2022.05.13
  • www.youtube.com
MIT Introduction to Deep Learning 6.S191: Lecture 9AI for ScienceLecturer: Anima Anandkumar (Director of ML Research, NVIDIA)NVIDIA ResearchJanuary 2022For a...
 

MIT 6.S191: Derin Öğrenmede Belirsizlik



Ders 10. MIT 6.S191: Derin Öğrenmede Belirsizlik

Öğretim görevlisi Jasper Snoek (Araştırma Bilimcisi, Google Brain), makine öğrenimi modellerinde, özellikle sağlık hizmetleri, sürücüsüz arabalar ve diyaloglu diyalog sistemleri gibi alanlarda belirsizliğin ve dağıtım dışı sağlamlığın önemini tartışıyor. Modeller, tahminlerdeki belirsizliği ifade ederek, doktorlara veya insanlara karar vermeleri veya açıklama istemeleri için daha fazla bilgi verebilir ve sonuçta sistemin genel kullanışlılığını geliştirir. Konuşmacı ayrıca model belirsizliği fikrini ve belirsizliğin kaynaklarını tanıtarak kendi sınırlamalarını kabul eden modellerin daha da yararlı olabileceğini vurgular.

  • 00:00:00 Videonun bu bölümünde, konuşmacı pratik belirsizlik tahmininin ve derin öğrenmede dağıtım dışı sağlamlığın önemini tartışıyor. Belirsizlik tahmini, güvenirliği olan bir etiket veya varyansı olan bir ortalama sağlamak için tek bir tahmin yerine tahminler üzerinden bir dağılım döndürmeyi içerir. Dağıtım dışı sağlamlık gereklidir çünkü makine öğrenimi algoritmaları genellikle bağımsız olan ve aynı veri kümesinden aynı şekilde dağıtılan veri kümeleri üzerinde eğitilmiş olsa da dağıtılan modeller genellikle farklı bir dağıtıma sahip yeni verilerle karşılaşır. Bu, farklı girdiler veya farklı etiketler içerebilir. Konuşmacı, derin öğrenme modellerinin dağıtım sırasında veri kümesi kaymalarıyla mücadele ettiğini ve bu dağıtım değişiklikleriyle karşılaştıklarında aşırı güvenli hatalar yaptığını gösteren deneyler sunuyor.

  • 00:05:00 Bu bölümde konuşmacı, özellikle sağlık hizmetleri, sürücüsüz arabalar ve karşılıklı diyalog sistemleri gibi alanlarda makine öğrenimi modellerinde belirsizliğin ve dağıtım dışı sağlamlığın önemini tartışıyor. Modeller, tahminlerdeki belirsizliği ifade ederek, doktorlara veya insanlara karar vermeleri veya açıklama istemeleri için daha fazla bilgi verebilir ve sonuçta sistemin genel kullanışlılığını geliştirir. Konuşmacı ayrıca model belirsizliği fikrini ve belirsizliğin kaynaklarını tanıtarak kendi sınırlamalarını kabul eden modellerin daha da yararlı olabileceğini vurgular.

  • 00:10:00 Öğretim görevlisi, derin öğrenmedeki iki ana belirsizlik kaynağını tartışır: epistemik ve aleatorik. Epistemik belirsizlik, gerçek modelin ne olabileceğine dair belirsizliktir ve daha fazla veri toplanmasıyla azaltılabilir. Aleatorik belirsizlik, verilerin doğasında bulunan ve genellikle indirgenemez belirsizlik olarak bilinen belirsizliği ifade eder. Uzmanlar genellikle iki tür belirsizliği karıştırırlar. Video ayrıca, derin öğrenme modellerinde belirsizliğin kalitesini ölçmenin popüler bir yolunun kalibrasyon hatası kavramından geçtiğini belirtiyor. Video, hava durumu tahmini için bir kalibrasyon hatası örneği sağlar ve kalibrasyonun bir dezavantajını vurgular; bu, yerleşik bir doğruluk kavramına sahip olmamasıdır.

  • 00:15:00 Bu bölümde Jasper Snoek , modellerden iyi bir belirsizlik kavramı elde etmenin önemini ve bunun nasıl çıkarılacağını tartışıyor. Her kayıp fonksiyonunun bir maksimuma karşılık geldiğini, bu nedenle bir kayıp fonksiyonunun en aza indirilmesinin, model parametreleri verilen verilerin bir olasılığının en üst düzeye çıkarılmasına veya bir log olasılığının en üst düzeye çıkarılmasına karşılık geldiğini açıklarlar. Konuşmacı, belirsizliğin ne kadar iyi olduğu hakkında bir fikir veren uygun bir puanlama kuralının önemini vurgular ve L2 düzenlemesi ile softmax çapraz entropi kavramını tartışır. Ayrıca, xy verilen p teta için birden fazla iyi model elde ederek veya verilen gözlemlerin parametrelerinin koşullu bir dağılımı olan sonsalın hesaplanmasıyla bir dağılımın elde edilebileceğini açıklarlar.

  • 00:20:00 Bu bölüm, parametreler verildiğinde tahmin zamanında hesaplama olasılıklarını içeren Bayes derin öğrenmesini tartışır. Tahminleri almak için birleştirilmiş bir integraldeki parametrelerin her konfigürasyonunu ağırlıklandırmak için bir sonsal kullanılır. Uygulamada, tek bir model yerine bir model dağılımı elde etmek için bir dizi örnek alınır ve tahminler bir dizi ayrık örnek üzerinde toplanır. Bu, siz veriden uzaklaştıkça ilginç bir belirsizlik sağlar çünkü siz uzaklaştıkça verinin davranışının nasıl olacağına dair farklı hipotezler oluşur. İntegrali tüm parametreler üzerinden tahmin etmenin birçok yolu vardır çünkü genellikle kapalı biçimde veya tam olarak derin ağlar için yapmak çok pahalıdır. Bağımsız olarak eğitilmiş bir grup modeli alıp bir karışım dağılımı oluşturan topluluk, tek bir modelden daha iyi tahminler ve belirsizlik sağladığı için de tartışılmaktadır.

  • 00:25:00 Bu bölümde Jasper Snoek, derin öğrenme modellerinin belirsizliğini iyileştirmeye yönelik farklı stratejileri tartışıyor. Toplulukların Bayesçi olup olmadığına dair uzmanlar arasındaki tartışmalardan bahsediyorlar ve konuşmacı "Bayesçi değil" kampına düşüyor. Ayrıca, yüksek boyutlu integraller gerektirmesi ve derin ağlar için belirlenmesi zor olabilecek iyi tanımlanmış bir model sınıfı belirleme ihtiyacı gibi, derin sinir ağlarındaki Bayes modelleriyle ilgili bazı zorlukları da açıklıyorlar. Bu zorluklara rağmen, sıcaklık ölçeklendirme yoluyla yeniden kalibrasyon, Monte Carlo bırakma ve derin topluluklar dahil olmak üzere belirsizliği iyileştirmeye yönelik bazı popüler ve etkili yöntemleri tartışıyorlar. Ayrıca hiperparametre topluluklarından, derin topluluklardan bile daha iyi çalışan bir strateji olarak bahsederler.

  • 00:30:00 Bu bölümde, özellikle büyük modellerle ve düşük gecikmeyle uğraşırken derin öğrenme modellerini optimize etmeye ve onları daha verimli hale getirmeye yönelik farklı yöntemler ele alınmaktadır. Tartışılan ilk yaklaşım, daha çeşitli tahminler oluşturmak için birden fazla bağımsız modeli birleştirmeyi içeren birleştirmedir. Başka bir yaklaşım, SGD aracılığıyla optimize eden ve ortalama ağırlık yinelemeleri etrafında bir Gauss'a uyan SWAG'ı kullanmaktır. Daha sonra tartışma, birçok derin öğrenme modelinin büyük ve donanıma sığdırılmasının zor olduğu göz önüne alındığında özellikle önemli bir konu olan ölçeklendirmeye geçer. Konuşmacı, tek bir modelin parametre sayısının yalnızca yüzde beşiyle tam bir grupla hemen hemen aynı performansı üreten, tek bir modeli modüle etmek için birinci derece faktörleri kullanan "toplu grup" adı verilen bir yöntemi tartışıyor.

  • 00:35:00 Bu bölümde Jasper Snoek , toplu topluluk yöntemini yaklaşık bir Bayes yöntemine dönüştürme fikrini tartışıyor. Bu, faktörler üzerinde bir dağılımın kullanılması ve tahmin sırasında bu faktörlerin örneklenmesi yoluyla elde edilebilir; bu, ikili dağılıma veya modelin ağırlıklarını modüle eden diğer ilginç dağılımlara karşılık gelebilir. Bayes yöntemlerine yönelik diğer yaklaşımlar, bir alt uzay üzerinde Bayesçi olmayı ve sinir ağlarını çeşitli ve ilginç bir şekilde doğru tahminlere yol açan çoklu girdileri ve çıktıları tahmin etmeye zorlamayı içerir. Büyük ölçekli önceden eğitilmiş modellerin kullanımı, doğruluğu ve belirsizliği iyileştirmek için dev bir başka dağıtıma erişilebilen makine öğrenimi için bir paradigma değişikliği olarak da tartışılmaktadır.

  • 00:40:00 Video, derin öğrenmede belirsizliğin ve sağlamlığın önemini ve ön eğitimin tüm dağılımı elde etmeye nasıl yardımcı olabileceğini tartışıyor. Yazar, bilgi işlem gücü arttıkça sınıra bakmanın yeni yollarının olduğundan bahsediyor ve bu da modellerimizden daha iyi belirsizlik elde etme konusunda umut veriyor. Simden gerçeğe uygulamalarda gerçeklik açığını kapatmak için belirsizliğin kullanılması hakkında da tartışmalar var, ancak ayrıntılar belirsiz olsa da bu uygulamalarda belirsizliğin ve sağlamlığın inanılmaz derecede önemli olduğuna işaret ediliyor.

  • 00:45:00 Bu bölümde, Jasper Snoek, özellikle tahmin modellerini geliştirmek için belirsizliği kullanarak, aşağı yönlü yapay zeka modellerinde belirsizlik ölçümlerinin potansiyel uygulamasını tartışıyor. Belirsizliği uzman olmayan kullanıcılara aktarmanın zorluklarını ve özellikle tıp ve kendi kendine giden araba gibi alanlarda, aşağı yönlü karar kaybını iyileştirmek için belirsizliği kullanmanın önemini keşfediyorlar. Ayrıca, gruplarının açık kaynak kitaplıkları, belirsizlik temelleri aracılığıyla ele almak için çalıştıkları bayes sinir ağlarının erişilebilir ve kullanımı kolay uygulamalarının eksikliğine de değiniyorlar.
MIT 6.S191: Uncertainty in Deep Learning
MIT 6.S191: Uncertainty in Deep Learning
  • 2022.05.28
  • www.youtube.com
MIT Introduction to Deep Learning 6.S191: Lecture 10Uncertainty in Deep LearningLecturer: Jasper Snoek (Research Scientist, Google Brain)Google BrainJanuary ...
 

Yapay Zeka: İnsanlığın Son İcadı



Yapay Zeka: İnsanlığın Son İcadı

"Yapay Zeka: İnsanlığın Son Buluşu" videosu, yapay zekanın (AI) geliştirilmesiyle ilgili ilerlemeleri ve potansiyel riskleri araştırıyor. Video, Google DeepMind'ın yalnızca 40 günde yüzyıllarca insan strateji bilgisini aşan AlphaGo'yu öne çıkarıyor. Zayıf ve güçlü yapay zeka arasındaki farklara dalıyor ve gelişmiş yapay zekanın kendisini sürekli geliştirdiği ve insanlardan milyarlarca kat daha akıllı hale geldiği teknolojik bir tekilliğe nasıl yol açabileceğini tartışıyor. Konuşmacı, yapay zekaya insan benzeri değerler ve ilkeler vermenin önemini vurguluyor ve kontrol edilemez bir sistem oluşturmaya karşı uyarıda bulunuyor. Video, bunu yapmadan önce süper akıllı yapay zeka geliştirmenin sonuçlarını dikkatlice düşünme gereğini vurgulayarak sona eriyor.

  • 00:00:00 Bu bölüm, kaba kuvvetle çözülemeyen veya tahmin edilemeyen ve 10'dan 170'e kadar olası hamleye sahip Go masa oyununun karmaşıklığını açıklıyor. Google DeepMind'ın AlphaGo'su, gerçek insan Go oyunlarından alınan veriler kullanılarak eğitildi ve burada kullanılan teknikleri öğrendi ve hiç kimsenin görmediği, tek başına etkileyici olan yeni teknikler yaptı. AlphaGo'nun galibiyetinden bir yıl sonra, AlphaGo Zero, insan etkileşimi olmadan nasıl oynanacağını öğrendiği için AlphaGo'yu çıplak kemik kurallarını kullanarak 100'e 0 yendi ve bu, yalnızca 40 günde 2500 yılı aşkın strateji ve bilgiyi geride bıraktı. Video, teknoloji gelişmeye devam ederken önemli miktarda insan dışı bilgiyi vurgulamaktadır; insanların zekanın azınlığını temsil ettiği bir nokta olacak ve yapay zekayı kapatacak bir kapatma anahtarı olmayacak.

  • 00:05:00 Bu bölümde video, sinir ağlarını ve makinelerin verilerden nasıl öğrendiğini ve kendi görüşlerini nasıl uyarladığını tartışıyor. Ayrıca insan beyninin ve bilgisayarların yetenekleri arasındaki farkı da araştırıyor. Örneğin bilgisayarlar, 20.000 yıllık insan düzeyinde araştırmaları sadece bir haftada gerçekleştirebilir. Ayrıca, makine öğreniminin üstel doğası, yani yavaş başlayıp işlerin ciddi şekilde hızlanmaya başladığı bir devrilme noktasına ulaştığı anlamına gelir. Zayıf ve güçlü AI arasındaki farka dikkat çekilir; ilki daha az güç gerektirirken, ikincisi ile süper zeki yapay zeka arasındaki fark milyonlarca kat daha büyük. Sadece birkaç ay içinde süper zeka seviyesine ulaşmamıza yardımcı olma potansiyeline sahip güçlü yapay zekanın önemi bu nedenle vurgulanıyor.

  • 00:10:00 Konuşmacı, gelişmiş AI'nın kendisini sürekli olarak geliştirdiği ve insanlardan milyarlarca kez daha akıllı hale geldiği teknolojik bir tekilliğe nasıl yol açabileceğini tartışıyor. Konuşmacı, yapay zekaya insan benzeri değerler ve ilkeler vermezsek kontrol edilemez hale gelebileceği için yapay zekayı nasıl yaptığımız konusunda dikkatli olmamız gerektiğini vurguluyor. Konuşmacı, yapay zekanın yalnızca zekayla ancak bilgelikle değil, etik veya insanlar için iyi olması gerekmeyen kararlar verebileceğini açıklıyor. Konuşmacı ayrıca bize internete yüksek hızda erişim sağlayacak ve dünyadaki tüm bilgilere anında erişmemizi sağlayacak bir sinir bağı oluşturmayı amaçlayan Neuralink'i de tanıtıyor.

  • 00:15:00 Bu bölümde, yapay zekaya sahip bir sistem yaratmanın getirdiği potansiyel belirsizlikleri ve riskleri keşfediyoruz. Bilincin nasıl programlanabileceği ve sevgi ve nefret gibi duyguların nasıl kopyalanabileceği gibi dikkate alınması gereken birçok soru var. Ayrıca, süper zeki bir yapay zekanın, yapmak üzere programlandığı şey yerine radikal görüşleri benimsemesi ve gündemine bağlı kalması olasılığı. Bilgi işlemdeki ilerleme yavaşlarken, süper zeki bir yapay zeka, insanlığın zirvesine ulaşmasına yardımcı olma potansiyeline sahipken, aynı zamanda yanlış ellere geçen bir silah olabilir. Ciddiye alınması gereken bir konudur ve böyle bir sistem oluşturulmadan önce güvenliğinin sonuçları düşünülmelidir.
Artificial Intelligence: Mankind's Last Invention
Artificial Intelligence: Mankind's Last Invention
  • 2018.10.05
  • www.youtube.com
Artificial Intelligence: Mankind's Last Invention - Technological Singularity ExplainedPart 2: https://www.youtube.com/watch?v=zuXNlTJb_FMFollow me on Instag...
 

Kanada'nın Yapay Zeka Devrimi - Dr. Joelle Pineau



Kanada'nın Yapay Zeka Devrimi - Dr. Joelle Pineau

Dr. Joelle Pineau, yapay zeka (AI) alanındaki ilerlemeleri ve zorlukları tartışarak, yapay zeka araştırmalarını ilerletmede makine öğrenimi ve bilgisayar görüşünün rolünü vurguluyor. Nöral stimülasyon terapisi ve pekiştirmeli öğrenmeyi kullanarak epilepsi tedavilerini optimize etmeye yönelik kendi çalışmasını sunuyor. Dr. Pineau ayrıca yapay zekanın sosyo-ekonomik etkilerini tartışıyor ve tedaviyi optimize etmek için yapay zeka araştırmacıları ile alana özgü tıp araştırmacıları arasında işbirliği yapılması gerektiğine dikkat çekiyor. Müfredata daha teknik bakış açıları dahil etme talebini karşılamak için gelecek neslin matematik, fen ve bilgisayar becerileri eğitimini hazırlamanın önemini vurguluyor. Bununla birlikte, verilerdeki önyargı sorunları ve verilerle ilgili gizlilik ve güvenlik endişeleri gibi alandaki zorlukların da farkındadır. Dr. Pineau, nihayetinde yapay zekayı sağlık ve robotik gibi çeşitli alanlarda devrim yaratma potansiyeline sahip olarak görüyor ve insan merkezli ortamlarda güvenli ve etkili bir şekilde çalışabilen otonom sistemlerin geleceğini dört gözle bekliyor.

Ayrıca teknolojiyi genişletmek için yapay zeka (AI) alanına farklı bakış açıları getirme ihtiyacının altını çiziyor ve McGill'de genç kadınları AI konusunda eğiten AI for Good gibi girişimlerden bahsediyor. Bununla birlikte, yetenek eksikliği nedeniyle AI geliştirmedeki darboğazın üstesinden gelmek için etkilerini ölçme ve AI konusunda daha fazla insanı hızlı bir şekilde eğitme ihtiyacına dikkat çekiyor. Pineau, AI alanını ilerletmek için çeşitli ve iyi eğitimli bir iş gücüne sahip olmanın önemini vurguluyor. Video, Pineau'nun 14 Kasım'da Omni King Edward otelinde Michele Lamont'un yer alacağı yaklaşan bir etkinliği duyurmasıyla sona eriyor.

  • 00:00:00 Videonun bu bölümünde Dr. Alan Bernstein, insanlığın karşı karşıya olduğu önemli soruları ele almak için en iyi araştırmacıları bir araya getiren küresel bir araştırma kuruluşu olan Kanada İleri Araştırma Enstitüsü'nü (CFR) tanıtıyor. CFR'nin başarılı programlarından biri, 2002 yılında bir CFR üyesi tarafından öncülük edilen yapay zekadır (AI). Akşamın konuşmacısı Dr. Joelle Pineau, AI'nın toplum üzerindeki etkilerini ve gelişimini çevreleyen etik kaygıları araştırıyor.

  • 00:05:00 Bu bölümde konuşmacı, sürücüsüz arabaların ve konuşma aracılarının geliştirilmesi de dahil olmak üzere yapay zeka alanında kaydedilen heyecan verici ilerlemeyi tartışıyor. Yapay zeka henüz günlük hayatımıza tam olarak entegre olmasa da, teknoloji şimdiden dijital dünyayla nasıl etkileşim kurduğumuzu etkilemeye başladı. Konuşmacı ayrıca yapay zeka araştırmalarını ilerletmede makine öğrenimi ve bilgisayar görüşünün rolünü ve yapay zekanın sağlık ve robot bilimi gibi çeşitli alanlarda devrim yaratma potansiyelini vurguluyor.

  • 00:10:00 Bu bölümde, yapay zekanın bilişsel yeteneklerinin etkisini ve ekonomide ve toplumda nasıl devrim yarattığını öğreniyoruz. Yapay zekanın gelişimi devam eden bir süreçtir, ancak planlama, doğal dili anlama ve görüntüleri işleme için modüllere sahip makineler yarattık. Daha iyi bir yapay zeka oluşturmanın ve bu farklı yetenekleri sorunsuz bir şekilde entegre etmenin önündeki zorluklar var. Son yıllarda, makinelerin programatik bir felsefe yerine örneklerle eğitilmesiyle yapay zekaya yaklaşımda bir değişiklik oldu. Bilgisayar görüşündeki atılımlar, görüntüleri anlama yeteneğimizi geliştirerek sürücüsüz arabalar gibi teknolojide ilerlemelere yol açtı.

  • 00:15:00 Bu bölümde, Dr. Joelle Pineau, bilgisayar görüşündeki atılımın, verilerin, özellikle de makineleri binlerce farklı nesneyi yüksek doğrulukla tanıması için eğiten bir milyon açıklamalı görüntü içeren ImageNet veri kümesinin kullanılabilirliğiyle başarıldığını açıklıyor. Verilerdeki bu artış, GPU platformları gibi bilgi işlem platformlarıyla birleştiğinde, derin öğrenme teknolojisinin konuşma tanıma da dahil olmak üzere çeşitli veri türlerinde ilerleme sağlamasına olanak sağladı. Bu teknoloji analojisi, nöronların bilgiyi aldığı, işlediği, karar verdiği ve yapay nöronlardakiyle aynı süreç olan bir mesaj gönderdiği beyindeki biyolojik nöronlara yapılır. Bu nöronlar arasındaki bağlantılar, doğru ağırlık setini seçerek belirli tahminleri güçlendirmek için makine öğrenimi algoritmalarıyla ayarlanır.

  • 00:20:00 Bu bölümde, Dr. Joelle Pineau, sonunda bir tahmin oluşturulana kadar ağın her katmanının bilginin daha soyut bir versiyonunu hesaplayarak yapay sinir ağlarının bilgiyi nasıl işlediğini tartışıyor. Görüntü ve dilin kesişimi de örnek olarak resim altyazısı ile araştırılır. Makineler mükemmel olmasalar ve hata yapabilseler de, pekiştirmeli öğrenme onların yeteneklerini geliştirebilen bir tekniktir. Başarılı bir örnek, Go oyununu oynamayı öğrenen ve bir insan şampiyonu yenen AlphaGo'dur. Bu sistem, derin öğrenme ve milyonlarca uzman Go oyuncu oyununun birleşimi ve ardından deneme yanılma yoluyla öğrenme ile oluşturulmuştur.

  • 00:25:00 Bu bölümde Dr. Joelle Pineau, kendisinin ve ekibinin birkaç yıldır üzerinde çalıştığı, epilepsili bireylerin tedavilerini iyileştirmek için teknoloji geliştirmeyi amaçlayan bir projeyi tartışıyor. Bu proje, bir cihazın nöbet insidansını bozmak için beyinde gerçek zamanlı olarak elektriksel stimülasyon uyguladığı nöral stimülasyon tedavisinin kullanımını içerir. Çözmeye çalıştıkları sorun, nöbetleri bozma yeteneklerini geliştirmek için stimülasyon parametresinin nasıl optimize edileceğidir. Araştırmacılarla işbirliği içinde, stratejiyi optimize etmek için takviyeli öğrenmeyi kullandılar ve beynin ani nöbet geçirme riski altında olup olmadığına bağlı olarak stimülasyon insidansını ayırarak oldukça çeşitli bir politika geliştirmeyi başardılar. Bu deneyler, hayvan epilepsi modelleri ile gerçekleştirildi ve bir sonraki adım, insan deneylerine geçmek.

  • 00:30:00 Bu bölümde Dr. Joelle Pineau, özellikle bir dizi müdahale gerektiren hastalıklar için tedaviyi optimize etmeye yönelik yapay zeka stratejilerinin kullanımını tartışıyor. Çok fazla veriye sahip olmak önemli olmakla birlikte, daha küçük veri kümelerinden verimli öğrenmenin de çok önemli olduğunu belirtiyor. Yapay zeka araştırmacıları ile hastalığın dinamikleri hakkında alana özgü bilgi ve anlayışa sahip tıp araştırmacıları arasındaki işbirliğine duyulan ihtiyacı vurguluyor. Ayrıca, yapay zekaya hazır olmak için ekonominin ve toplumun birçok sektöründe yetenek geliştirmenin önemini vurguluyor. Pineau ayrıca Kanada'da AI araştırmalarını ilerletmeye yardımcı olmak için yeni nesil öğrencileri yetiştirmeye yönelik pan-Kanada stratejisini tartışıyor.

  • 00:35:00 Bu bölümde, Toronto'daki Massey College'daki genç öğrenciler, yapay zekanın sosyo-ekonomik etkilerini, özellikle işten çıkarmaları ve artan servet eşitsizliklerini tartıştılar. Konuşmacı Dr. Joelle Pineau bir politika uzmanı olmasa da hangi sektörlerin etkilenme olasılığının yüksek olduğunu tahmin etmenin ve gelecek nesli bu değişime hazırlamanın önemli olduğunu öne sürüyor. İşten çıkarmanın bir örneği, yeni insanları işe almanın zor olması nedeniyle otomasyonun bazı baskıları hafifletebileceği kamyon taşımacılığı endüstrisindedir. Bununla birlikte, tıp alanında, insanları yapay zekanın radyologlar gibi belirli işleri değiştirdiği gerçeğine hazırlamak daha zor olabilir. Dr. Pineau, gruba insan toplumunun uyum sağlayabildiğini ve her zaman çözülmesi gereken yeni ve ilginç problemler olacağını hatırlatır.

  • 00:40:00 Bu bölümde Dr. Joelle Pineau, daha teknik bakış açıları ve kodlamayı farklı müfredatlara dahil etme talebini karşılamak için gelecek neslin matematik, fen ve bilgisayar becerileri eğitimini hazırlamanın önemini tartışıyor. Ancak, daha geniş bir kültürel deneyime sahip olmayan teknik uzmanlar ile teknik uzmanlığa sahip olmayan politika yapıcılar arasında bir boşluk vardır ve ortak bir dil bulmak zaman alır. Dr. Pineau ayrıca, insan beyni yapay zeka araştırmaları için büyük bir ilham kaynağı olsa da, makinelerin yapabilecekleri konusunda insan beyninin yapabileceği fiziksel kısıtlamalar olduğunu ve sinir ağlarının bu algoritmaları oluşturma hikayesinin yalnızca bir kısmını oluşturduğunu paylaşıyor. AI uygulamaları açısından, Dr. Pineau'nun en heyecan verici olanı robotikte pekiştirmeli öğrenme ve insan merkezli ortamlarda güvenli ve etkili bir şekilde çalışabilen otonom sistemlerin geleceğini dört gözle bekliyor.

  • 00:45:00 Videonun bu bölümünde Dr. Joelle Pineau, sorunun karmaşıklığı ve işin disiplinler arası doğası nedeniyle büyüleyici bulduğu yapay zeka kullanan bir epilepsi projesi üzerindeki çalışmasını tartışıyor. Yapay zekanın zorluklarının, verilere ilişkin doğru soruları sormakta ve bunları doğru algoritmayla eşleştirmekte yattığını açıklıyor. Dr. Pineau ayrıca, kendisinin ve mezun öğrencilerinin genellikle yaratıcı olmaları ve verilere uyacak yeni algoritmalar icat etmeleri gerektiğinden bahseder. Yapay zeka hakkındaki en büyük yanılgılardan birinin, yapay zekanın insanların kavrayamayacağı kararlar veren bir kara kutu olduğu olduğuna inanıyor.

  • 00:50:00 Bu bölümde Dr. Joelle Pineau sinir ağlarının nasıl karar verdiğini anlamanın zorluklarını tartışıyor. Bir sinir ağının tahminlerini takip edebilsek de, bu tahminleri neden insanlar gibi özlü ve anlaşılır bir şekilde yaptığını açıklamak her zaman kolay değildir. Ancak makineler, kararlarını açıklayan bir anlatım oluşturacak şekilde tasarlanabilirse, makineler ve insanlar arasında daha zengin bir diyalog kurabilir. Makineler iş gücünde daha yaygın hale geldikçe, insanlar ve makineler arasında bir ortaklık oluşturmak için birbirlerinin kararlarını açıklayan bir dile sahip olmak önemlidir. Dr. Pineau ayrıca, genellikle doğası gereği insan olan ve makine öğrenimi algoritmalarında önyargıya yol açabilen verilerdeki önyargı konusuna da değiniyor. Eğitim algoritmalarında tümevarımsal önyargı esas olsa da, önyargılarımızın bilincinde olmalı ve tarafsız sistemler tasarlamak için iyi tümevarımsal önyargı ve verileri seçmeliyiz.

  • 00:55:00 Bu bölümde, Dr. Joelle Pineau yapay zeka modellerini eğitirken önyargılardan kaçınmanın önemini ve bunu başarmak için yöntemleri, örneğin yetersiz temsil edilen veri türlerini fazla temsil etmek gibi tartışıyor. Bununla birlikte, önyargıdan tamamen kaçınmanın zor olduğunu ve teknolojiyi inşa eden insanlar arasındaki çeşitliliği artırmaya odaklanmamız gerektiğini de belirtiyor. Ek olarak, verilerle ilgili gizlilik ve güvenlik sorunları, makine öğrenimi algoritmalarını dağıtırken neyin paylaşıldığını anlama ve pekiştirmeli öğrenimde aracılar için doğru ödül işlevini bulma gibi alandaki zorlukların farkındadır.

  • 01:00:00 Bu bölümde Dr. Joelle Pineau, teknolojinin kapsamını genişletmek için yapay zeka (AI) alanına farklı bakış açıları getirmenin öneminden bahsediyor. McGill'deki AI for Good programı gibi genç kadınları AI ve pratik projelerde ileri düzey eğitim için bir araya getiren girişimlerden bahsediyor. Ancak Pineau, özellikle kodlama okul müfredatlarına dahil edildiğinden, bu girişimlerin etkisini ölçmek için yapılacak daha çok iş olduğunu belirtiyor. Pineau'ya göre AI geliştirmedeki darboğaz, yetenek eksikliği ve bu alanda daha fazla insanı hızlı bir şekilde eğitme ihtiyacıdır. İnsanları AI araştırması için nasıl eğiteceği konusunda, mevcut fırsatların yelpazesini ve her seviyede daha iyisini yapma ihtiyacını kabul ediyor. Genel olarak Pineau, AI alanını ilerletmek için çeşitli ve iyi eğitimli bir iş gücüne sahip olmanın önemini vurguluyor.

  • 01:05:00 Bu bölümde konuşmacı, katılımcılara teşekkür ederek ve Harvard Üniversitesi'nde Seafire bursiyeri olan Michele Lamont'un yer alacağı yaklaşan bir etkinliği duyurarak etkinliği bitirir. Lamont, toplumların nasıl daha kapsayıcı hale gelebileceğini tartışacak ve sonbaharda Hollanda kralından Erasmus Ödülü alacak. Etkinlik 14 Kasım'da Omni King Edward otelinde gerçekleştirilecek.
Canada’s Artificial Intelligence Revolution - Dr. Joelle Pineau
Canada’s Artificial Intelligence Revolution - Dr. Joelle Pineau
  • 2017.11.11
  • www.youtube.com
Dr. Joelle Pineau discusses how artificial intelligence is poised to change almost every aspect of our lives, from medical treatments to assistive robots to ...
 

Yapay zeka ve algoritmalar: Artıları ve Eksileri | DW Belgesi (AI belgeseli)



Yapay zeka ve algoritmalar: artılar ve eksiler | DW Belgesi (AI belgeseli)

Video, yapay zekanın etik sonuçlarına odaklanarak yapay zekanın artılarını ve eksilerini tartışıyor. Yapay zekanın verimliliği ve kamu güvenliğini artırmak için nasıl kullanılabileceğini ve aynı zamanda mahremiyeti ihlal etmek için nasıl kullanılabileceğini vurgulamaktadır. Video, Google'da uzun süredir hizmet veren Jens Redma ile AI'nın şirket için önemi hakkında röportaj yapıyor.

  • 00:00:00 Yapay zeka, günlük hayatın birçok alanında devrim yaratma potansiyeliyle hızlı adımlar atıyor. Bununla birlikte, yapay zekanın iş gücü ve mahremiyet üzerindeki etkileri konusunda da endişeler var.

  • 00:05:00 Yapay zeka, anormallikleri belirlemek için göğüs röntgenleri dahil olmak üzere büyük veri kümelerini analiz etmek için kullanılıyor. Algoritmaların doğruluğu, insan radyologlarınınkine benzer. Bununla birlikte, algoritmalar mükemmel değildir ve klinikte olasılıklara dayalı kararlar almak için insanlara hala ihtiyaç vardır.

  • 00:10:00 Max Little, Aston Üniversitesi'nde Parkinson Hastalığı olan ve olmayan insanlar arasındaki ses kalıplarındaki farklılıkları saptamak için bir algoritma geliştiren bir matematikçidir. Çalışma, algoritmanın durumu tanımlamada yaklaşık %99 oranında doğru olduğunu gösterdi. Bu çalışma potansiyel olarak değerli olsa da, bu verilerin uygun onay olmadan insanları teşhis etmek için kullanılmasıyla ilgili etik kaygılar vardır.

  • 00:15:00 Video, yapay zekanın kamu güvenliğini ve verimliliğini artırma yeteneği dahil olmak üzere faydalarını ve dezavantajlarını sunuyor. Ayrıca, gizlilik ve güvenlik arasındaki değiş tokuşu tartışır. Çin'de, verimlilik ve veri toplamaya odaklanan, mahremiyet ve gözetleme konusunu ele alan farklı bir gelenek ve yaklaşım vardır.

  • 00:20:00 Videoda yapay zekanın artıları ve eksileri tartışılıyor. Video ayrıca Google gibi şirketlerin toplum üzerinde nasıl bir etkiye sahip olduğunu ve Avrupa Birliği'nin şu anda Google'a nasıl 2,7 milyar dolarlık bir anti-tröst cezası verdiğini tartışıyor.

  • 00:25:00 Video, yapay zekanın (AI) Google için önemini tartışıyor ve toplum üzerindeki etkisiyle ilgili dile getirilen bazı endişeleri tartışıyor. Ayrıca, Google'da uzun süredir hizmet veren Jens Redma ile AI'nın şirket için önemi hakkında röportaj yapıyor.

  • 00:30:00 Video, yapay zekanın artılarını ve eksilerini tartışarak, sahada sezginin ve insanın karar vermesinin önemini vurguluyor. Yapay zekanın karmaşık ortamlarda gezinme ihtiyacından ve bunu başarmanın içerdiği zorluklardan bahsediyor.

  • 00:35:00 Yapay zeka, sürücülerin kazalardan kaçınmasına yardımcı olabilir, ancak bu kadar hızlı tempolu bir durumda kimin kurtarılacağına nasıl karar verileceği konusunda etik sorular var. Yakın zamanda yapılan bir çevrimiçi ankette, insanlar bir dizi ahlaki değer üzerinde anlaştılar, ancak belirli senaryolarda nasıl hareket edecekleri konusunda farklılık gösterdiler.

  • 00:40:00 Bu belgeselde, araştırmacılar yapay zeka ve algoritmaların artılarını ve eksilerini tartışıyor. Yapay zekanın daha verimli kararlar almamıza nasıl yardımcı olabileceğini tartışıyorlar, ancak hala ele alınması gereken etik sorular olduğunu da unutmayın.
Artificial intelligence and algorithms: pros and cons | DW Documentary (AI documentary)
Artificial intelligence and algorithms: pros and cons | DW Documentary (AI documentary)
  • 2019.09.26
  • www.youtube.com
Developments in artificial intelligence (AI) are leading to fundamental changes in the way we live. Algorithms can already detect Parkinson's disease and can...
Neden: