Utama Berinovasi Kecerdasan Buatan Google 'Alpha Go Zero' Baru Ditekan Semula Mengenai Cara Belajar

Kecerdasan Buatan Google 'Alpha Go Zero' Baru Ditekan Semula Mengenai Cara Belajar

Horoskop Anda Untuk Esok

Ingat (samar-samar) bagaimana anda belajar berjalan, bercakap, menunggang basikal, atau memandu? Itu tidak kemas dan penuh kesilapan, tetapi kemahiran yang anda pelajari seperti itu tetap ada. Di luar sistem hidup, sangat sukar untuk menyusun algoritma yang cukup kuat untuk mengambil 'pengalaman hidup sebenar' dan mengembangkan tingkah laku yang mudah disesuaikan dan mudah disesuaikan untuk kecerdasan buatan.

Nah, Alpha Go Zero baru sahaja melakukannya.

'Ia bermula dari batu tulis kosong dan hanya dapat dilihat sendiri, hanya dari permainan diri, dan tanpa pengetahuan manusia, atau data manusia, atau ciri, atau contoh, atau campur tangan manusia. Ini menemui cara bermain permainan Go dari prinsip pertama, '' kata profesor DeepMind, David Silver.

AI mempunyai beberapa lelaran, masing-masing lebih pintar dan lebih berkemampuan daripada yang sebelumnya. Versi sebelumnya menggunakan pangkalan data besar permainan sebelumnya bersama dengan sekumpulan algoritma yang menunjukkannya untuk menang. Pendekatan itu membawa kepada kekalahan pemain Go profesional juara dunia yang memerintah. Dalam poker, AI Libratus baru-baru ini mengungguli pemain poker teratas di dunia dengan hampir $ 2 juta, juga dengan belajar melalui bermain sendiri dan bukannya data permainan manusia.

berapa tinggi dallon weekes

Sekarang, dalam versi terbaru Alpha Go, program kecerdasan buatan yang diajar sendiri cara bermain Go - tanpa latar belakang manusia.

Menjalankan berjuta-juta simulasi permainan dengan sendirinya, diperlukan 40 hari untuk belajar - dari awal - bagaimana mengalahkan versi juara Dunia itu sendiri. Itu benar-benar mengubah permainan, bukan hanya untuk Go, tetapi juga bagaimana pengetahuan baru ditemui. Sejauh mana tepat dan lengkapnya kepakaran domain anda? Ada banyak lebih banyak yang dapat kita ketahui, adalah apa yang diceritakan oleh eksperimen menarik dalam pembelajaran dengan Alpha Go Zero ini.

'Idea Alpha Go bukanlah untuk keluar dan mengalahkan manusia, tetapi sebenarnya untuk mengetahui apa artinya melakukan sains - agar program dapat belajar sendiri pengetahuannya,' menurut Silver dalam catatan YouTube mengenai pencapaian itu.

Pasukan Alpha Go Zero Deep Mind menyebutnya sebagai prinsip pertama, 'tabula rasa' (kosong).

'Sekiranya anda dapat mencapai tabula rasa belajar, anda mempunyai ejen yang boleh ditransplantasikan dari permainan Pergi ke domain lain, dan spesifik permainan yang anda gunakan, anda mempunyai algoritma yang begitu umum sehingga dapat diterapkan di mana saja, '' katanya . Itulah idea yang memprovokasi semasa anda mengembangkan konsep. Cukup fikirkan apa yang dapat kita lakukan dengan sekumpulan algoritma pembelajaran yang kuat yang dapat mengatasi masalah sukar secara sistematik dan belajar lebih cepat daripada pengetahuan kolektif peradaban kita. . . dalam beberapa hari, bukan dekad.

dengan siapa danielle niles berkahwin

Buat masa ini, penghapusan besar adalah, 'algoritma lebih penting daripada pengkomputeran atau data yang ada,' kata Silver. Ini sahaja adalah penukar permainan dalam bagaimana kita mendekati memperluas dunia yang diketahui. Walaupun Alpha Go menggunakan perkakasan kira-kira $ 25 juta - ia bukan sistem ringan - anda tahu guru AI telah lama berusaha membuat set data yang lebih bersih dan lebih baik. Hari ini, banyak kumpulan data besar dianggap terlalu bising - penuh dengan data buruk - untuk melatih kecerdasan buatan secara tepat. Sekiranya AI belajar dari data, dan datanya buruk, tidak akan belajar. Masalah besar.

Bagaimana jika anda tidak memerlukan data yang bersih, tetapi hanya pengalaman, dan kecerdasan buatan dapat melatih dirinya sendiri?

Itulah pencapaian menarik di Alpha Go Zero. Walaupun dalam dunia permainan berdasarkan peraturan, ia mempunyai implikasi besar dalam setiap industri yang bekerja dari peraturan fizikal - berfikir kimia, lalu lintas, biologi, farmakologi, perjalanan, logistik, dan pembuatan. Sekiranya kita dapat merancang peraturan yang begitu fleksibel, mereka dapat bekerja dari pengalaman yang lebih luas, dan begitu terarah sehingga mereka selalu menghasilkan kemahiran yang lebih kuat - seperti Alpha Go Zero - maka mungkin untuk mencapai kecerdasan buatan yang mendalangi sistem. Sistem ini tidak memerlukan data luar, tidak mempunyai masalah pembersihan data, dan tidak memerlukan perlambatan manusia-dalam-gelung. Itulah sebabnya mengapa syarikat induk Google, Alphabet, mempertaruhkan syarikat itu dengan kecerdasan buatan dan melabur dalam kecerdasan buatan pada kadar yang cepat. (Amazon juga melabur dalam kecerdasan buatan, seperti BodyLabs pemerolehan AI terbarunya.)

telah pat rhyme menjalani pembedahan plastik

Profesor Deep Mind David Silver mengatakan, 'hakikat bahawa kita telah melihat program mencapai prestasi tahap tinggi ... semestinya sekarang kita dapat mulai menangani beberapa masalah yang paling mencabar dan berdampak bagi umat manusia.'

Catatan ini telah dikemas kini untuk menjelaskan bahawa AI Libratus baru-baru ini mengalahkan pemain poker teratas menggunakan strategi yang melibatkan permainan sendiri dan bukan data yang dimasukkan oleh manusia.