Pereka video berkuasa Sora menjelaskan kelebihan dan kelemahan video yang dihasilkan oleh AI

Alat penghasilan video OpenAI, Sora, membuat komuniti AI terkejut pada bulan Februari dengan video yang halus dan realistik yang jauh lebih maju daripada pesaing-pesaingnya. Tetapi penampilan yang diatur dengan teliti itu meninggalkan banyak butiran yang ditinggalkan - butiran yang telah diisi oleh seorang pembuat filem yang diberikan akses awal untuk membuat filem pendek menggunakan Sora.

Shy Kids adalah pasukan produksi digital yang berpengkalan di Toronto yang dipilih oleh OpenAI sebagai salah satu daripada beberapa orang untuk menghasilkan filem pendek pada dasarnya untuk tujuan promosi OpenAI, walaupun mereka diberikan kebebasan kreatif yang besar dalam mencipta "air head". Dalam temuramah dengan platform berita kesan visual fxguide, artis pascaproduksi Patrick Cederberg menerangkan "menggunakan Sora sebenarnya" sebagai sebahagian daripada kerjanya.

Mungkin pelajaran yang paling penting adalah ini: Walaupun pos OpenAI yang menyoroti filem pendek membolehkan pembaca mengandaikan bahawa mereka lebih kurang muncul sepenuhnya dari Sora, realitinya adalah bahawa ini adalah produksi profesional, lengkap dengan penyusunan cerita yang kukuh, penyuntingan, penyesuaian warna, dan kerja pasca seperti rotoskoping dan VFX. Sama seperti Apple mengatakan "digariskan dengan iPhone" tetapi tidak menunjukkan persediaan studio, pencahayaan profesional, dan kerja warna selepas kejadian, pos Sora hanya bercakap tentang apa yang membolehkan orang lakukan, bukan bagaimana sebenarnya dilakukan.

Temuramah Cederberg adalah menarik dan sangat bukan teknikal, jadi jika anda berminat sama ada, pergilah ke fxguide dan baca. Tetapi berikut adalah beberapa potongan menarik mengenai menggunakan Sora yang memberitahu kita bahawa, sehebat mana pun, model itu mungkin kurang dari lompatan besar yang kita fikirkan.

Kawalan masih menjadi perkara yang paling diinginkan dan juga paling sukar diperoleh pada masa ini. ... Yang terdekat yang kita boleh dapat hanyalah dengan menjadi sangat deskriptif dalam arahan kami. Menerangkan pakaian untuk watak, serta jenis belon, adalah cara kami mengatasi konsistensi kerana dari tembakan ke tembakan / generasi ke generasi, tiada set ciri yang di tempat untuk kawalan penuh ke atas konsistensi.

Dengan kata lain, perkara-perkara yang mudah dalam pembuatan filem tradisional, seperti memilih warna pakaian watak, memerlukan kerja-kerja yang rumit dan pemeriksaan dalam sistem generatif, kerana setiap tembakan dicipta secara bebas dari yang lain. Ini jelas boleh berubah, tetapi ia pasti lebih menyusahkan pada masa ini.

Output Sora juga perlu ditonton untuk elemen yang tidak diingini: Cederberg menerangkan bagaimana model itu biasanya menghasilkan wajah pada belon yang menjadi kepala watak utama, atau tali tergantung di hadapan. Ini harus dikeluarkan dalam pasca, proses lain yang memakan masa, jika mereka tidak dapat mendapatkan arahan untuk mengecualikannya.

Pemasaan dan pergerakan watak atau kamera yang tepat sebenarnya tidak mungkin: "Terdapat sedikit kawalan temporal tentang di mana tindakan yang berbeza berlaku dalam generasi sebenar, tetapi ia tidak tepat ... ia agak aksi dugong," kata Cederberg.

Contohnya, menetapkan tindakan seperti gelombang adalah proses yang sangat kasar, penuh dengan cadangan, berbeza dengan animasi manual. Dan tembakan seperti pandangan ke atas badan watak mungkin mencerminkan apa yang diinginkan pembuat filem - jadi pasukan dalam kes ini merender tembakan yang disusun dalam orientasi potret dan melakukan pan potongan di pasca. Klip yang dihasilkan juga sering bergerak perlahan tanpa sebab tertentu.

Contoh tembakan seperti yang dihasilkan oleh Sora dan bagaimana ia berakhir dalam filem pendek. Kredit gambar: Shy Kids

Sesungguhnya, menggunakan bahasa sehari-hari pembuatan filem, seperti "gerakan ke kanan" atau "tembakan runut", tidak konsisten amnya, kata Cederberg, yang didapati oleh pasukan itu agak mengejutkan.

"Penyelidik, sebelum mereka mendekati artis untuk bermain dengan alat, sebenarnya tidak berfikir seperti pembuat filem," katanya.

Hasilnya, pasukan itu melakukan ratusan generasi, masing-masing 10 hingga 20 saat, dan hanya menggunakan segelintir. Cederberg menganggarkan nisbahnya sebagai 300:1 - tetapi tentu saja kita mungkin semua terkejut dengan nisbah dalam satu tembakan biasa.

Pasukan itu sebenarnya membuat video di belakang tabir menerangkan beberapa masalah yang mereka hadapi, jika anda ingin tahu. Seperti banyak konten yang berkaitan dengan AI, komen-komen kritikal terhadap usaha keseluruhan sangat kritikal - walaupun tidak sejahat iklan yang dibantu AI yang baru-baru ini kita lihat dihujani.

Perkara menarik terakhir berkaitan dengan hak cipta: Jika anda meminta Sora memberikan klip "Star Wars", ia akan menolak. Dan jika anda cuba mendapatinya dengan "lelaki bertopi dengan pedang laser di dalam kapal angkasa retrofuturistik", ia juga akan menolak, kerana melalui sesuatu mekanisme ia mengenali apa yang anda cuba lakukan. Ia juga menolak untuk melakukan tembakan "jenis Aronofsky" atau "susur pam Hitchcock".

Di satu pihak, ia adalah sesuatu yang sangat masuk akal. Tetapi ia menimbulkan soalan: Jika Sora tahu apa pula ini, adakah bermakna model itu dilatih pada kandungan itu, untuk lebih mengenal pasti bahawa ia mengalami pelanggaran? OpenAI, yang menjaga data latihannya dengan rapat - hingga tahap yang menggelikan, seperti temubual CTO Mira Murati dengan Joanna Stern - hampir pasti tidak akan memberitahu kita.

Bagi Sora dan penggunaannya dalam pembuatan filem, ia jelas merupakan alat yang kuat dan berguna di tempatnya, tetapi tempatnya bukanlah "mencipta filem daripada kain penuh." Daripada. Seperti yang pernah dinyatakan penjahat lain, "itu datang kemudian."