Minit TechCrunch: Model Llama 3 baru Meta memberi dorongan kepada AI sumber terbuka

Model AI baru dari Meta sedang menciptakan gejolak dalam lingkungan teknologi. Dua model baru, bagian dari rangkaian alat kecerdasan buatan Llama dari induk syarikat Facebook, kedua-duanya sumber terbuka, membantu mereka membezakan diri daripada tawaran yang bersaing daripada OpenAI dan nama-nama terkenal lain.

Model Llama baru dari Meta memiliki set data yang berbeza ukurannya, dengan model Llama 3 8B menampilkan lapan bilion parameter, dan model Llama 3 70B beberapa 70 bilion parameter. Semakin banyak parameter, semakin kuat model tersebut, tetapi tidak setiap tugas AI memerlukan set data terbesar yang mungkin.

Model-model baru syarikat, yang dilatih pada 24,000 kluster GPU, berprestasi dengan baik melintasi penanda aras yang Meta meletakkan mereka berhadapan, mengalahkan beberapa model pesaing yang sudah ada di pasaran. Apa yang penting bagi kita yang tidak bersaing untuk membina dan melepaskan model AI yang paling berkeupayaan atau terbesar, apa yang kita pedulikan adalah bahawa mereka masih menjadi lebih baik dari waktu ke waktu. Dan kerja. Dan banyak kiraan.

Walaupun Meta mengambil pendekatan sumber terbuka terhadap kerja AI, pesaingnya sering lebih suka kerja sumber tertutup. OpenAI, walaupun namanya dan sejarahnya, menawarkan akses kepada model-modelnya, tetapi bukan kod sumbernya. Terdapat perdebatan yang sihat dalam dunia AI mengenai pendekatan yang lebih baik, untuk kedua-dua kelajuan pembangunan dan juga keselamatan. Akhirnya, beberapa ahli teknologi - dan beberapa doomers komputer, untuk jelas - bimbang bahawa teknologi AI sedang berkembang terlalu cepat dan mungkin membuktikan berbahaya kepada demokrasi dan lain-lain.

Untuk ketika ini, Meta masih mengekalkan api AI terhidup, menawarkan cabaran baru kepada rakan sejawat dan pesaing mereka untuk mengatasi yang terbaru mereka. Tekan main, dan mari kita berbincang mengenainya!