Diterbitkan pada

Wow. Apple hari ini merilis beberapa model bahasa besar (LLM) open source yang dirancang untuk dijalankan di perangkat, bukan melalui server cloud

Penulis

"Apple hari ini merilis beberapa model bahasa besar (LLM) open source yang dirancang untuk dijalankan di perangkat, bukan melalui server cloud. Disebut OpenELM (Model Bahasa Efisien Sumber Terbuka), LLM tersedia di Hugging Face Hub, sebuah komunitas untuk berbagi kode AI.

Fitur Apple Silicon AI yang Dioptimalkan Siri Sebagaimana diuraikan dalam kertas putih [PDF], ada total delapan model OpenELM, empat di antaranya telah dilatih sebelumnya menggunakan perpustakaan CoreNet, dan empat model yang disesuaikan dengan instruksi. Apple menggunakan strategi penskalaan berlapis yang bertujuan untuk meningkatkan akurasi dan efisiensi.

Apple menyediakan kode, log pelatihan, dan beberapa versi, bukan hanya model akhir yang dilatih, dan para peneliti di balik proyek ini berharap bahwa hal ini akan menghasilkan kemajuan yang lebih cepat dan ""hasil yang lebih dapat dipercaya"" di bidang AI bahasa alami.

OpenELM, model bahasa terbuka yang canggih. OpenELM menggunakan strategi penskalaan berdasarkan lapisan untuk mengalokasikan parameter secara efisien dalam setiap lapisan model transformator, sehingga menghasilkan peningkatan akurasi. Misalnya, dengan anggaran parameter sekitar satu miliar parameter, OpenELM menunjukkan peningkatan akurasi sebesar 2,36% dibandingkan dengan OLMo dan memerlukan token pra-pelatihan 2x lebih sedikit.

Berbeda dari praktik sebelumnya yang hanya menyediakan bobot model dan kode inferensi, serta pra-pelatihan pada kumpulan data pribadi, rilis kami mencakup kerangka kerja lengkap untuk pelatihan dan evaluasi model bahasa pada kumpulan data yang tersedia untuk umum, termasuk log pelatihan, beberapa pos pemeriksaan, dan pra-pelatihan. konfigurasi pelatihan.

Apple mengatakan bahwa mereka merilis model OpenELM untuk ""memberdayakan dan memperkaya komunitas riset terbuka"" dengan model bahasa yang canggih. Berbagi model sumber terbuka memberi peneliti cara untuk menyelidiki risiko, data, dan bias model. Pengembang dan perusahaan dapat menggunakan model apa adanya atau melakukan modifikasi.

Berbagi informasi secara terbuka telah menjadi alat penting bagi Apple untuk merekrut insinyur, ilmuwan, dan pakar terkemuka karena hal ini memberikan peluang bagi makalah penelitian yang biasanya tidak dapat dipublikasikan berdasarkan kebijakan rahasia Apple.

Apple belum menghadirkan kemampuan AI semacam ini ke perangkatnya, namun iOS 18 diperkirakan menyertakan sejumlah fitur AI baru, dan rumor menyebutkan bahwa Apple berencana menjalankan model bahasa besarnya di perangkat untuk tujuan privasi."

Harap dicatat bahwa versi bahasa Prancis dari AI didukung dan karena itu mungkin terjadi kesalahan kecil. Wow. Apple hari ini merilis beberapa model bahasa besar (LLM) open source yang dirancang untuk dijalankan di perangkat, bukan melalui server cloud

Penulis

Ai Base Network (ABN), ABN ASIA didirikan oleh orang-orang dengan akar yang kuat di dunia akademis, dengan pengalaman kerja di Amerika Serikat, Belanda, Hungaria, Jepang, Korea Selatan, Singapura, dan Vietnam. ABN Asia adalah tempat di mana akademik dan teknologi bertemu dengan peluang. Dengan solusi terdepan kami dan layanan pengembangan perangkat lunak yang kompeten, kami membantu bisnis untuk meningkatkan level dan bersaing di panggung global. Komitmen kami: Lebih Cepat. Lebih Baik. Lebih handal. Dalam kebanyakan kasus: Lebih murah juga.

Jangan ragu untuk menghubungi kami jika Anda membutuhkan layanan IT, konsultasi digital, solusi perangkat lunak siap pakai, atau jika Anda ingin mengirimkan permintaan proposal (RFP). Anda dapat menghubungi kami di [email protected]. Kami siap membantu Anda dengan semua kebutuhan teknologi Anda.

ABNAsia.org

© ABN ASIA