Diterbitkan pada

Bagaimana Anda membangun Mesin Pencarian Gambar Google?

Penulis

Apakah Google Photos menjadi terlalu terbatas bagi Anda?

Image

Google Image adalah mesin pencari di mana kita memasukkan teks atau kueri gambar dan disajikan dengan daftar gambar terkait yang berperingkat. Jika kita menggunakan teks sebagai input, kita ingin memastikan bahwa gambar-gambar tersebut dijelaskan dengan baik oleh teks, dan jika kita menggunakan gambar sebagai input, kita ingin memastikan untuk menampilkan gambar-gambar yang paling mirip.

Kita dapat merumuskan masalah ini sebagai masalah peringkat. Kita membutuhkan model yang mengambil dua gambar sebagai input dan mengembalikan skor kesamaan. Dengan menggunakan model tersebut, kita dapat kemudian mengurutkan gambar-gambar berdasarkan skor kesamaan tersebut. Pendekatan pemodelan yang umum adalah menggunakan model yang dapat mempelajari representasi vektor (embedding) dari gambar-gambar dan menghitung metrik kesamaan pada vektor-vektor tersebut. Kita membutuhkan model yang dapat mengekstrak fitur gambar untuk mempelajari representasi vektor gambar, dan kita membutuhkan model yang dapat mengekstrak fitur teks untuk mempelajari representasi vektor input teks. Kita perlu melatih model gambar dan teks secara bersamaan sehingga representasi vektor tersebut saling selaras secara semantik.

Untuk memastikan pencarian yang cepat, kita membutuhkan cara untuk menyimpan gambar-gambar yang ada dan mencari gambar-gambar yang mirip dengan cepat. Karena kita mengkodekan gambar-gambar menjadi representasi vektor, tampaknya logis untuk mengindeks gambar-gambar ke dalam basis data vektor. Pipa indeks mengubah gambar-gambar asli menjadi representasi vektor dan mengindeksnya ke dalam basis data vektor.

Ketika pengguna memasukkan kueri teks atau gambar, kita perlu mengembalikan daftar gambar. Layanan pembuatan embedding menghasilkan pengkodean embedding dari kueri input. Kueri embedding dikirim ke basis data vektor yang mengembalikan tetangga terdekat dari kueri. Layanan reranking utamanya digunakan untuk mengurutkan ulang tetangga terdekat menggunakan model yang lebih baik daripada model pembuatan embedding. Ini dapat digunakan untuk mempersonalisasi peringkat ke pengguna tertentu dengan menggunakan data pengguna yang spesifik. Daftar yang dihasilkan adalah daftar ID gambar, dan kemudian dikirim ke toko gambar untuk mengambil gambar-gambar yang sebenarnya untuk dikembalikan kepada pengguna.

Harap dicatat bahwa versi bahasa Indonesia didukung oleh AI dan karena itu mungkin terjadi kesalahan kecil.

Penulis

Ai Base Network (ABN), ABN ASIA didirikan oleh orang-orang dengan akar yang kuat di dunia akademis, dengan pengalaman kerja di Amerika Serikat, Belanda, Hungaria, Jepang, Korea Selatan, Singapura, dan Vietnam. ABN Asia adalah tempat di mana akademik dan teknologi bertemu dengan peluang. Dengan solusi terdepan kami dan layanan pengembangan perangkat lunak yang kompeten, kami membantu bisnis untuk meningkatkan level dan bersaing di panggung global. Komitmen kami: Lebih Cepat. Lebih Baik. Lebih handal. Dalam kebanyakan kasus: Lebih murah juga.

Jangan ragu untuk menghubungi kami jika Anda membutuhkan layanan IT, konsultasi digital, solusi perangkat lunak siap pakai, atau jika Anda ingin mengirimkan permintaan proposal (RFP). Anda dapat menghubungi kami di [email protected]. Kami siap membantu Anda dengan semua kebutuhan teknologi Anda.

ABNAsia.org

© ABN ASIA