- Xuất bản vào
Làm thế nào để bạn xây dựng Công cụ Tìm kiếm Hình ảnh của Google?
- Tác giả
- Tên
- AbnAsia.org
- @steven_n_t
Google Photos có trở nên quá hạn chế đối với bạn không?
Google Image là một công cụ tìm kiếm nơi chúng ta nhập một truy vấn văn bản hoặc hình ảnh và được trình bày với một danh sách xếp hạng các hình ảnh liên quan. Nếu chúng ta sử dụng văn bản làm đầu vào, chúng ta muốn đảm bảo rằng các hình ảnh được mô tả tốt bởi văn bản, và nếu chúng ta sử dụng hình ảnh làm đầu vào, chúng ta muốn đảm bảo trình bày các hình ảnh tương tự nhất.
Chúng ta có thể định hình vấn đề này như một vấn đề xếp hạng. Chúng ta cần một mô hình nhận hai hình ảnh làm đầu vào và trả về một điểm số tương đồng. Sử dụng mô hình đó, chúng ta có thể xếp hạng các hình ảnh dựa trên điểm số tương đồng đó. Một phương pháp mô hình hóa điển hình là sử dụng các mô hình có thể học một biểu diễn vector (embedding) của các hình ảnh và tính toán một chỉ số tương đồng trên các vector đó. Chúng ta cần một mô hình có thể trích xuất các đặc điểm hình ảnh để học một biểu diễn vector của hình ảnh, và chúng ta cần một mô hình có thể trích xuất các đặc điểm văn bản để học một biểu diễn vector của đầu vào văn bản. Chúng ta cần đồng huấn luyện các mô hình hình ảnh và văn bản để các biểu diễn vector được căn chỉnh ngữ nghĩa.
Để đảm bảo truy xuất nhanh, chúng ta cần một cách để lưu trữ các hình ảnh hiện có và nhanh chóng tìm kiếm các hình ảnh tương tự. Vì chúng ta đang mã hóa các hình ảnh thành các biểu diễn vector của chúng, có vẻ hợp lý để lập chỉ mục các hình ảnh vào một cơ sở dữ liệu vector. Quy trình lập chỉ mục chuyển đổi các hình ảnh gốc thành các biểu diễn vector của chúng và lập chỉ mục chúng vào một cơ sở dữ liệu vector.
Khi người dùng nhập một truy vấn văn bản hoặc hình ảnh, chúng ta cần trả về một danh sách các hình ảnh. Dịch vụ tạo embedding tạo ra một mã hóa embedding của truy vấn đầu vào. Truy vấn embedding được gửi đến cơ sở dữ liệu vector, cơ sở dữ liệu này trả về các hàng xóm gần nhất của truy vấn. Dịch vụ sắp xếp lại chủ yếu được sử dụng để sắp xếp lại các hàng xóm gần nhất bằng cách sử dụng một mô hình tốt hơn so với mô hình tạo embedding. Nó có thể được sử dụng để cá nhân hóa xếp hạng cho người dùng cụ thể bằng cách sử dụng dữ liệu cụ thể của người dùng. Danh sách kết quả là một danh sách các ID hình ảnh, và sau đó nó được gửi đến kho lưu trữ hình ảnh để truy xuất các hình ảnh thực tế để trả về cho người dùng.
TÁC GIẢ
Về ABN Asia: AiUTOMATING PEOPLE, ABN Asia được thành lập từ năm 2012, là một công ty xuất phát từ học thuật, do những giảng viên, cựu du học sinh Hungary, Hà Lan, Nga, Đức, và Nhật Bản sáng lập. Chúng tôi chia sẻ đam mê chung và tầm nhìn vững chắc về công nghệ, mang đến sự đổi mới và chất lượng đỉnh cao cho khách hàng. Phương châm của chúng tôi là: Tốt hơn. Nhanh hơn. An toàn hơn. Trong nhiều trường hợp: Rẻ hơn.
Hãy liên hệ với chúng tôi khi Quý doanh nghiệp có các nhu cầu về dịch vụ công nghệ thông tin, tư vấn chuyển đổi số, tìm kiếm các giải pháp phần mềm phù hợp, hoặc nếu Quý doanh nghiệp có đấu thầu CNTT (RFP) để chúng tôi tham dự. Quý doanh nghiệp có thể liên hệ với chúng tôi qua địa chỉ email [email protected]. Chúng tôi sẵn lòng hỗ trợ với mọi nhu cầu công nghệ của Quý doanh nghiệp.
© ABN ASIA