- Veröffentlicht am
Wie würden Sie den Google-Bildsuchmaschinen-Engine aufbauen?
- Autoren

- Name
- AbnAsia.org
- @steven_n_t
Wird Google Fotos für Sie zu eingeschränkt?

Google Bildersuche ist eine Suchmaschine, bei der wir einen Text oder ein Bild als Abfrage eingeben und eine nach Relevanz geordnete Liste von verwandten Bildern erhalten. Wenn wir Text als Eingabe verwenden, möchten wir sicherstellen, dass die Bilder gut durch den Text beschrieben werden, und wenn wir ein Bild als Eingabe verwenden, möchten wir sicherstellen, dass die ähnlichsten Bilder präsentiert werden.
Wir können dieses Problem als Rangierungsproblem formulieren. Wir benötigen ein Modell, das zwei Bilder als Eingabe nimmt und einen Ähnlichkeitswert zurückgibt. Mit diesem Modell können wir dann die Bilder anhand dieses Ähnlichkeitswerts ordnen. Ein typischer Ansatz ist die Verwendung von Modellen, die eine vektorielle Darstellung (Einbettung) der Bilder erlernen und eine Ähnlichkeitsmetrik auf diesen Vektoren berechnen können. Wir benötigen ein Modell, das die Bildmerkmale extrahieren kann, um eine vektorielle Darstellung der Bilder zu erlernen, und wir benötigen ein Modell, das die Textmerkmale extrahieren kann, um eine vektorielle Darstellung der Texteingaben zu erlernen. Wir müssen die Bild- und Textmodelle gemeinsam trainieren, damit die vektoriellen Darstellungen semantisch ausgerichtet sind.
Um eine schnelle Abrufung zu gewährleisten, benötigen wir eine Möglichkeit, die bestehenden Bilder zu speichern und schnell nach ähnlichen Bildern zu suchen. Da wir die Bilder in ihre vektoriellen Darstellungen kodieren, erscheint es logisch, die Bilder in eine Vektor-Datenbank zu indizieren. Die Indizierungspipeline wandelt die ursprünglichen Bilder in ihre vektoriellen Darstellungen um und indiziert sie in eine Vektor-Datenbank.
Wenn ein Benutzer eine Text- oder Bildabfrage eingibt, müssen wir eine Liste von Bildern zurückgeben. Der Einbettungsgenerierungsdienst erzeugt eine Einbettungskodierung der Eingabeabfrage. Die Einbettungsabfrage wird an die Vektor-Datenbank gesendet, die die nächsten Nachbarn der Abfrage zurückgibt. Der Reranking-Dienst wird hauptsächlich verwendet, um die nächsten Nachbarn mithilfe eines besseren Modells als dem Einbettungsgenerierungsmodell neu zu ordnen. Er könnte verwendet werden, um die Ordnung auf den spezifischen Benutzer zu personalisieren, indem benutzerspezifische Daten verwendet werden. Die resultierende Liste ist eine Liste von Bild-IDs, und sie wird dann an den Bildspeicher gesendet, um die tatsächlichen Bilder abzurufen und an den Benutzer zurückzugeben.
Bitte beachten Sie, dass die deutsche Version von Ai unterstützt wird und daher geringfügige Fehler auftreten können.
AUTOR
Über ABN Asia: Ai Base Network (ABN), ABN Asia wurde im Jahr 2012 gegründet und ist ein Unternehmen mit akademischem Hintergrund, das von Lehrkräften und ehemaligen Studierenden aus Ungarn, den Niederlanden, Russland, Deutschland und Japan gegründet wurde. Wir teilen eine gemeinsame Leidenschaft und eine klare Vision für Technologie, die Innovation und erstklassige Qualität für unsere Kunden bringt. Unser Motto lautet: Besser. Schneller. Sicherer. In vielen Fällen: Günstiger.
Zögern Sie nicht, uns zu kontaktieren, wenn Sie IT-Dienstleistungen, digitale Beratung, Standardsoftwarelösungen benötigen oder uns Angebotsanfragen (RFPs) senden möchten. Sie können uns unter [email protected] kontaktieren. Wir sind bereit, Ihnen bei all Ihren Technologiebedürfnissen zu helfen.

© ABN ASIA