Hast du dich jemals gefragt, wie #Technologie Text versteht und verarbeitet, um #Empfehlungen zu geben oder Informationen effektiv zu kategorisieren? đ€
Lass uns einen Blick in die Welt der #Embeddings werfen đšâđ» â eine leistungsstarke Technik, die Text in einen mathematischen Raum kodiert und Computern ermöglicht, Textdaten effizienter zu verstehen und zu verarbeiten.
Generierung von Embeddings:
Der Code verwendet OpenAI's Text-Embedding-Modell (text-embedding-ada-002), um Embeddings fĂŒr Textbeschreibungen in einem DataFrame zu generieren.
t-SNE-Visualisierung:
AnschlieĂend wird t-Distributed Stochastic Neighbor Embedding (t-SNE) verwendet, um hochdimensionale Daten in niedrigere Dimensionen zu visualisieren. Dieser Prozess transformiert die Text-Embeddings in einen zweidimensionalen Raum fĂŒr eine einfachere Visualisierung.
Ergebnisse der Visualisierung:
Die resultierenden Spalten 'description_x' und 'description_y' im DataFrame enthalten die Koordinaten jeder Textbeschreibung im 2D-Raum. Dadurch können wir die Beziehungen zwischen verschiedenen Text-Embeddings visualisieren.
Power BI:
Um euch mit dem #Embeddings etwas vertrauter zu machen, haben wir die Daten in einem Power BI dargestellt. Dort seht ihr eine Punktwolke. Jeder Punkt steht fĂŒr einen Film. Je nĂ€her zwei Punkte sind, desto Ă€hnlicher sind ihre Beschreibungen.
Mit unserem Power BI kann du auch mal von deinem Lieblingsfilm ausgehend gucken, welche anderen Filme Àhnliche Beschreibungen haben.
Und so funktioniert es!
Zuerst suchst du in der linken Leiste deinen Filmtitel. Dadurch Àndert sich die Tabelle in der unteren hÀlft.
Klicke auf den Titel in der Tabelle, um den Punkt in der Punktwolke zu finden. Mit den Schiebereglern kannst du deinen Film in die Mitte zentrieren. Klicke nun erneut auf den Filmtitel, damit die anderen Filmpunkte wieder erscheinen.
Erkunde die Punkte in der NĂ€he deines Filmes mit der Maus. Möglicherweise findest du hier einen Kandidaten fĂŒr deinen nĂ€chsten Weihnachtsfilm.
Hast du eine Idee, was die unterschiedlichen Farben in unserem Plot bedeuten könnten?
In diesem Power BI findest du eine Ăbersicht der Weihnachtsfilme in verschiedenen Kategorien. đđŹđ
Du kannst es auch mit dem Pfeil auf der rechten Seite vergröĂern.
Comments