05. OllamaEmbeddings
Ollama
Ollama adalah proyek sumber terbuka yang memudahkan untuk menjalankan model bahasa berskala besar (LLM) di lingkungan lokal Anda. Alat ini memungkinkan Anda mengunduh dan menjalankan berbagai macam LLM dengan perintah sederhana, dan memungkinkan pengembang untuk bereksperimen dan menggunakan model AI secara langsung di komputer mereka sendiri. Dengan antarmuka yang mudah digunakan dan kinerja yang cepat, Ollama adalah alat yang membuat pengembangan dan eksperimen AI menjadi lebih mudah diakses dan efisien.
Python
texts = [
"Headphone Bluetooth Nirkabel dengan Pembatalan Kebisingan.",
"Speaker Bluetooth Tahan Air Portabel dengan Baterai 20 jam.",
"Kursi Kantor Ergonomis dengan Dukungan Lumbar dan Ketinggian yang Dapat Disesuaikan.",
"TV Smart 4K Ultra HD dengan Layanan Streaming dan Kontrol Suara.",
"Meja Berdiri Elektrik dengan Tinggi yang Dapat Disetel Memori."
]
Periksa model penyematan yang didukung
https://ollama.com/library (opens in a new tab)
Python
from langchain_community.embeddings import OllamaEmbeddings
ollama_embeddings = OllamaEmbeddings(
model="nomic-embed-text",
# model="chatfire/bge-m3:q8_0" # BGE-M3
)
sematkan query
Python
# Embedding kueri
embedded_query = ollama_embeddings.embed_query("Saya membutuhkan produk untuk memutar musik")
# Menampilkan dimensi embedding
print(len(embedded_query))
Output
768
sematkan dokumen
Python
# Embedding dokumen
embedded_documents = ollama_embeddings.embed_documents(texts)
Mengeluarkan hasil perhitungan kemiripan.
Python
import numpy as np
# Pertanyaan (embedded_query): Tolong beri tahu saya tentang LangChain.
similarity = np.array(embedded_query) @ np.array(embedded_documents).T
# Mengurutkan berdasarkan kesamaan dalam urutan menurun
sorted_idx = (np.array(embedded_query) @ np.array(embedded_documents).T).argsort()[::-1]
# Menampilkan hasil
print("[Kueri] Saya membutuhkan produk untuk memutar musik\n====================================")
for i, idx in enumerate(sorted_idx):
print(f"[{i}] Kesamaan: {similarity[idx]:.3f} | {texts[idx]}")
print()
Output
[Kueri] Saya membutuhkan produk untuk memutar musik
====================================
[0] Kesamaan: 242.832 | Speaker Bluetooth Tahan Air Portabel dengan Baterai 20 jam.
[1] Kesamaan: 240.651 | Headphone Bluetooth Nirkabel dengan Pembatalan Kebisingan.
[2] Kesamaan: 240.351 | Meja Berdiri Elektrik dengan Tinggi yang Dapat Disetel Memori.
[3] Kesamaan: 220.028 | TV Smart 4K Ultra HD dengan Layanan Streaming dan Kontrol Suara.
[4] Kesamaan: 213.844 | Kursi Kantor Ergonomis dengan Dukungan Lumbar dan Ketinggian yang Dapat Disesuaikan.