01. Manfaatkan berbagai model LLM yang berbeda
Memanfaatkan berbagai model LLM
# File konfigurasi untuk mengelola API KEY sebagai environment variable
# Pastikan sudah menginstall package python_dotenv
# !pip install python_dotenv
from dotenv import load_dotenv
# API KEY ì •ë³´ë¡œë“œ
load_dotenv()
# Mengatur pelacakan LangSmith. https://smith.langchain.com
# Pastikan sudah menginstall package langchain_teddynote
# !pip install langchain-teddynote
from langchain_altero import logging
from langchain_altero.messages import stream_response
# Masukkan nama untuk proyek Anda.
logging.langsmith("CH04-Models")
OpenAI
OpenAi merupakan Model Bahasa Besar (Large Language Model, LLM) khusus obrolan dari OpenAI.
Ketika Anda membuat objek, Anda dapat menentukan nilai opsi berikut ini. Opsi-opsi tersebut dijelaskan secara rinci di bawah ini
temperature
- Pilih temperature pengambilan sampel yang akan digunakan, antara 0 dan 2. Nilai yang lebih tinggi, seperti 0,8, membuat output lebih acak, sementara nilai yang lebih rendah, seperti 0,2, membuat output lebih terfokus dan deterministik.
max_tokens
- Jumlah maksimum token yang akan dihasilkan dari penyelesaian obrolan.
model_name
: Model yang berlaku
spesifikasi model
Nama Model | Keterangan | Panjang Konteks | Data Pelatihan |
---|---|---|---|
gpt-4o | GPT-4o baru: Model andalan multi-mode terbaru yang lebih murah dan lebih cepat dibandingkan GPT-4 Turbo. | 128.000 token | Hingga Oktober 2023 |
gpt-4-turbo | Ini adalah model GPT-4 Turbo terbaru dan dilengkapi fitur penglihatan. Anda dapat menggunakan mode JSON dan panggilan fungsi. | 128.000 token | Hingga Desember 2023 |
gpt-4 | Ini adalah model GPT-4 terbaru. | 8.192 token | Hingga September 2021 |
gpt-3.5-turbo-0125 | Model GPT-3.5 Turbo terbaru, yang merespons lebih akurat sesuai format yang diminta dan mengatasi masalah pengkodean teks untuk panggilan fungsi non-bahasa Inggris. | 16.385 token | Hingga September 2021 |
gpt-3.5-turbo | Saat ini menunjuk ke gpt-3.5-turbo-0125. | 16.385 token | Hingga September 2021 |
from langchain_openai import ChatOpenAI
# Membuat objek ChatOpenAI.
gpt = ChatOpenAI(
suhu = 0,
nama_model = "gpt-4o", # nama model
)
# Gunakan stream() sebagai ganti dari invoke() untuk output streaming.
answer = gpt.stream("apa ibukota negara indonesia?")
# Keluarkan jawabannya
stream_response(jawaban)
Ibukota negara Indonesia adalah Jakarta. Jakarta terletak di pesisir barat laut Pulau Jawa dan merupakan pusat pemerintahan, ekonomi, dan budaya Indonesia.
ChatAnthropic
Anthropic adalah perusahaan rintisan asal Amerika yang berfokus pada keamanan dan penelitian kecerdasan buatan (AI). Berikut adalah beberapa fakta penting tentang Anthropic - Perusahaan AI yang didirikan pada tahun 2021 - Berkantor pusat di San Francisco, Amerika Serikat - Didirikan oleh mantan karyawan OpenAI (termasuk Daniela Amodei dan Dario Amodei) - Terdaftar sebagai Public Benefit Corporation
Claude
- Rangkaian model bahasa skala besar (LLM) andalan Anthropic
- Masalah kunci API: https://console.anthropic.com/settings/keys (opens in a new tab)
- Daftar model: https://docs.anthropic.com/en/docs/about-claude/models (opens in a new tab)
Daftar model dari Anthropic
Nama Model | Model | API Antropik | Batuan Dasar AWS | GCP Vertex AI |
---|---|---|---|---|
Karya Claude 3.5 | Dijadwalkan rilis pada akhir tahun | Dijadwalkan rilis pada akhir tahun | Dijadwalkan rilis pada akhir tahun | Dijadwalkan rilis pada akhir tahun |
Claude 3.5 Soneta | claude-3-5-soneta-20240620 | antropik.claude-3-5-soneta-20240620-v1:0 | c1aude-3-5-soneta@20240620 | claude-3-5-soneta@20240620 |
Claude 3.5 Haiku | Dijadwalkan rilis pada akhir tahun | Dijadwalkan rilis pada akhir tahun | Dijadwalkan rilis pada akhir tahun | Dijadwalkan rilis pada akhir tahun |
Karya Claude 3 | claude-3-opus-20240229 | antropik.claude-3-opus-20240229-v1:0 | c1aude-3-opus@20240229 | claude-3-opus@20240229 |
Claude 3 Soneta | claude-3-soneta-20240229 | antropik.claude-3-soneta-20240229-v1:0 | c1aude-3-soneta@20240229 | claude-3-soneta@20240229 |
Claude 3 Haiku | claude-3-haiku-20240307 | antropik.claude-3-haiku-20240307-v1:0 | c1aude-3-haiku@20240307 | claude-3-haiku@20240307 |
from langchain_anthropic import ChatAnthropic
# Membuat objek ChatAnthropic.
anthropic = ChatAnthropic(
model="claude-3-5-sonnet-20240620",
temperature = 0,
max_tokens = 1024,
timeout = Tidak ada,
max_retries = 2,
# parameter lainnya...
)
# gunakan stream() selain invoke() untuk output streaming.
jawaban = antropik.stream("apa ibukota negara indonesia?")
# Keluarkan jawabannya
stream_response(jawaban)
Ibukota negara Indonesia adalah Jakarta.
Namun, perlu diketahui bahwa pemerintah Indonesia saat ini sedang dalam proses memindahkan ibukota negara dari Jakarta ke lokasi baru di Provinsi Kalimantan Timur. Ibukota baru ini akan diberi nama Nusantara.
Beberapa poin penting:
1. Jakarta masih berfungsi sebagai ibukota saat ini.
2. Rencana pemindahan ibukota ke Nusantara diharapkan selesai sekitar tahun 2024-2025.
3. Jakarta akan tetap menjadi pusat bisnis dan ekonomi Indonesia.
4. Alasan utama pemindahan ibukota antara lain untuk mengurangi kepadatan penduduk di Jakarta dan menyeimbangkan pembangunan di Indonesia.
Jadi, saat ini Jakarta masih merupakan ibukota Indonesia, tetapi dalam beberapa tahun ke depan, ibukota akan berpindah ke Nusantara di Kalimantan Timur.
ChatCohere
Cohere adalah perusahaan AI terkemuka yang menyediakan solusi AI untuk perusahaan. Perusahaan ini mengembangkan model bahasa berskala besar (LLM), sehingga memudahkan bisnis untuk mengadopsi dan memanfaatkan teknologi AI.
- Cohere adalah perusahaan rintisan yang menyediakan platform AI perusahaan dan didirikan pada tahun 2020.
- Cohere baru-baru ini mengumpulkan $270 juta dalam putaran pendanaan Seri C, yang menunjukkan potensi pertumbuhan perusahaan.
- Investor utama termasuk Inovia Capital, NVIDIA, Oracle, dan Salesforce Ventures.
Command R+
- LLM terbaru dari Cohere, Command R+, adalah model yang dioptimalkan untuk perusahaan. Fitur utama:
- Jendela konteks panjang dengan 128 ribu token
- Fitur Pencarian Lanjutan Generasi yang Disempurnakan (RAG).
- Mendukung 10 bahasa bisnis utama
- Kemampuan untuk menggunakan alat untuk mengotomatisasi proses bisnis yang kompleks
Aya
- Merupakan LLM multibahasa sumber terbuka yang dikembangkan oleh Cohere for AI (lembaga penelitian nirlaba Cohere).
- Dapat mendukung 101 bahasa, lebih dari dua kali lipat model open source yang ada.
- Juga merilis kumpulan data pelatihan multibahasa berskala besar yang berisi 513 juta titik data.
from langchain_cohere import ChatCohere
# Membuat objek ChatCohere.
cohere = ChatCohere(suhu=0)
# Gunakan stream() sebagai ganti dari invoke() untuk output streaming.
jawaban = cohere.stream("Apa itu cinta?")
# Keluarkan jawabannya
stream_response(jawaban)
ChatUpStage
Upstage adalah perusahaan rintisan Korea yang berspesialisasi dalam teknologi kecerdasan buatan (artificial intelligence/AI), khususnya di bidang model bahasa berskala besar (LLM) dan AI dokumen.
Produk dan teknologi unggulan
- Solar LLM: Model bahasa berskala besar unggulan Upstage
- Document AI Pack: Solusi pemrosesan dokumen berdasarkan teknologi OCR
- AskUp Seargest: layanan pencarian dan rekomendasi yang dipersonalisasi, versi yang ditingkatkan dari chatbot gratis AskUp dengan integrasi ChatGPT.
Penerbitan kunci API
Dapatkan kunci API: https://console.upstage.ai/api-keys (opens in a new tab)
from langchain_upstage import ChatUpstage
# Membuat objek ChatUpstage.
upstage = ChatUpstage()
# Gunakan stream() sebagai pengganti invoke() untuk output streaming.
answer = upstage.stream("Apa itu cinta?")
# Keluarkan jawabannya
stream_response(jawaban)
Xionic
Sionic AI adalah startup kecerdasan buatan yang menjanjikan dari Korea Selatan yang mengembangkan solusi AI generatif untuk perusahaan. Berikut adalah beberapa fakta penting tentang perusahaan ini
Produk unggulan
- Platform STORM: Platform yang memungkinkan organisasi untuk menerapkan AI generatif tanpa masalah teknis
- STORM Answer: Solusi AI generatif yang dioptimalkan untuk perusahaan yang bertujuan untuk meningkatkan produktivitas bisnis
- Xionic: Model AI bahasa Korea dengan lisensi yang tersedia secara komersial Model bahasa Korea dengan lisensi yang tersedia secara komersial
Tautan: https://github.com/sionic-ai/xionic (opens in a new tab)
from langchain_openai import ChatOpenAI
xionic = ChatOpenAI(
model_name="xionic-1-72b-20240610",
base_url="https://sionic.chat/v1/",
api_key="934c4bbc-c384-4bea-af82-1450d7f8128d",
)
# Gunakan stream() sebagai pengganti invoke() untuk output streaming.
jawaban = xionic.stream("Apa itu cinta?")
# Keluarkan jawabannya
stream_response(jawaban)
LogicKor
LogicKor adalah papan peringkat tolok ukur yang dirancang untuk menilai kemampuan berpikir multidisiplin dalam model bahasa Korea.
- Tujuan: Tolok ukur untuk mengukur kemampuan berpikir multidisiplin dalam model bahasa Korea.
- Area penilaian: Penalaran bahasa Korea, matematika, menulis, pengkodean, pemahaman, dll.
Fitur utama
- Mengevaluasi berbagai model: Membandingkan kinerja model bahasa yang berbeda dari dalam dan luar negeri
- Pengukuran kinerja yang objektif: Memberikan indikator objektif dengan mengevaluasi kinerja aktual model dari berbagai sudut
- Sumber terbuka: Platform terbuka yang dapat diakses oleh siapa saja dan memeriksa hasilnya
Papan Peringkat LogicKor menjadi alat penting untuk pengembangan model AI Korea, dan kami menantikan peningkatan dan pengembangannya yang berkelanjutan.