- เผยแพร่เมื่อ
LLama 3.1 - ทำไมราคาถึงต่างกันถึง 9 เท่า?
- ผู้เขียน

- ชื่อ
- AbnAsia.org
- @steven_n_t
"Llama-3.1 405b ออกมาได้ประมาณหนึ่งวันแล้ว และเราเห็นความแตกต่างอย่างมากในราคา (แพงกว่าถึง 9 เท่าจนถึงตอนนี้) - ระหว่าง 2.7 ดอลลาร์ต่อล้านโทเค็น ไปจนถึง 14 ดอลลาร์ต่อล้านโทเค็น
หมายเหตุ: นี่เป็นแผนภูมิที่อัปเดตเพื่อแก้ไขราคาของ IBM ซึ่งก่อนหน้านี้แสดงอินพุต 5 และเอาต์พุต $35
บริษัทอย่าง Azure นั้นน่าสนใจที่สุด เนื่องจากพวกเขาเป็นผู้ให้บริการรายใหญ่ที่สุดที่ระบุไว้ - ไม่มีราคาที่ฉันสามารถหาได้สำหรับ AWS หรือ Google Vertex ดังนั้นหาก Azure เป็นเกณฑ์มาตรฐานที่เหมาะสมในการดู ราคาก็จะอยู่ที่ประมาณราคา GPT-4o .
สำหรับบริบทการสนทนา ราคาโมเดลที่เป็นกรรมสิทธิ์บางส่วน:
GPT-4o: อินพุต 5 ดอลลาร์ / เอาต์พุต 15 ล้านดอลลาร์
GPT-4o-Mini: อินพุต 0.6
Claude Sonnet 3.5: อินพุต 15
ในการคำนวณค่าเฉลี่ย ฉันถือว่าน้ำหนักอินพุต 80% และน้ำหนักเอาต์พุต 20%
โปรดทราบว่าผู้ให้บริการบางรายไม่ได้เปิดเผยว่าพวกเขากำลังจำกัดโมเดลในลักษณะใดก็ตาม เช่น บางครั้งผู้ให้บริการอาจจำกัดความยาวของบริบทและแทนที่จะเป็น 128k ดั้งเดิม คุณจะได้รับ 32k เป็นไปได้ว่าบางส่วนมีปริมาณ แต่ฉันยังไม่เห็นว่ามีการเรียกออกมาอย่างชัดเจน ซึ่งไม่ได้คำนึงถึงขีดจำกัดอัตราหรือความเร็วด้วย ซึ่งเป็นปัจจัยสำคัญอื่นๆ"

ผู้เขียน
Ai Base Network (ABN), ABN ASIA ถูกก่อตั้งขึ้นโดยคนที่มีรากฐานลึกในวงการวิชาการ มีประสบการณ์การทำงานในสหรัฐอเมริกา ดัตช์ ฮังการี ญี่ปุ่น เกาหลีใต้ สิงคโปร์ และเวียดนาม ABN Asia เป็นที่เราพบกันของวิทยาลัยและเทคโนโลยี ด้วยโซลูชันขั้นสูงและบริการพัฒนาซอฟต์แวร์ที่มีความสามารถ เราช่วยธุรกิจเติบโตและเข้าสู่ฉากโลก ความมุ่งมั่นของเรา: ด่วนขึ้น ดีขึ้น น่าเชื่อถือมากขึ้น ในกรณีส่วนมาก: ราคาถูกด้วย
หากคุณต้องการบริการ IT การให้คำปรึกษาดิจิทัล โซลูชันซอฟต์แวร์ใช้ได้หรือหากคุณต้องการส่งคำขอข้อเสนอ (RFPs) อย่าลังเลที่จะติดต่อเรา คุณสามารถติดต่อเราได้ที่ [email protected] เราพร้อมช่วยเหลือคุณด้านทุกความต้องการทางเทคโนโลยีของคุณทุกเมื่อ

© ABN ASIA