เผยแพร่เมื่อ

LLama 3.1 - ทำไมราคาถึงต่างกันถึง 9 เท่า?

ผู้เขียน

"Llama-3.1 405b ออกมาได้ประมาณหนึ่งวันแล้ว และเราเห็นความแตกต่างอย่างมากในราคา (แพงกว่าถึง 9 เท่าจนถึงตอนนี้) - ระหว่าง 2.7 ดอลลาร์ต่อล้านโทเค็น ไปจนถึง 14 ดอลลาร์ต่อล้านโทเค็น

หมายเหตุ: นี่เป็นแผนภูมิที่อัปเดตเพื่อแก้ไขราคาของ IBM ซึ่งก่อนหน้านี้แสดงอินพุต 35แต่จริงๆแล้วเป็นอินพุต35 แต่จริงๆ แล้วเป็นอินพุต 5 และเอาต์พุต $35

บริษัทอย่าง Azure นั้นน่าสนใจที่สุด เนื่องจากพวกเขาเป็นผู้ให้บริการรายใหญ่ที่สุดที่ระบุไว้ - ไม่มีราคาที่ฉันสามารถหาได้สำหรับ AWS หรือ Google Vertex ดังนั้นหาก Azure เป็นเกณฑ์มาตรฐานที่เหมาะสมในการดู ราคาก็จะอยู่ที่ประมาณราคา GPT-4o .

สำหรับบริบทการสนทนา ราคาโมเดลที่เป็นกรรมสิทธิ์บางส่วน:

  • GPT-4o: อินพุต 5 ดอลลาร์ / เอาต์พุต 15 ล้านดอลลาร์

  • GPT-4o-Mini: อินพุต 0.15/เอาต์พุต0.15 / เอาต์พุต 0.6

  • Claude Sonnet 3.5: อินพุต 3/เอาต์พุต3 / เอาต์พุต 15

ในการคำนวณค่าเฉลี่ย ฉันถือว่าน้ำหนักอินพุต 80% และน้ำหนักเอาต์พุต 20%

โปรดทราบว่าผู้ให้บริการบางรายไม่ได้เปิดเผยว่าพวกเขากำลังจำกัดโมเดลในลักษณะใดก็ตาม เช่น บางครั้งผู้ให้บริการอาจจำกัดความยาวของบริบทและแทนที่จะเป็น 128k ดั้งเดิม คุณจะได้รับ 32k เป็นไปได้ว่าบางส่วนมีปริมาณ แต่ฉันยังไม่เห็นว่ามีการเรียกออกมาอย่างชัดเจน ซึ่งไม่ได้คำนึงถึงขีดจำกัดอัตราหรือความเร็วด้วย ซึ่งเป็นปัจจัยสำคัญอื่นๆ"

Image

ผู้เขียน

Ai Base Network (ABN), ABN ASIA ถูกก่อตั้งขึ้นโดยคนที่มีรากฐานลึกในวงการวิชาการ มีประสบการณ์การทำงานในสหรัฐอเมริกา ดัตช์ ฮังการี ญี่ปุ่น เกาหลีใต้ สิงคโปร์ และเวียดนาม ABN Asia เป็นที่เราพบกันของวิทยาลัยและเทคโนโลยี ด้วยโซลูชันขั้นสูงและบริการพัฒนาซอฟต์แวร์ที่มีความสามารถ เราช่วยธุรกิจเติบโตและเข้าสู่ฉากโลก ความมุ่งมั่นของเรา: ด่วนขึ้น ดีขึ้น น่าเชื่อถือมากขึ้น ในกรณีส่วนมาก: ราคาถูกด้วย

หากคุณต้องการบริการ IT การให้คำปรึกษาดิจิทัล โซลูชันซอฟต์แวร์ใช้ได้หรือหากคุณต้องการส่งคำขอข้อเสนอ (RFPs) อย่าลังเลที่จะติดต่อเรา คุณสามารถติดต่อเราได้ที่ [email protected] เราพร้อมช่วยเหลือคุณด้านทุกความต้องการทางเทคโนโลยีของคุณทุกเมื่อ

ABNAsia.org

© ABN ASIA