กูเกิลและ OpenAI ผลัดกันชิงอันดับหนึ่งบนการจัดอันดับ Chatbot Arena ของ LMSys โดยสัปดาห์ที่ผ่านมานับเป็นช่วงที่แข่งกันดุเดือดเป็นพิเศษเพราะเอาชนะสลับกันหลายรอบในสัปดาห์เดียว
การแข่งขันรอบนี้เริ่มจากกูเกิลปล่อย API เวอร์ชั่นพิเศษ Gemini-Exp-1114 ที่เปิดให้ใช้งานเฉพาะใน AI Studio เท่านั้น โมเดลเวอร์ชั่นนี้เอาชนะโมเดลราคาแพงของ OpenAI อย่าง o1-preview และ o1-mini ไปได้ แต่หลังจากนั้น OpenAI ก็ปล่อยโมเดล ChatGPT-4o-latest เวอร์ชั่น 20 พฤศจิกายนออกมา เอาชนะ Gemini กลับไปได้อีกครั้ง แต่ชนะได้เพียงวันเดียวกูเกิลก็ปล่อย Gemini-Exp-1121 ออกมาอีกรอบ และทำคะแนนเอาชนะ ChatGPT-4o ตัวล่าสุดไปได้อีกครั้ง
เนื่องจากโมเดลเพิ่งปล่อยลงสนามทดสอบไม่นาน จำนวนครั้งที่โหวตของ Gemini-Exp-1121 มีเพียงไม่ถึงห้าพันครั้ง กรอบความมั่นใจ 95% ของคะแนนก็ยังกว้างมากในช่วง +7/-9 แต่ภาพรวมตอนนี้หัวตารางก็เป็นการแข่งขันระหว่างกูเกิลและ OpenAI สองบริษัท
ในตารางยังมีโมเดลอื่นๆ ที่น่าสนใจเข้ามาอยู่ใน 10 อันดับแรก เช่น Grok-2-08-13 ที่ขึ้นมาอันดับ ร่วมกับ Yi-Lightning, GPT-4o, และ Claude 3.5 Sonnet
ที่มา - LM Arena