Google เปิดตัว Gemini 1.01 ตามกำหนดการเดิม ผลการทดสอบชนะ GPT-4 เกือบทุกการทดสอบ โดยแบ่งออกเป็น Gemini Ultra, Gemini Pro และ Gemini Nano พร้อมเปิดให้ใช้ Gemini Pro ได้แล้วใน Bard
Google Gemini คืออะไร?
Google Gemini คือ โมเดลปัญญาประดิษฐ์แบบ LLM ของ Google โดยเป็นโมเดลแบบ Multimodal ที่สามารถทำความเข้าใจข้อมูลประเภทต่าง ๆ ได้ไม่ว่าจะเป็นข้อความ โค้ด เสียง รูปภาพ และวิดีโอ
อธิบายให้ง่ายกว่านั้น Gemini ของ Google เทียบได้กับโมเดล GPT อย่าง GPT-3.5 และ GPT-4 ที่เป็นโมเดลเบื้องหลังของ AI Chat อย่าง ChatGPT
ใน Gemini 1.0 ที่เป็นรุ่นแรกที่ Google ปล่อยออกมาจะแบ่ง Gemini ออกเป็น 3 ไซส์2
- Gemini Ultra เป็นโมเดลที่ใหญ่ที่สุดและมีความสามารถมากที่สุดของ Gemini สำหรับงานที่มีความซับซ้อนสูง
- Gemini Pro เป็นโมเดลสำหรับการใช้งานทั่วไปที่หลากหลาย โดยจะเริ่มนำมาใช้กับ Bard แทนโมเดล PaLM-2 (ในระยะแรกจะใช้ภาษาอังกฤษได้เท่านั้น)
- Gemini Nano สำหรับอุปกรณ์พกพา โดยจะเริ่มจากการใช้ใน Pixel 8 Pro
สอดคล้องกับที่ Google บอกว่า Gemini เป็นโมเดลที่มีความยืดหยุ่นมากที่สุดของ Google ซึ่งสามารถรันบนทุกสิ่งได้อย่างมีประสิทธิภาพตั้งแต่ Data Center ไปจนถึงอุปกรณ์มือถือ
ผลการทดสอบ Gemini 1.0 ชนะ GPT-4 เกือบทุกรายการ
ในด้านประสิทธิภาพของ Gemini Ultra3 ผลทดสอบออกมาตามภาพคะแนนด้านล่าง และชนะ GPT-4 ได้เกือบทุกการทดสอบ ไม่ว่าจะเป็น MMLU (Massive Multitask Language Understanding) ที่เป็นคำถามวิชาการในด้านต่างๆ, การทดสอบการให้เหตุผลอย่าง Big-Bench Hard และ DROP, ตลอดจนการทดสอบด้านคณิตศาสตร์ด้วย MATH และ GSM8K
รวมทั้งการทดสอบเขียนโค้ด Python เองก็สามารถทำได้ดีกว่า GPT-4 ทั้งการทดสอบด้วย HumanEval และ Natural2Code
นอกจากนั้น ในการทดสอบเกี่ยวกับภาพ วิดีโอ และเสียง ทั้งหมดก็สามารทำได้ดีกว่าโมเดลเฉพาะทางและโมเดลที่เป็นผู้นำก่อนหน้านี้เช่นกัน
จากผลการทดสอบเหล่านี้ นั่นหมายความว่าความสามารถในการให้เหตุผลหลายรูปแบบที่ซับซ้อนของ Gemini 1.0 หมายถึงการทำความเข้าใจข้อมูลที่เป็นลายลักษณ์อักษรและภาพที่ซับซ้อนได้แล้วในระดับหนึ่ง (และแน่นอนว่าจะทำได้ดียิ่งขึ้นเรื่อยๆ) ซึ่งจะเป็นมีประโยชน์อย่างมากกับการดึงข้อมูลจากเอกสารนับหมื่นนับแสนผ่านการอ่าน การกรอง และการทำความเข้าใจข้อมูล
Bard เริ่มใช้ Gemini Pro ได้แล้วตอนนี้!
สำหรับในด้านของ Bard ที่เป็น Generative AI ของ Google เองก็จะเปลี่ยนมาใช้โมเดล Gemini Pro จากเดิมที่ใช้ PaLM-2 ซึ่งสามารถใช้งาน Bard ที่มี Gemini Pro อยู่เบื้องหลังได้แล้วตอนนี้ แต่ปัจจุบันจะใช้ใน Bard เวอร์ชั่นภาษาอังกฤษเท่านั้น
อนาคตอันใกล้ของ Google Gemini
นอกจากนี้ Google ยังได้เปิดเผยว่าจะขยาย Gemini ไปสู่ Product อื่นๆ ในอีกไม่กี่เดือนข้างหน้า ไม่ว่าจะเป็น Search ที่ปัจจุบันใช้กับ Search Generative Experience (SGE), โฆษณา, Chrome และ Duet AI
ในด้านของผู้พัฒนา ตั้งแต่วันที่ 13 ธันวาคมนี้เป็นต้นไป Developers และลูกค้าองค์กรจะสามารถเข้าถึง Gemini Pro ผ่านทาง Gemini API ใน Google AI Studio หรือ Google Cloud Vertex AI
ส่วนนักพัฒนา Android จะสามารถสร้างด้วย Gemini Nano ผ่าน AICore ซึ่งเป็นระบบใหม่ที่พร้อมใช้งานใน Android 14 โดยเริ่มต้นจาก Pixel 8 Pro
Gemini Ultra
สำหรับ Gemini Ultra ที่หลายคนกำลังตั้งตารอ ตอนนี้ยังอยู่ในระหว่างการปรับปรุงและตรวจสอบความปลอดภัยก่อนจะเปิดใช้ผู้ใช้งานทั่วไปใช้กันในวงกว้าง
ซึ่งในระยะแรก Google จะเปิด Gemini Ultra ให้แก่ลูกค้า นักพัฒนา คู่ค้า และผู้เชี่ยวชาญด้านความปลอดภัยที่ได้รับเลือก เพื่อการทดลองและให้ข้อเสนอแนะ ก่อนที่จะเผยแพร่สู่นักพัฒนาและลูกค้าองค์กรในต้นปีหน้า
และสุดท้าย ในต้นปีหน้า Google จะเปิดตัว Bard Advanced ซึ่งจะเปิดให้ผู้ใช้งาน Bard เข้าถึงโมเดล Gemini Ultra (ที่คาดว่าน่าจะเก็บค่าบริการแบบ ChatGPT Plus)