Google เปิดตัว AI ชุดใหญ่ในงาน I/O 2025 เผยโฉม Deep Think, Veo 3, Imagen 4

งาน Google I/O 2025 ซึ่งเป็นงานประชุมนักพัฒนาประจำปีใหญ่ที่สุดของกูเกิล (Google) ได้เริ่มต้นขึ้นแล้วเมื่อวันอังคาร (20 พ.ค.) ณ เมาน์เทนวิว รัฐแคลิฟอร์เนีย สหรัฐฯ โดยงานนี้จะจัดขึ้นเป็นเวลา 2 วัน ภายในงานมีการประกาศเปิดตัวผลิตภัณฑ์และบริการใหม่ ๆ มากมายที่ครอบคลุมทุกกลุ่มธุรกิจของกูเกิล

สำนักข่าวซินหัวรายงานว่า หนึ่งในไฮไลต์สำคัญของงานคือ “Deep Think” ซึ่งเป็นโหมดการใช้เหตุผลที่ปรับปรุงให้ฉลาดขึ้น สำหรับ Gemini 2.5 Pro โมเดล AI รุ่นเรือธงของกูเกิล ทางกูเกิลระบุว่า Deep Think นี้จะช่วยให้ AI สามารถประเมินคำตอบที่เป็นไปได้หลาย ๆ แบบก่อนที่จะให้คำตอบสุดท้าย ทำให้มันทำงานได้ดีขึ้นมากในการทดสอบวัดประสิทธิภาพ (benchmark) บางประเภท

ในปัจจุบัน Deep Think เปิดให้ใช้เฉพาะกลุ่มผู้ทดสอบที่ได้รับความไว้วางใจใช้งานผ่าน Gemini API โดยกูเกิลแจ้งว่ากำลังอยู่ในขั้นตอนการประเมินความปลอดภัยเพิ่มเติมอย่างละเอียด ก่อนที่จะเปิดให้คนทั่วไปได้ใช้งาน

อีกหนึ่งประกาศที่น่าสนใจคือ Veo 3 แอปตัดต่อวิดีโอตัวใหม่ที่ผู้ใช้สามารถสั่งงานได้ด้วยการพิมพ์ข้อความหรือใช้รูปภาพเป็นพรอมต์ (prompt) Veo 3 นี้ได้รับการพัฒนาให้ดีกว่ารุ่นก่อนหน้าอย่าง Veo 2 โดยสามารถสร้างสรรค์วิดีโอที่มีคุณภาพสูงขึ้น กูเกิลอ้างว่า Veo 3 สามารถใส่เสียงเอฟเฟกต์ เสียงแบ็กกราวนด์ หรือแม้กระทั่งเสียงบทสนทนาเข้าไปในวิดีโอที่มันสร้างขึ้นได้ด้วย

Veo 3 เปิดให้ใช้งานแล้วตั้งแต่วันอังคารผ่านแอป Gemini ซึ่งเป็นแชตบอตของกูเกิล โดยสงวนสิทธิ์เฉพาะผู้ที่สมัครสมาชิกแผน AI Ultra ซึ่งมีค่าบริการรายเดือนอยู่ที่ 249.99 ดอลลาร์สหรัฐ

การสมัครสมาชิกแผน AI Ultra ของ Gemini นี้ กูเกิลระบุว่าเป็นการมอบ “สิทธิ์การเข้าถึงระดับสูงสุด” ในแอปและบริการต่าง ๆ ที่ขับเคลื่อนด้วย AI ของกูเกิล

นอกจากนี้ กูเกิลยังได้เปิดตัว Imagen 4 ซึ่งเป็นเครื่องมือสร้างภาพด้วย AI เวอร์ชันล่าสุดที่ทำงานได้เร็วกว่าและทรงพลังกว่า Imagen 3 นอกจากนี้ บริษัทยังมีแผนจะเปิดตัว Imagen 4 รุ่นย่อยที่ทำงานได้เร็วกว่ารุ่นก่อนหน้าถึง 10 เท่า

Imagen 4 สามารถสร้างรายละเอียดเล็ก ๆ น้อย ๆ ในภาพได้อย่างน่าทึ่ง เช่น ลวดลายของเนื้อผ้า หยดน้ำ หรือแม้แต่ขนสัตว์ และยังรองรับการสร้างภาพทั้งสไตล์ภาพถ่ายสมจริงและภาพแบบนามธรรม สามารถสร้างภาพได้หลากหลายอัตราส่วนภาพ และมีความละเอียดสูงสุดถึงระดับ 2K

ทั้ง Veo 3 และ Imagen 4 จะเป็นขุมพลังให้กับ “Flow” ซึ่งเป็นเครื่องมือสร้างวิดีโอที่ขับเคลื่อนด้วย AI ของกูเกิล ที่ออกแบบมาเพื่อผู้สร้างภาพยนตร์และคอนเทนต์ครีเอเตอร์โดยเฉพาะ

กูเกิลยังประกาศอีกว่า Gemini Live ซึ่งเป็นฟีเจอร์ที่ให้ผู้ใช้สามารถโต้ตอบด้วยเสียงแบบเรียลไทม์ รับข้อมูลจากกล้อง และแชร์หน้าจอได้ จะเริ่มเปิดให้ผู้ใช้งาน iOS และ Android ทุกคนได้ใช้ภายในสัปดาห์นี้ Gemini Live นี้ขับเคลื่อนด้วยเทคโนโลยี Project Astra ทำให้สามารถสนทนาได้เกือบจะทันที พร้อม ๆ กับวิเคราะห์ภาพวิดีโอจากกล้องสมาร์ตโฟนหรือหน้าจอของผู้ใช้ไปพร้อมกัน

ในอีกไม่กี่สัปดาห์ข้างหน้า Gemini Live จะทำงานร่วมกับแอปอื่น ๆ ของกูเกิลได้มากยิ่งขึ้น เช่น สามารถบอกเส้นทางจาก Google Maps สร้างกิจกรรมใน Google Calendar และสร้างรายการสิ่งที่ต้องทำผ่าน Google Tasks ได้

กูเกิลกำลังทยอยเปิดตัว AI Mode ซึ่งเป็นฟีเจอร์ทดลองใน Google Search ที่ช่วยให้ผู้ใช้สามารถถามคำถามที่ซับซ้อนและมีหลายส่วนประกอบผ่านหน้าจอการใช้งาน AI ให้กับผู้ใช้ในสหรัฐฯ ภายในสัปดาห์นี้

นอกจากนี้ กูเกิลยังได้เปิดตัวฟีเจอร์ใหม่ ๆ ใน AI Workspace สำหรับ Gmail, Google Docs และ Google Vids ตัวอย่างเช่น ใน Gmail เร็ว ๆ นี้จะมีฟีเจอร์การตอบกลับอัจฉริยะแบบเฉพาะบุคคล และความสามารถใหม่ในการช่วยจัดระเบียบอินบ็อกซ์

บริษัทยังได้เผยโฉมตัวอย่างแว่นตา XR รุ่นใหม่ ที่รองรับเทคโนโลยี AR รวมถึงความสามารถในการแปลภาษาแบบสด ๆ กูเกิลกล่าวว่า “Android XR เป็นแพลตฟอร์ม Android ตัวแรกที่สร้างขึ้นในยุคของ Gemini และรองรับอุปกรณ์หลากหลายรูปแบบการใช้งาน ตั้งแต่ชุดหูฟังไปจนถึงแว่นตา”

โดย สำนักข่าวอินโฟเควสท์ (21 พ.ค. 68)

Google, แชตบอต, Gemini

Google เปิดตัว AI ชุดใหญ่ในงาน I/O 2025 เผยโฉม Deep Think, Veo 3, Imagen 4

ข่าวล่าสุด

คาดสหรัฐเผยดัชนี CPI +2.8% เดือนก.ค. ดีดตัวจากเดือนมิ.ย.

ตลท. ให้ MONO เข้าเกณฑ์ Cash Balance ช่วง 13 -29 ส.ค.

พรุ่งนี้น้ำมันลด! เบนซิน-แก๊สโซฮอล์ ลงลิตรละ 30 สต.

CBG โชว์ Q2/68 กำไรสุทธิโต 16%ตามยอดขาย แต่ส่งออก CLMV ลดลงเล็กน้อยรับผลชายแดนไทย-กัมพูชา

WHA โชว์ฟอร์ม 1H68 รายได้-กำไรพุ่ง ส่งสัญญาณบวกต่อเนื่อง ลุ้น All-Time High ปีที่ 4

ฟิทช์คงอันดับเครดิตภายในประเทศ KCE ที่ A-(tha) แนวโน้มมีเสถียรภาพ

สมาชิกของสมาคมผู้ผลิตข่าวออนไลน์