Tag Archives: Hybrid method

Evolution of Recommendation Systems

สวัสดีผู้อ่านทุกท่าน รอบนี้ต้องบอกเลยว่าหาเนื้อหามาเขียนไม่ทันอีกแล้ว 555 ขอโทษผู้อ่านด้วย โพสนี้เลยจะแนะนำเรื่องราวของ Recommendation System จริงๆ ก็แปลมาแหละ ลองอ่านๆ กันดูนะครับ

ในปัจจุบันการเลือกซื้อสินค้า เข้าร้านอาหาร และดูภาพยนตร์ ต้องบอกเลยว่าถูกชักจูงจากระบบ Recommendation System (ย่อยสั้นๆ ว่า RS ละกัน) เป็นส่วนมาก RS  เปลี่ยนพฤติกรรมผู้ใช้ไปมาก คอยแนะนำ คอยชักจูง บางทีเรายังไม่รู้เลยว่าเราต้องการอะไร RS อาจจะรู้ความต้องการมากกว่าเราซะอีก

RS คือระบบคัดกรองข้อมูลอัจฉริยะ ซึ่งช่วยลดตัวเลือกที่จะนำแสนอแก่ผู้ใช้ให้ตรงผู้ใช้มากขึ้น และในปัจจุบันระบบส่วนมากมีการนำ RS เข้าไปใช้งาน ผู้อ่านลองคิดดูสิว่าถ้า Netflix ไม่แนะนำภาพยนตร์ Amazon ไม่แนะนำหนังสือประเภทเดียวกัน Facebook หรือ LinkedIn ไม่แนะนำคนที่น่าจะรู้จัก Yahoo ไม่แนะนำข่าวสารที่น่าสนใจให้ เว็ปเหล่านี้คงขาดความน่าสนใจลงไปโขเลยทีเดียว

คราวนี้เรามาดูกันดีกว่าว่า RS มีส่วนประกอบอะไรบ้าง สำหรับข้อมูลหรือเชื้อเพลิงในการขับเคลื่อนระบบ RS นั้นมีอยู่ 2 อย่างด้วยกัน นั่นคือ Explicit interaction และ Implicit interaction โดย Explicit คือ ข้อมูลโดยตรงที่ได้จากผู้ใช้นั่นเอง เช่น เพศ อายุ เป็นต้น และ Implicit คือข้อมูลโดยอ้อมที่เกี่ยวข้องกับผู้ใช้ เช่น ที่อยู่ปัจจุบัน วันเวลา อุปกรณ์ที่ผู้ใช้ใช้งาน เป็นต้น ยกตัวอย่าง เช่น Amazon ใช้ข้อมูลสินค้าเก่าที่เราเคยเข้าไปดู (Explicit) สินค้าที่ผู้ใช้คนอื่นที่ใกล้เคียงกับเราซื้อ (Implicit) วันเวลาที่ผู้ใช้ใช้งาน (Implicit) จากข้อมูลเหล่านี้ ระบบ RS แบ่งออกได้เป็น 3 ประเภทคร่าวๆ ดังนี้

Collaborative Filtering คือระบบ RS ที่ใช้ข้อมูลการกระทำของเราและเพื่อน เพื่อใช้แนะนำการกระทำที่เราน่าจะทำหรือน่าสนใจ แต่ระบบนี้มีปัญหา Cold Start Problem หรือคือการที่ต้องมีข้อมูลเยอะพอสมควรเพื่อเป็นฐานข้อมูลในการแนะนำ และนอกจากนั้นระบบแบบนี้จะแนะนำการกระทำที่เป็นกระแสในช่วงนั้น โดยไม่แนะนำการกระทำนอกกระแส ก็เป็นข้อเสียเปรียบของระบบ RS แบบนี้ก็ว่าได้ ระบบ RS นี้ยกตัวอย่าง เช่น Amazon, Facebook, Twitter, LinkedIn, Spotify, Google News และ Last.fm

Content-Based Filtering (CBF) คือระบบ RS ที่สนใจในวัตถุนั้นมากกว่าการกระทำของผู้ใช้ โดยการแยกแยะปัจจัยของวัตถุนั้นๆ และแนะนำวัตถุที่มีปัจจัยใกล้เคียงกันขึ้นมาให้ ข้อดีของระบบ RS แบบนี้คือการที่ไม่จำเป็นต้องใช้ข้อมูลมหาศาลในการประมวลผล หรือไม่มี Cold Start นั่นเอง แต่ก็มีข้อเสียอยู่ว่าวัตถุที่แนะนำนั้นค่อนข้างเจาะจงมากไปหน่อย ขึ้นอยู่กับการคำนวนความใกล้เคียงของวัตถุนั้นๆ ตัวอย่างเช่น IMDB, Rotten Tomatoes และ Pandora

Hybrid Method คือระบบ RS ที่รวมเอาสองระบบข้างต้นมาทำงานช่วยกัน Netflix คือตัวอย่างของระบบผสมนี้ ระบบแบบผสมนี้ไม่มีขั้นตอนตายตัว แล้วแต่ผู้พัฒนาจะนำไปใช้งานในแนวทางไหน แต่ส่วนมากระบบผสมจะแก้ปัญหาที่เกิดขึ้นในระบบ RS ข้างต้นได้

ต้องยอบรับว่าระบบ RS จะนำผู้ใช้และธุรกิจไปสู่ประสบการณ์ใหม่บนโลกดิจิตอล นอกจากนั้น cloud computing ยังเป็นตัวช่วยที่สำคัญยิ่งที่จะให้ระบบ RS เข้าใกล้จุดสูงสุดคือสามารถแนะนำได้ถูกใจผู้ใช้ทุกคนแตกต่างกันไปและทันเวลา ในปัจจุบันระบบ RS ยังแบ่งผู้ใช้ออกเป็นหลายกลุ่มอยู่ ในอนาคตอันใกล้นี้คงจะเห็นระบบ RS ที่แนะนำเฉพาะบุคคลมากขึ้นและยังตอบสนองแบบทันเวลา ทันอารมณ์ ทันสถานที่ ข้อมูลทุกอย่างเกี่ยวกับผู้ใช้จะถูกนำมาวิเคราะห์และประมวลผลเพื่อความแม่นยำมากขึ้น

ระบบ RS ในปัจจุบันมีการใช้อย่างแพร่หลายในระบบขายของและสื่อสารสนเทศ โดยการแนะนำสินค้าและสื่อให้ถูกกับผู้ใช้มากที่สุดจะทำให้สร้างรายได้ได้เยอะมาก และธุรกิจต่อไปที่จะนำไปใช้คงหนีไม่พ้น ธนาคารและสถาบันการเงินต่างๆ เพื่อตอบสนองความต้องการการใช้เงินของผู้ใช้ให้ทันท่วงที ระบบ RS จะถูกนำมาประยุคเพื่อแนะนำสินค้าและบริการต่างๆ ให้เฉพาะบุคคลมากขึ้นนั่นเอง

มาถึงจุดนี้แล้วผู้อ่านหลายคนคงชอบ บางคนก็กลัวว่ามันจะมากเกินไปหรือเปล่า บอกเลยว่าการจะพัฒนาระบบต่างๆ มีปัจจัยหนึ่งที่ต้องคำนึงถึงและหนีไม่พ้น คือ ความเชื่อใจของผู้ใช้ ผู้พัฒนาจะทำอย่างไรให้ผู้ใช้เชื่อใจได้ว่าปลอดภัยจริงและมีประโยชน์ต่อผู้ใช้จริงๆ ยังคงเป็นคำถามและความท้าทายให้ผู้พัฒนาหาคำตอบต่อไป คงจะมีแต่เวลาเท่านั้นที่จะทำให้ทุกอย่างที่คลุมเครืออยู่นี้กระจ่าง แต่ระบบนี้คงไม่ห่างไกลจากกาลเวลาปัจจุบันมากนักหรอก