Natural Language Processing คืออะไร ทำไมถึงสำคัญ

Natural Language Processing คือ การประมวลผลภาษาธรรมชาติหรือภาษามนุษย์ คำอธิบายที่เรียบง่าย คือ ทำให้คอมพิวเตอร์เข้าใจภาษามนุษย์ รวมไปถึงการประมวลผลที่ไม่ใช่แค่ทำให้คอมพิวเตอร์เข้าใจเรา แต่รวมถึงไปการวิเคราะห์ทางด้านภาษาศาสตร์ การตีความจากข้อความ ตัวอย่างเช่น การวิเคราะห์และตอบสนองความต้องการของมนุษย์ด้วยกัน เป็นต้น จึงทำให้ Natural Language Processing มีความสำคัญอย่างมากมาย หนึ่งในตัวอย่างที่ดีอย่าง Google



Google มีบริการหลักคือ Google Search มีการเก็บรวบรวมหน้าเว็บกว่าพันล้านหน้า ข้อมูลการจัดเก็บนั้นมหาศาล นอกจากจัดเก็บและจัดอันดับความน่าเชื่อถือแล้ว Google ยังจัดทำดัชนีไว้สำหรับการค้นหาไว้อย่างมากมาย จัดอันดับหน้าเว็บที่ใกล้เคียงกับการค้นหาให้อยู่หน้าแรกและอันดับถัดมา ซึ่งสิ่งที่ Google ทำมานับตั้งแต่เปิดตัวยี่สิบปีก่อน ทำให้ปัจจุบันเราได้ใช้บริการค้นหาข้อมูลที่ดีที่สุดที่โลกเคยมีมา การทำงานของ Google นั้นไม่สามารถทำได้ง่าย ๆ ด้วยข้อมูลที่มหาศาล , ผู้ใช้งานจำนวนมากทั่วโลก และจำนวนภาษาของหน้าเว็บที่มีภาษาอื่น ๆ นอกจากภาษาอังกฤษอีกมากมาย จึงทำให้ Google ไม่สามารถค้นหาสิ่งที่เราต้องการค้นด้วยการค้นหาข้อมูลจากคลังข้อมูลทั้งหมดได้ (ซึ่งเสียเวลาและใช้ทรัพยากรเยอะมาก) สิ่งที่ Google ทำหนึ่งในนั้นใช้ Natural Language Processing เข้าจัดเก็บดัชนี keyword และกระบวนการอื่น ๆ ช่วยลดเวลาการค้นหาลงได้มาก แถมมีความแม่นยำสูงกว่าเดิม
นอกจาก Google Search แล้ว Google ยังใช้ Natural Language Processing ในการพัฒนาบริการและผลิตภัณฑ์ของตนเองอย่างมากมาย ไม่ว่าจะเป็น ระบบกรองสแปมใน Gmail , ระบบแปลงข้อความเป็นเสียงใน Google TTS , ระบบแปลภาษาที่ครอบคลุมทั่วโลก เกือบทุกภาษาอย่าง Google Translate รวมไปถึง Google Assistant ระบบผู้ช่วยส่วนบุคคลจาก Google

จากตัวอย่างดังกล่าว ผู้อ่านคงเห็นถึงความสำคัญของ Natural Language Processing นั้นเพราะ Natural Language Processing เป็นเสมือนเทคโนโลยีฐานรากที่ช่วยต่อยอดเทคโนโลยีต่าง ๆ อย่างมากมาย ไม่ว่าเป็น การวิเคราะห์ข้อมูลของนักวิทยาศาสตร์ข้อมูล , ChatBot และอื่น ๆ ถ้าเทคโนโลยีนี้ถูกปิดกั้นโดยบริษัทหรือองค์กรใดองค์กรหนึ่ง จากการตั้งราคาที่สูงหรือการไม่เผยแพร่งานวิจัย จะทำให้นักพัฒนาโปรแกรม , นักภาษาศาสตร์ รวมไปถึงนักวิทยาศาสตร์ข้อมูล ที่อยากทำโปรแกรมหรือปัญญาประดิษฐ์ที่สามารถช่วยแก้ไขปัญหาสังคม, แก้ไขปัญหาการอ่านหนังสือของผู้พิการทางสายตา, แก้ไขปัญหาความหลากหลายทางภาษาด้วยการสร้างระบบแปลภาษาที่ดียิ่งขึ้นกว่าเดิม ไม่มีโอกาสได้สร้างมันขึ้นมา ซึ่งไม่เป็นผลดีต่อใคร แต่ด้วยความก้าวหน้าของเทคโนโลยีในการปัจจุบัน รวมไปถึงวัฒนธรรมการเผยแพร่งานวิจัยและโค้ดในฝั่งซอฟแวร์เปิด ช่วยให้ปัจจุบันมีเครื่องมือด้าน Natural Language Processing ที่ดีและมีคุณภาพอย่างมากมายเกิดขึ้นมา ไม่ว่าจะเป็น NLTK และโครงการอื่น ๆ รองรับความต้องการของบุคคลภายนอก มีหลายบริษัทที่ใช้งานซอฟแวร์เปิดเหล่านี้อยู่ อย่าง Google และ Facebook เปิดเผยงานวิจัยและเครื่องมือด้านนี้ออกมา แถมบางครั้งเปิดคลังข้อมูลทางด้านนี้ออกมาด้วย ทั้งสองบริษัทถือเป็นหนึ่งในตัวอย่างที่ดีในการเผยแพร่เทคโนโลยีและองค์ความรู้ทางด้าน Natural Language Processing

ถ้าหากคุณใช้ซอฟแวร์เปิดอยู่ อย่าลืมเข้าไปช่วยเหลือโครงการดังเหล่านั้นด้วยการช่วยโค้ดหรือให้กำลังใจทีมงานที่พัฒนา

ขอบคุณ

ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

ความแตกต่างระหว่าง regression กับ classification