บทความ

ทวิตเตอร์ปล่อย Language Model จากข้อความทวีต 7 พันล้านข้อความ กว่า 100 ภาษา (มีภาษาไทยด้วย!!!)

รูปภาพ
เมื่อไม่กี่วันก่อน โมเดล Language Model ของทวิตเตอร์ได้เผยแพร่เอกสารลง arxiv และโมเดลขึ้น huggingface ในงานที่ชื่อว่า “TwHIN-BERT: A Socially-Enriched Pre-trained Language Model for Multilingual Tweet Representations” โดยใช้ข้อมูลข้อความทวีต 7 พันล้านข้อความ กว่า 100 ภาษา (มีภาษาไทยด้วย!!!)

#AIภาษาคน NLP (Natural language processing) คืออะไร?

ตามชื่ออังกฤษเลย “การประมวลผลภาษาธรรมชาติ” งานที่ทำให้คอมพิวเตอร์มันเข้าใจภาษามนุษย์ เช่น ภาษาอังกฤษหรือภาษาไทย เป็นต้น อะไรบ้างที่เป็นงานที่เป็น NLP สังเกตง่าย ๆ งานอะไรก็ตาม ที่พยายามให้มนุษย์สื่อสารกับคอมได้ผ่านภาษามนุษย์ เพียงแค่ใช้ข้อความ/เสียง/ภาพ ให้คอมเข้าใจนับเป็นงานด้าน NLP ทั้งหมด เช่น แปลภาษา สั่งงานด้วยเสียง เป็นต้น ปล. อาจจะไม่ถูกหลักวิชาการนัก เพราะเน้นให้คนทั่วไปเข้าใจ

Natural Language Processing คืออะไร ทำไมถึงสำคัญ

รูปภาพ
Natural Language Processing คือ การประมวลผลภาษาธรรมชาติหรือภาษามนุษย์ คำอธิบายที่เรียบง่าย คือ ทำให้คอมพิวเตอร์เข้าใจภาษามนุษย์ รวมไปถึงการประมวลผลที่ไม่ใช่แค่ทำให้คอมพิวเตอร์เข้าใจเรา แต่รวมถึงไปการวิเคราะห์ทางด้านภาษาศาสตร์ การตีความจากข้อความ ตัวอย่างเช่น การวิเคราะห์และตอบสนองความต้องการของมนุษย์ด้วยกัน เป็นต้น จึงทำให้ Natural Language Processing มีความสำคัญอย่างมากมาย หนึ่งในตัวอย่างที่ดีอย่าง Google

Overfitting และ Underfitting

รูปภาพ
Overfitting และ Underfitting เป็นข้อผิดพลาดในการสร้าง Deep learning ที่อาจเกิดขึ้นได้จากการทำ classification

ความแตกต่างระหว่าง regression กับ classification

โมเดล regression จะทำนายค่าที่ต่อเนื่องกัน (continuous values) เช่น คำถาม ความน่าจะเป็นที่ผู้ใช้จะคลิกโฆษณา ส่วนโมเดล  classification เป็นโมเดลจับกลุ่มสำหรับทำนายค่าที่แบ่งกันชัดเจน (discrete values) เช่น ระบบดักจับสแปมว่าเมลนี้เป็นสแปมหรือไม่

Machine Learning คืออะไรกันแน่ ?

รูปภาพ
"Machine Learning" คำที่หลาย ๆ คนเคยได้ยินหรือเคยอ่านเจอมา บางคนให้ความหมายว่า "เครื่องเรียนรู้" , "การเรียนรู้ของเครื่อง" , "ปัญญาประดิษฐ์" , "การทำให้คอมมันเรียนรู้ได้" และอื่น ๆ ซึ่งอาจจะไม่ชัดเจนนัก