ทวิตเตอร์ปล่อย Language Model จากข้อความทวีต 7 พันล้านข้อความ กว่า 100 ภาษา (มีภาษาไทยด้วย!!!)
เมื่อไม่กี่วันก่อน โมเดล Language Model ของทวิตเตอร์ได้เผยแพร่เอกสารลง arxiv และโมเดลขึ้น huggingface ในงานที่ชื่อว่า “TwHIN-BERT: A Socially-Enriched Pre-trained Language Model for Multilingual Tweet Representations” โดยใช้ข้อมูลข้อความทวีต 7 พันล้านข้อความ กว่า 100 ภาษา (มีภาษาไทยด้วย!!!)