陳畯田 Jonathan Chen
我是目前就讀於國立陽明交通大學外文系的學生,今年大四,從上大學開始,我就不斷尋找能將語言學知識落地實作應用的可能性,而後在學習的道路上也遇到了許多夥伴一起做了一些實作開發,試圖用語言學中極為簡化的理論思維及演算方法以程式化的方式實際執行,解決生活中的問題。
Sessions
12-09
16:30
30min
PyLiteracy:以語言學為基礎的中文文法檢查器
陳畯田 Jonathan Chen
無論是否為母語者,在繁體中文的使用上,諸如近義詞、錯別字的錯誤使用是常見的,此問題也間接導致訓練資料多來自網路的大型語言模型 (LLM)無法在中文文法檢查任務上扮演可靠的角色。然而從語言學的角度來看,僅針對正確及錯誤句的對照進行模型訓練並非最有效的方式,其實此類型錯誤與詞類和句型結構有著直接關係,若將正確的詞類及句型結構規則分析化簡之後以程式碼撰寫成模型,此類以語言學規則為本的模型即能以和人類兒童依類似方式掌握語言的使用,實現以少量語料完成高效率中文文法檢查的任務。
Track
NYCU