2018-秋季-從自然語言到文字探勘
課程講者 清華大學資工系 陳宜欣教授
課程開始2018-12-30
課程結束2019-03-31
課程費用免費
開課單位ShareCourse技能學院
課程類別資訊工程:系統、資訊安全、網路
分享到  

課程描述 (Curriculum Descrption)

在本堂課,將會從自然語言處理(NLP)開始,包括詞彙分析,句法分析、關聯分析,讓修習者可以利用自然語言技術來轉化文字。

接下來,課程將會帶入文字探勘,文字探勘是資料科學中一個基礎的修習科目,這個學問期待能透過各種文本分析的技術,從無架構的文字段落中擷取文本涵蓋的資料或知識,找到有價值的資訊。典型的文字探勘任務包括文本分類、文本聚類、情緒分析、上下文關聯分析。

 

課程目標 (Curriculum Goals)

帶領初學者了解如何從無架構的文字,用自然語言處理分析,找到有價值的資訊,產生效益、解決問題。這堂課除了會深入淺出的教授一般教科書有的技術外,並會給與實際應用的例子,讓初學者能練習面對問題的方法,也能運用技巧來分析成品並同時教導如何衡量分析結果,正確嗎?有用嗎?有趣嗎?

 

先修課程 (Prerequisites)

本課程著重介紹自然語言與文字探勘的基本概念,不要求有機器學習或資料庫相關背景。

 

教學進度 (Syllabus)

Week 1. 語言面面觀

Week 2. 文字關聯

Week 3. 自然語言常見工具

Week 4. 文字探勘與自然語言的關聯

Week 5. 資料探勘簡介

Week 6. 文字關聯

Week 7. 文字探勘主題技術 1

Week 8. 文字探勘主題技術 2

 

修課證明 (Course Certify)

修習完畢課程內容並完成所有課程要求,可申請「修課證明」。

課程講者
清華大學資工系 陳宜欣教授

學經歷

美國南加州大學博士

國立清華大學資訊工程學系 副教授

研究專長

Web Intelligence、資料探勘、資料擷取、社群網路、巨量資料

個人教學網站

http://www.cs.nthu.edu.tw/~yishin/