 |
|
|
| |
|
社會科學的文本分析:R的應用[1版/2025年8月/1HAZ]
|
|
|
|
|
|
出版日期:2025-08-19
|
|
ISBN:9786264237017
|
|
定價:420元
特價:90折!378元
|
|
|
|
參考分類(CAT):研究方法
|
|
參考分類(CIP): 社會科學理論
|
|
|
|
|
|
|
|
|
內容簡介 ⊙系統化學習路徑
從文本分析基礎概念、語料庫結構探索、文本資料視覺化,到聚類辨識文本相似性、情感分析與機器學習,循序漸進,逐步搭建完整框架。
⊙理論結合實作
透過豐富案例與步驟式操作指南,引導讀者使用R及quanteda等套件,立即動手建立可複製的文本分析工作流程。
⊙橫跨社科、文學與商業
聚焦「以問題為導向」的應用場景,協助研究者與實務工作者有效解讀文本數據,洞察人類行為與社會脈動。
在數據驅動的時代,文本分析是揭示人類語言奧祕的關鍵方法。本書以R與quanteda生態系為核心,示範如何從語料庫中挖掘模式、趨勢與洞見,助力學術研究,也為政策、商業與社會決策提供實證基礎。
全書循序漸進:
1. 語料庫結構與預處理:分詞、N-gram、TF-IDF等基礎技術。
2. 聚類與相似性分析:以階層與K-means等方法刻畫文本關係。
3. 情感分析與機器學習:結合SVM、隨機森林等模型,完成精細分類與預測。
每章均附完整R程式碼、真實案例與圖形化流程,讀者可即學即用,迅速將方法轉化為學術或業界成果。 作者介紹 曾文鐽
現職:
國立臺灣科技大學應用外語系教授
學歷:
英國諾丁漢大學博士
經歷:
國立臺灣師範大學英語系助理教授、副教授
國立臺灣科技大學應用外語系副教授 目次 第1章 文本分析簡介
什麼是文本分析?
透過文本洞察力提取數據
結語
文本分析工作流程
原始文本
矩陣表示
分析
準備:練習使用R進行文本分析
步驟1:載入quanteda套件
步驟2:使用print()探索語料庫
步驟3:使用tokens()對語料庫進行字元化處理
步驟4:使用dfm()創建文檔-特徵矩陣
步驟 5:使用textplot_wordcloud()創建文字雲
第1章總結
第2章 探索語料庫的結構
步驟1:載入quanteda
步驟2:檢視語料庫並提取文件變數
步驟3:使用SOTU語料庫重現分析
詞彙字元化
步驟1:載入quanteda
步驟2:對語料庫進行詞彙字元化處理
步驟3:使用kwic()探索字元化的語料庫
在R中創建文檔-特徵矩陣
步驟1:載入quanteda
步驟2:對語料庫進行字元化處理
步驟3:創建文檔-特徵矩陣
步驟4:選擇dfm特徵
第2章總結
第3章 文本數據的視覺化呈現
條形圖
詞彙分布圖
關鍵度繪圖
相關描述性統計
摘要統計
頻率
可讀性
詞彙多樣性
關鍵詞分析
步驟1:載入套件
步驟2:對語料庫進行字元化處理
步驟3:創建文檔-特徵矩陣
步驟4:執行命令獲取摘要統計資料
步驟5:將匯總統計資料轉換為相關的視覺化圖形
第3章總結
第4章 在R中應用聚類技術識別文本相似性
視覺化聚類算法
K-均值聚類
選擇一個K值
手肘法
層次聚類
終止點的確認
樹狀圖
方法比較
計算R中的二元統計量
步驟1:加載套件和語料庫
步驟2:字元化並創建文檔-特徵矩陣
步驟3:使用textstat_simil()進行相似度計算
步驟4:使用textstat_dist()進行距離計算
聚類美國總統演講
步驟1:加載套件和語料庫
步驟2:字元化並創建文檔-特徵矩陣
步驟3:K-均值聚類和層次聚類
繪製距離和K-均值聚類
繪製層次聚類
第4章總結
第5章 情感分析
情感分析工作流程
執行情感分析
步驟1:載入和探索語料庫
步驟2:對資料進行字元化
步驟3:識別極端文本中最常見的單詞
步驟4:應用情感詞典進行情感分析
步驟5:情感分析
步驟6:視覺化
第5章總結
第6章 機器學習
分類的應用案例
單純貝氏分類模型
線性支援向量機(Linear Support Vector Machines)
混淆矩陣(Confusion Matrix)
評估R中的分類模型
步驟1:載入套件和語料庫
步驟2:對資料進行字元化並創建dfm
步驟3:創建訓練集和測試集
步驟4:擬合單純貝氏分類器
步驟5:進行準確性測試
步驟6:進行交叉驗證
第6章總結
第7章 結論與未來研究展望
旅程回顧
實踐之旅
展望未來
第7章總結
第8章 附件:R指令整理
第1章:文本分析簡介
1. 基本操作函數
2. quanteda套件函數
第2章:探索語料庫的結構
1. 語料庫處理
2. 字元化處理
3. 關鍵詞文脈分析(KWIC)
4. 文檔-特徵矩陣(DFM)
5. 其他分析與應用
第3章:文本數據的視覺化呈現
1. 文字雲相關函數
2. 條形圖與相關統計函數
3. 詞彙分布與關鍵度繪圖函數
4. 可視化繪圖函數
第4章:在R中應用聚類技術識別文本相似性
1. 文本預處理相關函數
2. 相似性與距離計算函數
3. K-均值聚類相關函數
4. 層次聚類相關函數
5. 視覺化繪圖相關函數
第5章:情感分析
1. 載入與探索語料庫相關指令
2. 資料字元化相關指令
3. 文檔-特徵矩陣(DFM)操作相關指令
4. 關鍵字和文字雲相關指令
5. 情感詞典相關指令
6. 資料框轉換與操作指令
7. 視覺化相關指令
第6章:機器學習
1. 載入與探索數據相關指令
2. 資料分割與訓練測試集相關指令
3. 單純貝氏分類相關指令
4. 支援向量機(SVM)相關指令
5. 模型性能評估相關指令
6. 交叉驗證相關指令
7. 可視化相關指令
1、五南網路會員所購買的商品均享有取貨7天的鑑賞期﹝包含國定假日、例假日﹞,退換貨之商品必需於取貨7天內辦理退換貨,否則恕不接受退換貨。
2、依照消費者保護法規定,凡消費者於網站購物均享有7天商品鑑賞期,唯需注意辦理退貨商品需保留完整外包裝、附件、外盒等等,才可辦理退貨。
3、如欲退貨,請在鑑賞期內將商品連同發票寄回,每張訂單限退一次。
4、鑑賞期非試用期,若您收到商品經檢視後有任何不合意之處,請立即依照退貨規定辦理退貨
1、若本網站已設團購價,請直接下訂即可。
2、如您需要其他類型產品團購,則請聯繫客服或直接將需求e-mail
至wunan2351960@gmail.com即可
一、購物說明 1.本站商品近60萬筆。(商品圖片、出版日期等相關資訊僅供參考,出貨一律是最新版本) ◎請注意:上架商品不等於一定可以出貨。(會有缺書而訂不到書的狀況,敬請體諒) 2.當您下訂時,我們會向出版訂書(約7-10個工作天)(政府出版品因受限於採購程序,平均補貨作業時間約 2~6週)。如有久候,敬請見諒。當出版社回覆缺書時,我們只能取消您的訂單。 3.當您下訂時您必須同意:訂單成立的第14天起,因缺某一本書無法出貨的訂單,本站有權利自動取消您的訂單。◎請注意:缺書取消訂單我們統一發送簡訊通知。如果您要部份出貨者,請留言後再重新下單。 4.、本站保留出貨的權利。 二、運費說明 1.宅配到府:滿999元免運費,未滿則加收65元(台灣本島),離島一律加收120元 2.五南門市取貨:未滿350,運費20元 3.揪團:免運費 三、退貨與退款說明 五南會員所購買的商品均享有取貨7天的猶豫期﹝包含國定假日、例假日﹞,退換貨之商品必需於取貨7天內辦理退換貨,否則恕不接受退換貨。 1.請注意!下列商品購買後不提供7天的猶豫期,請務必詳閱商品說明並再次確認確實有購買該項商品之需求及意願時始下單購買,有任何疑問並請先聯繫客服詢問: (1)客製化之商品。 (2)買斷不退之商品。 (3)報紙、期刊或雜誌。 (4)經消費者拆封之影音商品或電腦軟體。 (5)下載版軟體、資訊及電子書。 (6)涉及個人衛生,並經消費者拆封之商品,如:內衣褲、刮鬍刀…等。 (7)藝文展覽票券、藝文表演票券。 (8)易於腐敗、保存期限較短或解約時即將逾期。 2.退貨退款詳細說明: (1)如欲退貨,請在鑑賞期內將商品連同發票寄回,每張訂單限退一次。 (2)退換貨政策:請在收到商品後,立刻檢查商品是否正確,如果有問題或瑕疵,請於7天猶豫期內完成退換貨申請手續。辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 (3)退款說明:請您填寫退貨退款書,若您採信用卡付款,由客服人員辦理刷退手續。若採其他付款方式,我們會將退款,匯款至指定帳戶。以上需要14個工作天。 (4)退貨退款書請至【客服中心】點選『退換商品】的說明中下載。
1.每日09:00前截止訂單,包含出貨通知、缺書通知等。 3.上午9:00點以前下單,可在當日下午17:00以後,查詢出貨進度。例假日除外 4.上午9:00以後在下單,需在隔日17:00以後,方能查詢訂單出貨進度。例假日除外 5.當你使匯款或轉帳時,請務必提供帳戶末5碼之資訊,請拍照email或傳真給我方,否則須等與銀行確認後,才能出貨。 6.出貨是以下單時間為出貨先後的順序,也就是請先下單再查詢庫存,因為就算查完庫存,也可能無法先為你保留書籍(政府出版品因受限於採購程序,平均補貨作業時間約 2~6週)。
|
|
|
|
|
|
 |
社會科學的文本分析:R的應用[1版/2025年8月/1HAZ]
出版日期:2025-08-19
ISBN:9786264237017
定價:420元
特價:90折!378元
參考分類(CAT):研究方法
參考分類(CIP): 社會科學理論