预购商品
书目分类
特别推荐
Chapter 01 語音辨識概述 1.1 語音辨識發展歷程 1.2 語音辨識產業與應用 1.3 常用語音處理工具 Chapter 02 語音訊號基礎 2.1 語音訊號的聲學基礎 2.2 語音訊號的數位化和時頻變換 2.3 本章小結 Chapter 03 語音前端演算法 3.1 語音前端演算法概述 3.2 VAD 3.3 單通道降噪 3.4 回音消除 3.5 麥克風陣列與波束形成 3.6 聲源定位 3.7 其他未盡話題 3.8 本章小結 Chapter 04 語音辨識原理 4.1 特徵提取 4.2 傳統聲學模型 4.3 DNN-HMM 4.4 語言模型 4.5 WFST 解碼器 4.6 序列區分性訓練 4.7 點對點語音辨識 4.8 語音辨識模型評估 4.9 本章小結 Chapter 05 中文漢語模型訓練-- 以multi_cn 為例 5.1 Kaldi 安裝與環境設定 5.2 Kaldi 中的資料格式與資料準備 5.3 語言模型訓練 5.4 發音詞典準備 5.5 特徵提取 5.6 Kaldi 中的Transition 模型 5.7 預對齊模型訓練 5.8 資料增強 5.9 I-Vector 訓練 5.10 神經網路訓練 5.11 解碼圖生成 5.12 本章小結 5.13 附錄 Chapter 06 基於Kaldi 的語者自動分段標記 6.1 語者自動分段標記概述 6.2 聲紋模型訓練-- 以CNCeleb 為例 6.3 本章小結 Chapter 07 基於Kaldi 的語音SDK 實現 7.1 語音特徵提取 7.2 基於WebRTC 的語音活動檢測 7.3 語者自動分段標記模組 7.4 語音辨識解碼 7.5 本章小結 Chapter 08 基於gRPC 的語音辨識服務 8.1 gRPC 語音服務 8.2 ProtoBuf 協定定義 8.3 基於gRPC 的語音服務實現 8.4 本章小結 Appendix A 參考文獻
作者簡介 楊學銳 大疆創新語音交互演算法負責人,復旦大學及Turku大學碩士,長期從事語音演算法、深度學習、人工智慧等領域的研究與商業落地,在相關領域發表多篇論文及專利。 晏超 北京郵電大學碩士,曾任職於HP Labs, Cisco, Technicolor等公司。 現為雲從科技語音演算法負責人,從事語音辨識、聲紋識別、說話人日誌、語音合成等方向的演算法研發工作,構建了雲從科技整套語音演算法引擎與應用服務平臺。 劉雪松 OPPO音訊演算法專家,復旦大學碩士,曾任職於美國國家儀器、聲網、雲從科技等公司。 在信號處理、音訊演算法和語音演算法等領域有豐富的實戰經驗,在相關領域發表多篇論文及專利。
客服公告
热门活动
订阅电子报