undefined
【イベント内容】
論文を読み、自動音声認識モデルConformerを実装します。
AI基礎: 音声認識モデルConformerをつくろう
概要
Conformerは、文章全体の文脈を捉えるのが得意なTransformerと、音声の細かな特徴を捉えるのが得意なCNNを組み合わせた自動音声認識モデルです。
Conformerの研究論文を読み、手を動かして学ぶことでAIの基礎技術を理解します。
シラバス
自動音声認識で有名な研究を5回に分けて解説する予定です。
Deep Speech -> CTCの理解
LAS -> Attentionの理解
Conformer -> CTCとAttention両方の理解
wav2vec 2.0 -> 教師なし学習の理解
Whisper -> 汎用性を高めるための工夫の理解
資料
以下は「Transformer」のワークショップのサンプルです。資料は当日18:00に送信する予定です。
GitHub
Google Colab
【タイムテーブル】
19:00 ~ 20:30 ワークショップ
20:30 ~ 22:00 予備・開発タイム(参加任意)
Engineer Cafe - Hacker Space Fukuoka - ミーティングスペース(Meeting space)
1-15-30 Tenjin, Chuo-ku, Fukuoka
Google Mapsエンジニアカフェ