2020-04-11 (土) 16時30分
【16:30〜】深層学習を利用した新しいOSSかな漢字変換『EgoisticLily』 〜その仕組みと展望〜
講師:橋本 雅彦
担当:おーぷん万葉
レベル:入門編
対象者:自然言語処理に興味のある方
前提知識:特にありません
Linuxデスクトップを使用する場合、その多くは『mozc』というかな漢字変換システムを使用していると思います。
ただし『mozc』は、現在メンテナンスがほぼ停止しており、「令和」を変換させる仕組みも各ディストリビューションで
対応するという状況です。
この状況を改善しようと、あらゆるコミュニティーで対策が練られています。
おーぷん万葉プロジェクトでは、オープンデータを活用した新しいかな漢字変換の仕組みを模索中です。
そして昨年夏に完成したかな漢字変換システムでは、深層学習が使われています。
かな漢字変換で深層学習と言うと、多くの場合RNN(リカレントニューラルネットワーク)を思い浮かべると思いますが、おーぷん万葉ではAutoEncoderモデルで実装を行い、RNNよりも短い学習時間、そして拡張性の高いかな漢字変換を目指しています。
本セミナーでは、その仕組みについて紹介します。
【カテゴリ】自然言語処理/オープンデータ/Linux