Source: Nextremer Blog

Nextremer Blog 漢字の部首を特徴量として用いたCNN+LSTMによる文書分類

こんにちは,Nextremerインターンの杉本です.面白そうな論文を読んだので紹介させていただきます.この論文[1]では,日本語の文章から漢字を構成する部首情報を抽出し,CNNやBi-derectional-LSTMを用いて極性判定を行っています. 近年は単語ごとに埋め込み表現を獲得するword2vecやFastTextなどが有名ですが,単語レベル(word-level)でネットワークを学習させる場合,ボキャブラリサイズが大きいためモデ...

Read full article »
Est. Annual Revenue
$5.0-25M
Est. Employees
25-100
Masayuki Mukai's photo - CEO of Nextremer

CEO

Masayuki Mukai

CEO Approval Rating

73/100

Read more