うしのおちちの備忘録

AtCoderや日記、自然言語処理などについて書きます。

2021-01-01から1年間の記事一覧

病名の表記揺れを吸収するライブラリを作った

はじめに 日本語の病名を病名辞書である万病辞書に紐づけるパッケージを所属研究室のRAとして作りました。この記事ではそもそも病名の表記揺れとはどういうものなのかから、パッケージの基本的な機能を紹介します。 github.com 病名の表記揺れ吸収 医療のテ…

Rust✖️WebAssemblyでブラウザ上で固有表現抽出する

はじめに 最近sudachi.rsをwasmにビルドして使ってるツイートを見て、自然言語処理の結構いろんなことが同じようにできるのではと思い、手始めに固有表現抽出してみることにしました。 https://twitter.com/vbkaisetsu/status/1412761328943460355?s=21 使用…

森羅2020-JPでNER入門

はじめに 概要 本記事では、森羅プロジェクトで開催されている日本語Wikipediaを対象とした属性抽出タスクについて、学習データの取得からモデルの構築までの流れを簡単に解説します。 具体的には、以下のことについて説明していきます。 森羅プロジェクトの…