株式会社 SSKPC

A01736 2000/01/01
コーパス corpus
電子化された例文データベースのこと。もともとは言語研究のための資料集という意味。類義語辞書であるシソーラスなどとともに、自然言語処理や、文脈を考慮したかな漢字変換を実現するための基礎データとなる。多くの場合、例文中に語句の品詞、構文、発音などの情報が付加されている。これらを自然な翻訳、文字変換などに応用する。