朝日新聞社、ディープラーニングを活用し長文を圧縮・要約する「長文要約生成API」を公開
2021/4/5
株式会社朝日新聞社は、自然言語処理研究の成果の一つである「長文要約生成」の機能を体験できるAPI(Application Programming Interface)を公開したと発表した。
本APIでは下記の5つの機能を提供している。
(1)入力された文章を、指定した長さごとに区切ってTSUNAにより要約する
(2)文ごとの長さが揃うように圧縮する
(3)文ごとに指定した割合まで圧縮する
(4)重要な文を抽出する
(5)抽出した重要文を圧縮し、文書全体を指定した長さにする
これらの機能を単独で使用したり、あるいは連結して組み合わせたりすることで、長文の内容を把握しやすく要約することが可能だ。Web上の文章やビジネス文章、議事録、エントリーシートの内容など、素早く内容を判別したい、速読したいといった用途に活用できる。また、TSUNAと組み合わせることで、大量の文章に自動で見出しと要約を付与し、一覧にすることも可能だという。
・ここまでの文章をTSUNAで見出し生成、本APIで要約し、3分の1の長さにした例
(すべての文を7割程度圧縮し、段落を自動で付与)
「自然言語処理研究の成果「長文要約生成」のAPIを公開
自然言語処理研究の成果の一つである「長文要約生成」の機能を体験できるAPIを公開しました。要約された文章を返します。
用途に応じた文章を生成。ディープラーニング(深層学習)により可能となった技術です。自動で見出しや要約を生成する。文章を圧縮する技術を開発。APIを公開しました。
5つの機能を提供。TSUNAにより要約する。圧縮する。割合まで圧縮する。重要な文を抽出。文書全体を指定した長さにする。長文の内容を把握しやすく要約することが可能。素早く内容を判別したいといった用途にご活用できます。一覧にすることも可能です。」