テクノロジーの力で多言語化を 自然言語処理の今を知ろう

インターネット上で外国語の文章に出会ったとき、『翻訳を見る』のボタンを押すだけで、瞬時に日本語の文章に変換されて驚いた経験はないですか?近年、AI(人工知能)の進化が目覚ましく、自然言語処理の能力が向上したことで、外国語を介したコミュニケーションも手軽になっています。
では、この自然言語処理とはどのようなものなのでしょうか?

自然言語処理とは何か?

私たちが普段使っている言葉(自然言語)を、コンピュータによって分割したり分類したりする技術を、「自然言語処理」といいます。

自然言語の持つ曖昧さをなくすために開発された技術で、自動翻訳などに活用されています。

言語の世界とは?

言語には大きく分けると「自然言語」と「形式言語」の2つがあります。

自然言語は、日常において私たちが話したり書いたりしている言葉のこと。文脈によって異なる意味に解釈されたり、時代とともにアップデートされたりするのが特徴です。形式言語は語彙や文法が形式的で、複数の意味を伝達することはありません。形式言語には「人工言語」や「手話」「コンピュータ言語」などがあります。

言語の世界で自然言語処理を考えるとき、「自然言語」と相対する存在として「コンピュータ言語」や「プログラミング言語」が挙げられます。

自然言語とコンピュータ言語の違い

「自然言語」と「コンピュータ言語」の違いは、端的にいうと『曖昧性があるかないか』です。両者の特徴についてより詳しくみていきましょう。

自然言語は、人間同士がコミュニケーションを取るために自然と生まれた言語で、規則が明確ではありません。そのため話者の間で誤解が生じることがよくあります。

 例:クマは走って逃げた女の子を追いかけた。
 解釈1:逃げた女の子のことを、クマが走って追いかけた。
 解釈2:走って逃げた女の子のことを、クマが追いかけた。

一方、コンピュータ言語には必ずひとつの解釈しか存在しません。時代によって変化することもなく、常に同じ解釈がなされます。

 例:8*2-7
 解釈:9(8と2の乗から7を引いた数)

言語を解析する=可能性が無限大

「共通言語によって意思疎通ができたからこそ、人類は文明を発展させることができた」と言われるほど、自然言語は人類の進化になくてはならない存在でした。さらに、自然言語は技術の進化とともに増えたり変化したりしています。

そんな自然言語を解析することで、「人が言葉を理解する経緯」や「言葉に続く行動パターン」などを明瞭化することができ、より一層の技術発展に活かすことが期待されています。


「自然言語」と「コンピュータ言語」の違いは、端的にいうと『曖昧性があるかないか』です。両者の特徴についてより詳しくみていきましょう。

自然言語は、人間同士がコミュニケーションを取るために自然と生まれた言語で、規則が明確ではありません。そのため話者の間で誤解が生じることがよくあります。

 例:クマは走って逃げた女の子を追いかけた。
 解釈1:逃げた女の子のことを、クマが走って追いかけた。
 解釈2:走って逃げた女の子のことを、クマが追いかけた。

一方、コンピュータ言語には必ずひとつの解釈しか存在しません。時代によって変化することもなく、常に同じ解釈がなされます。

 例:8*2-7
 解釈:9(8と2の乗から7を引いた数)

言語を解析する=可能性が無限大

「共通言語によって意思疎通ができたからこそ、人類は文明を発展させることができた」と言われるほど、自然言語は人類の進化になくてはならない存在でした。さらに、自然言語は技術の進化とともに増えたり変化したりしています。

そんな自然言語を解析することで、「人が言葉を理解する経緯」や「言葉に続く行動パターン」などを明瞭化することができ、より一層の技術発展に活かすことが期待されています。

身近な自然言語処理(NLP)

具体的に、自然言語処理(Natural Language Processing、略称:NLP)はどのようにして私たちの生活に利用されているのでしょうか?意外なところでも、気がつかないうちに自然言語処理(NLP)のお世話になっているかもしれませんよ。

日常生活での代表的なNLP活用事例を紹介します。

日本語入力(かな漢字文字変換)

私たちの生活で一番身近なNLPの活用例は、日本語入力ソフトのかな漢字文字変換です。スマートフォンやパソコンで平仮名を入力すると、漢字やカナ、英字などの変換候補が表示されます。このとき、NLPが作動しているのです。具体的には以下のようなソフトがあります。

【ATOK】
 ジャストシステムが提供する有料ソフト。「ら」抜き表現や打ち間違いにも対応しており、日本語単語を英単語に変換してくれる機能もあります。
【Google 日本語入力】
 Googleが提供する無料ソフト。人気キーワードや口語に強く、自動アップデートで進化し続けます。
【MicrosoftIME】
マイクロソフトが提供する有料ソフト。変換候補の一覧表示などが便利です。

機械翻訳

将来、英語学習は必要なくなるとまでいわせた機械翻訳にも、NLPが活用されています。特にGoogle翻訳の進歩は革命的で、日々正確さが増していることを私たちは肌で感じることができるでしょう。

【Google翻訳】
 Googleが提供する機械翻訳のサービス。5000字以内のテキストやウェブページ全体を世界中の言語に翻訳することが可能です。
【音声翻訳アプリ】
 NICT(情報通信研究機構)が開発した、音声から他言語への翻訳が可能なアプリです。

対話システム

スマートスピーカーやチャットボットなどが代表的な、対話システムにもNLPが働いています。

【Amazon Echo】
 Amazon.comが開発したスマートスピーカー。「アレクサ」と呼ぶと起動します。
【LINE Clova 】
 LINEが開発したAIアシスタント。LINEの送受信ができます。
【Google Home】
 Googleが開発したスマートスピーカー。Google検索もできます。
【Siri】
 Apple製のデバイスに搭載されているAIスピーカー。

医療分野でも自然言語を取り入れている

医療でも主に診断の支援と医療データの整理・管理などで自然言語処理を導入しています。アメリカのHealth Fidelityによる医療ソリューションでは医療関係者が判断しやすいよう、医療データから国際的な疾病分類法のICD-10に関する記述を自動抽出するサービスを提供。またAmazon Comprehend Medicalは基本的な分析機能にさらに医療情報を分析する機能を追加したツールを開発し、学習した疾病名や生体組織、薬剤名から問診票のようなデータを作ることに成功しています。

他にも世界中で進化し続けるAI

Descript は、フェードやボリュームなどの音声編集や、映像の整理・編集をAIが行います。

Grammarly はスペルや文法のミスを検出。メッセージの文章がフォーマルかカジュアルかといったトーンを調べてくれます。

また自然言語処理でも、言語の意味だけではなく背景にある感情を分析することができるツールや人間と対話できる機能が出てきています。

Googleの言語翻訳アプリや、マイクロソフトのワードに搭載されているNLPを利用した文法チェックは、すでに馴染みのあるAIですね。

自然言語処理の技術発展で変わる!ビジネスにおけるAIのニーズ

NLPの進化によって、最近ではビジネスでの活躍の場も急増しています。特に有用性が期待され、多くの企業に導入されているのが「対話型AI」です。

社内向けには、営業社員の日報をテンプレートに沿って音声入力できるシステムや、社内での問い合わせに自動対応するチャットボットなどに対話型AIが活用されています。

社外向けにも、顧客からの問い合わせにチャットボットで対応したり、顧客の声をデータ化して該当部署に振り分けたりする業務に、対話型AIの導入が進んでいます。

「自然言語処理」の基礎を学びたい人におすすめの良書3選

自然言語処理によってコンピュータが私たちの話す言葉を適切に扱えるようになると、生活のあらゆる場面が便利になりますね。

そこで、これから自然言語を学びたいという人に、おすすめの本を紹介します。

自然言語処理の基本と技術 (仕組みが見えるゼロからわかる)

自然言語処理の技術的知識やビジネス的知識を、ゼロから図解入りで学ぶことができます。応用編では、機械翻訳や情報検索、Webにおける自然言語処理についても紹介されています。はじめの一歩として、自然言語処理の全体像を捉えるのにもおすすめです。
本書は、この未来に不可欠となるに違いない自然言語処理の、技術的、ビジネス的基礎知識をくまなくコンパクトに図解した一冊です。
著者陣もそれぞれの分野の第一線で活躍するエキスパート揃い!
世界を大きく変えるであろうテクノロジーに一歩近付いてみませんか?
via 翔泳社HP
出版社:翔泳社
発売日:2016/3/5
著者:奥野陽、グラム・ニュービッグ、萩原正人
監修:小野守

自然言語処理の基礎

自然言語処理の『形態素解析』『構文解析』『意味解析』『文脈解析』の4段階について解説されています。応用学習におすすめな書籍の紹介もあります。
人間が読み書きしている言語をコンピュータ上で処理する技術である,自然言語処理についての学部用教科書。自然言語処理の四つの解析ステップについて詳しく説明するとともに,自然言語処理技術を用いた応用例のいくつかを紹介する。
via コロナ社HP
出版社:コロナ社
発売日:2010/10/15
著者:奥村学

はじめての自然言語処理

自然言語の基礎的な知識や直面する課題について学べる入門書です。章末問題も付いています。
使い慣れた「言葉」も,コンピュータで扱おうとした途端にその奥深さがみえてくる.かな漢字入力・機械翻訳・情報検索など,なくてはならない身の回りの応用から期待高まる未来の技術まで,それらの背後にある理論と仕組みをコンパクトに解説.自然言語処理の難しさと面白さを存分に味わえる,初学者に格好の入門書!
via 森北出版株式会社HP
出版社:森北出版
発売日:2015/12/1
著者:土屋誠司

まとめ

私たちの生活に浸透し、なくてはならない存在となっている自然言語処理。スマートスピーカーやチャットボットなどの普及からも感じられるように、その発展は日進月歩です。

一方で、音声データに対する技術を強化することなどが課題となっています。その課題を解決したあと、翻訳機を通して、通訳なしで外国人とスムーズに会話ができる日も近いかもしれません。自然言語処理技術の今後の発展によって、どんな未来が待っているのか楽しみですね。

Article Tags

Special Features

連載特集
See More