テクノロジーの力で多言語化を 自然言語処理の今を知ろう

インターネット上で外国語の文章に出会ったとき、『翻訳を見る』のボタンを押すだけで、瞬時に日本語の文章に変換されて驚いた経験はないですか?近年、AI(人工知能)の進化が目覚ましく、自然言語処理の能力が向上したことで、外国語を介したコミュニケーションも手軽になっています。
では、この自然言語処理とはどのようなものなのでしょうか?

自然言語処理とは何か?

私たちが普段使っている言葉(自然言語)を、コンピュータによって分割したり分類したりする技術を、「自然言語処理」といいます。

自然言語の持つ曖昧さをなくすために開発された技術で、自動翻訳などに活用されています。

言語の世界とは?

言語には大きく分けると「自然言語」と「形式言語」の2つがあります。

自然言語は、日常において私たちが話したり書いたりしている言葉のこと。文脈によって異なる意味に解釈されたり、時代とともにアップデートされたりするのが特徴です。形式言語は語彙や文法が形式的で、複数の意味を伝達することはありません。形式言語には「人工言語」や「手話」「コンピュータ言語」などがあります。

言語の世界で自然言語処理を考えるとき、「自然言語」と相対する存在として「コンピュータ言語」や「プログラミング言語」が挙げられます。

自然言語とコンピュータ言語の違い

「自然言語」と「コンピュータ言語」の違いは、端的にいうと『曖昧性があるかないか』です。両者の特徴についてより詳しくみていきましょう。

自然言語は、人間同士がコミュニケーションを取るために自然と生まれた言語で、規則が明確ではありません。そのため話者の間で誤解が生じることがよくあります。

 例:クマは走って逃げた女の子を追いかけた。
 解釈1:逃げた女の子のことを、クマが走って追いかけた。
 解釈2:走って逃げた女の子のことを、クマが追いかけた。

一方、コンピュータ言語には必ずひとつの解釈しか存在しません。時代によって変化することもなく、常に同じ解釈がなされます。

 例:8*2-7
 解釈:9(8と2の乗から7を引いた数)

言語を解析する=可能性が無限大

「共通言語によって意思疎通ができたからこそ、人類は文明を発展させることができた」と言われるほど、自然言語は人類の進化になくてはならない存在でした。さらに、自然言語は技術の進化とともに増えたり変化したりしています。

そんな自然言語を解析することで、「人が言葉を理解する経緯」や「言葉に続く行動パターン」などを明瞭化することができ、より一層の技術発展に活かすことが期待されています。


「自然言語」と「コンピュータ言語」の違いは、端的にいうと『曖昧性があるかないか』です。両者の特徴についてより詳しくみていきましょう。

自然言語は、人間同士がコミュニケーションを取るために自然と生まれた言語で、規則が明確ではありません。そのため話者の間で誤解が生じることがよくあります。

 例:クマは走って逃げた女の子を追いかけた。
 解釈1:逃げた女の子のことを、クマが走って追いかけた。
 解釈2:走って逃げた女の子のことを、クマが追いかけた。

一方、コンピュータ言語には必ずひとつの解釈しか存在しません。時代によって変化することもなく、常に同じ解釈がなされます。

 例:8*2-7
 解釈:9(8と2の乗から7を引いた数)

言語を解析する=可能性が無限大

「共通言語によって意思疎通ができたからこそ、人類は文明を発展させることができた」と言われるほど、自然言語は人類の進化になくてはならない存在でした。さらに、自然言語は技術の進化とともに増えたり変化したりしています。

そんな自然言語を解析することで、「人が言葉を理解する経緯」や「言葉に続く行動パターン」などを明瞭化することができ、より一層の技術発展に活かすことが期待されています。

身近な自然言語処理(NLP)

具体的に、自然言語処理(Natural Language Processing、略称:NLP)はどのようにして私たちの生活に利用されているのでしょうか?意外なところでも、気がつかないうちに自然言語処理(NLP)のお世話になっているかもしれませんよ。

日常生活での代表的なNLP活用事例を紹介します。

日本語入力(かな漢字文字変換)

私たちの生活で一番身近なNLPの活用例は、日本語入力ソフトのかな漢字文字変換です。スマートフォンやパソコンで平仮名を入力すると、漢字やカナ、英字などの変換候補が表示されます。このとき、NLPが作動しているのです。具体的には以下のようなソフトがあります。

【ATOK】
 ジャストシステムが提供する有料ソフト。「ら」抜き表現や打ち間違いにも対応しており、日本語単語を英単語に変換してくれる機能もあります。
【Google 日本語入力】
 Googleが提供する無料ソフト。人気キーワードや口語に強く、自動アップデートで進化し続けます。
【MicrosoftIME】
マイクロソフトが提供する有料ソフト。変換候補の一覧表示などが便利です。

機械翻訳

将来、英語学習は必要なくなるとまでいわせた機械翻訳にも、NLPが活用されています。特にGoogle翻訳の進歩は革命的で、日々正確さが増していることを私たちは肌で感じることができるでしょう。

【Google翻訳】
 Googleが提供する機械翻訳のサービス。5000字以内のテキストやウェブページ全体を世界中の言語に翻訳することが可能です。
【音声翻訳アプリ】
 NICT(情報通信研究機構)が開発した、音声から他言語への翻訳が可能なアプリです。

対話システム

スマートスピーカーやチャットボットなどが代表的な、対話システムにもNLPが働いています。

【Amazon Echo】
 Amazon.comが開発したスマートスピーカー。「アレクサ」と呼ぶと起動します。
【LINE Clova 】
 LINEが開発したAIアシスタント。LINEの送受信ができます。
【Google Home】
 Googleが開発したスマートスピーカー。Google検索もできます。
【Siri】
 Apple製のデバイスに搭載されているAIスピーカー。

医療分野でも自然言語を取り入れている

医療でも主に診断の支援と医療データの整理・管理などで自然言語処理を導入しています。アメリカのHealth Fidelityによる医療ソリューションでは医療関係者が判断しやすいよう、医療データから国際的な疾病分類法のICD-10に関する記述を自動抽出するサービスを提供。またAmazon Comprehend Medicalは基本的な分析機能にさらに医療情報を分析する機能を追加したツールを開発し、学習した疾病名や生体組織、薬剤名から問診票のようなデータを作ることに成功しています。

他にも世界中で進化し続けるAI

Descript は、フェードやボリュームなどの音声編集や、映像の整理・編集をAIが行います。

Grammarly はスペルや文法のミスを検出。メッセージの文章がフォーマルかカジュアルかといったトーンを調べてくれます。

また自然言語処理でも、言語の意味だけではなく背景にある感情を分析することができるツールや人間と対話できる機能が出てきています。

Googleの言語翻訳アプリや、マイクロソフトのワードに搭載されているNLPを利用した文法チェックは、すでに馴染みのあるAIですね。

自然言語処理の技術発展で変わる!ビジネスにおけるAIのニーズ

NLPの進化によって、最近ではビジネスでの活躍の場も急増しています。特に有用性が期待され、多くの企業に導入されているのが「対話型AI」です。

社内向けには、営業社員の日報をテンプレートに沿って音声入力できるシステムや、社内での問い合わせに自動対応するチャットボットなどに対話型AIが活用されています。

社外向けにも、顧客からの問い合わせにチャットボットで対応したり、顧客の声をデータ化して該当部署に振り分けたりする業務に、対話型AIの導入が進んでいます。

「自然言語処理」の基礎を学びたい人におすすめの良書3選

自然言語処理によってコンピュータが私たちの話す言葉を適切に扱えるようになると、生活のあらゆる場面が便利になりますね。

そこで、これから自然言語を学びたいという人に、おすすめの本を紹介します。

自然言語処理の基本と技術 (仕組みが見えるゼロからわかる)

自然言語処理の技術的知識やビジネス的知識を、ゼロから図解入りで学ぶことができます。応用編では、機械翻訳や情報検索、Webにおける自然言語処理についても紹介されています。はじめの一歩として、自然言語処理の全体像を捉えるのにもおすすめです。
本書は、この未来に不可欠となるに違いない自然言語処理の、技術的、ビジネス的基礎知識をくまなくコンパクトに図解した一冊です。
著者陣もそれぞれの分野の第一線で活躍するエキスパート揃い!
世界を大きく変えるであろうテクノロジーに一歩近付いてみませんか?
via 翔泳社HP
出版社:翔泳社
発売日:2016/3/5
著者:奥野陽、グラム・ニュービッグ、萩原正人
監修:小野守

自然言語処理の基礎

自然言語処理の『形態素解析』『構文解析』『意味解析』『文脈解析』の4段階について解説されています。応用学習におすすめな書籍の紹介もあります。
人間が読み書きしている言語をコンピュータ上で処理する技術である,自然言語処理についての学部用教科書。自然言語処理の四つの解析ステップについて詳しく説明するとともに,自然言語処理技術を用いた応用例のいくつかを紹介する。
via コロナ社HP
出版社:コロナ社
発売日:2010/10/15
著者:奥村学

はじめての自然言語処理

自然言語の基礎的な知識や直面する課題について学べる入門書です。章末問題も付いています。
使い慣れた「言葉」も,コンピュータで扱おうとした途端にその奥深さがみえてくる.かな漢字入力・機械翻訳・情報検索など,なくてはならない身の回りの応用から期待高まる未来の技術まで,それらの背後にある理論と仕組みをコンパクトに解説.自然言語処理の難しさと面白さを存分に味わえる,初学者に格好の入門書!
via 森北出版株式会社HP
出版社:森北出版
発売日:2015/12/1
著者:土屋誠司

まとめ

私たちの生活に浸透し、なくてはならない存在となっている自然言語処理。スマートスピーカーやチャットボットなどの普及からも感じられるように、その発展は日進月歩です。

一方で、音声データに対する技術を強化することなどが課題となっています。その課題を解決したあと、翻訳機を通して、通訳なしで外国人とスムーズに会話ができる日も近いかもしれません。自然言語処理技術の今後の発展によって、どんな未来が待っているのか楽しみですね。

人気記事

TVer 取締役とテレ東名物Pが語る、テレビと配信の未来【前編】 YouTubeもNetflixも、テレビの敵ではない?

TVer 取締役とテレ東名物Pが語る、テレビと配信の未来【前編】 YouTubeもNetflixも、テレビの敵ではない?

テレビが「お茶の間の王様」とされていたのも今は昔。2021年5月にNHK放送文化研究所が発表した「10代、20代の半数がほぼテレビを見ない」という調査結果は大きな話題を呼びました。そんなテレビの今を「中の人」たちはどのように受け止めているのでしょうか。そこでお話を伺うのが、民放公式テレビポータル「TVer」の取締役事業本部長である蜷川 新治郎氏とテレビ東京のクリエイティブプロデューサーを務める伊藤 隆行氏。前編では、コネクテッドTVの登場によって起きた変化や、YouTubeやNetflixといった競合コンテンツとの向き合い方についてお届けします。

「8割以上の精度で、赤ちゃんが泣く理由が判明」CES2021イノベーションアワード受賞。注目の日本発ベビーテック企業とは

「8割以上の精度で、赤ちゃんが泣く理由が判明」CES2021イノベーションアワード受賞。注目の日本発ベビーテック企業とは

テクノロジーの力で子育てを変えていく。そんなミッションを掲げ、泣き声診断アプリや赤ちゃん向けスマートベッドライトなど、画期的なプロダクトを世に送り出してきたファーストアセント社。「CES2021 Innovation Awards」を受賞するなど、世界的に注目を集めるベビーテック企業である同社の強さの秘密とは。服部 伴之代表にお話を伺いました。

なぜ日本企業のDXはうまくいかないのか。シリコンバレーで活躍するパロアルトインサイトCEO 石角友愛氏と立教大学ビジネススクール田中道昭教授が、要因を徹底解説

なぜ日本企業のDXはうまくいかないのか。シリコンバレーで活躍するパロアルトインサイトCEO 石角友愛氏と立教大学ビジネススクール田中道昭教授が、要因を徹底解説

緊急事態宣言の度重なる延長、オリンピック開催是非の議論と、依然混沌とした状況が続く日本とは裏腹に、シリコンバレーではワクチンの複数回摂取が進み、市民がマスクなしで屋外を出歩く風景が見られ始めているそうです。コロナ禍と呼ばれる約1年半の間、アメリカのメガテック企業、ベンチャー企業はどのような進化を遂げたのか。DXを迫られる日本企業は何を学ぶべきなのか。『いまこそ知りたいDX戦略』、『“経験ゼロ”から始めるAI時代の新キャリアデザイン』の著者であり、パロアルトインサイトCEO、AIビジネスデザイナーの石角友愛さんをゲストに迎え、立教大学ビジネススクール田中道昭教授がお話を伺います。

「銀行は将来、もはや銀行である必要がない」デジタル時代の金融に求められるものとは。SMBCグループ谷崎CDIO×東大・松尾教授×デジタルホールディングス 鉢嶺

「銀行は将来、もはや銀行である必要がない」デジタル時代の金融に求められるものとは。SMBCグループ谷崎CDIO×東大・松尾教授×デジタルホールディングス 鉢嶺

コロナ禍を経て、全世界のあらゆる産業においてその必要性がますます高まっているDX。DXとは、単なるITツールの活用ではなく、ビジネスそのものを変革することであり、産業構造をも変えていくほどの力と可能性があります。そして、全ての日本企業が、環境の変化を的確に捉え、業界の枠を超え、積極的に自らを変革していく必要があります。 今回は、AIの第一人者であり東京大学大学院教授である松尾 豊氏にご協力いただき、デジタルホールディングス代表取締役会長 鉢嶺 登氏と共に、金融業界大手の中でいち早くデジタル化に着手した三井住友フィナンシャルグループ(以下、SMBCグループ)の谷崎 勝教CDIO(Chief Digital Innovation Officer)にお話を伺います。DXの必要性を社内でどう伝え、どのように人材育成を進めてきたのか、また金融・銀行業界はDXによってどう変わっていくのか。デジタルならではのメリットとは。SMBCグループの取り組みに迫ります。

アコム新社長 木下政孝氏×立教大学ビジネススクール田中道昭教授対談。デジタルネイティブ企業が金融業に参入し、キャッシュレス化が加速するなか、アコムが描く未来戦略とは

アコム新社長 木下政孝氏×立教大学ビジネススクール田中道昭教授対談。デジタルネイティブ企業が金融業に参入し、キャッシュレス化が加速するなか、アコムが描く未来戦略とは

2021年6月23日開催のアコム株式会社の株主総会および総会終了後の取締役会において、木下政孝氏が新社長に就任しました。1993年に業界で初めて自動契約機「むじんくん」を導入し、2016年に「イノベーション企画室」を設立するなど、金融業界でも積極的に新しい取り組みやデジタルシフトを推進してきたアコム。新社長である木下氏は今どんな想いで会社のトップに立つのか。激動のコロナ禍を経た上で見えた、デジタルでは担えない、人の役割とは何なのか。立教大学ビジネススクール田中道昭教授がお話を伺います。

コロナ禍でラジオが復権!? 民放ラジオ業界70年の歴史を塗り替えたradiko(ラジコ)の「共存共栄型 DX」とは

コロナ禍でラジオが復権!? 民放ラジオ業界70年の歴史を塗り替えたradiko(ラジコ)の「共存共栄型 DX」とは

Clubhouseをはじめ、新勢力が次々と参入し、拡大を見せる音声コンテンツ市場。その中で、民放開始から70年の歴史に「大変革」を巻き起こしているのが“ラジオ”です。放送エリアの壁を取り払う、リアルタイムでなくても番組を聴けるようにするといった機能で、ラジオをデジタル時代に即したサービスに生まれ変わらせたのは、PCやスマートフォンなどで番組を配信する『radiko(ラジコ)』。今回は、株式会社radiko 代表取締役社長の青木 貴博氏に、現在までのデジタルシフトの歩みと将来の展望について、お話を伺いました。

世界のMaaS先進事例7選。鉄道・バス・タクシーなど交通手段を統合したサブスクモデルも!

世界のMaaS先進事例7選。鉄道・バス・タクシーなど交通手段を統合したサブスクモデルも!

国内でMaaS(Mobility as a Service)実証が活発化している。新たな交通社会を見据え、既存の交通サービスの在り方を見直す変革の時期を迎えているのだ。 交通社会は今後どのように変わっていくのか。MaaSの基礎知識について解説した上で、海外のMaaSに関する事例を参照し、その変化の方向性を探っていこう。

アコム新社長 木下政孝氏×立教大学ビジネススクール田中道昭教授対談。デジタル時代においても求められる「お客さま第一義」とは何か

アコム新社長 木下政孝氏×立教大学ビジネススクール田中道昭教授対談。デジタル時代においても求められる「お客さま第一義」とは何か

2021年6月23日開催のアコム株式会社の株主総会および総会終了後の取締役会において、木下政孝氏が新社長に就任しました。1993年に業界で初めて自動契約機「むじんくん」を導入し、2016年に「イノベーション企画室」を設立するなど、金融業界でも積極的に新しい取り組みやデジタルシフトを推進してきたアコム。新社長である木下氏は今どんな想いで会社のトップに立つのか。激動のコロナ禍を経た上で見えた、デジタルでは担えない、人の役割とは何なのか。立教大学ビジネススクール田中道昭教授がお話を伺います。

Googleやビル・ゲイツも出資する“代替肉”スタートアップ「インポッシブル・フーズ」〜海外ユニコーンウォッチ#2〜

Googleやビル・ゲイツも出資する“代替肉”スタートアップ「インポッシブル・フーズ」〜海外ユニコーンウォッチ#2〜

「ユニコーン企業」ーー企業価値の評価額が10億ドル以上で設立10年以内の非上場企業を、伝説の一角獣になぞらえてそう呼ぶ。該当する企業は、ユニコーンほどに珍しいという意味だ。かつてのfacebookやTwitter、現在ではUberがその代表と言われている。この連載では、そんな海外のユニコーン企業の動向をお届けする。今回は欧米を中心に注目されている「代替肉」を扱う「インポッシブル・フーズ」を紹介する。