近年、消費者はSNSやECサイトを通じて、他者の服装・着こなしを参考にした上で、ファッションアイテムの購買活動を行うことが一般的になっている。そのため、オンライン上のユーザー行動を快適にすることは、ファッション業界を発展させるという意味でも重要だという。しかし、ファッションに対してユーザーが持つ嗜好やイメージは極めて曖昧で、通常「カジュアル」「フォーマル」「かわいい」といった曖昧な表現が用いられるため、専門家ではないユーザーがファッションを理解・解釈することは容易ではないとのことだ。
例えば、「この服装をもう少しフォーマルにしたらどんな服装になるか?」「この服装はどれくらいカジュアルか?」「この服装をカジュアルにしている要素は何か?」といった問いへの回答は、ユーザーにとっては難易度が高く、専門家でさえも決して容易に答えを提示することが出来ないという。このようなファッション分野特有の曖昧性は、ユーザーが新しいジャンルの服装に挑戦しづらくなるなど、ユーザーからファッションへの興味を深めることの妨げとなる可能性があるという。そこで本研究グループでは、これらの問いに対する回答を自動的に獲得することで、ユーザーの認識の幅を広げ、ファッションの解釈や興味喚起の一助となることを目指しているとのことだ。
本研究グループは、全身コーディネート画像と画像に付与された複数のタグ情報を同一の空間に写像し、この空間における画像とタグの座標(=埋め込み表現)を活用することで、ユーザーからの曖昧な問いに対する回答を獲得するVisual-Semantic Embeddingに基づく「Fashion Intelligence System」という新たな技術を開発したとのことだ。
この新たな技術を用いて得られた回答をユーザーに提示することで、ファッション特有の曖昧性を軽減し、ファッションに関するユーザーの着る服や購買するアイテムなどの選択・行動を支援することが期待されるとのことだ。
図において、例えば「オフィスカジュアル」がよくわからない場合、提案システムにおける画像並べ替え機能を用いることで、「オフィスカジュアル」タグが付与されている服装の中でもより「オフィスカジュアル」な服装と、そうではない服装を判断することができる。また、ユーザー自身が現在所有している服装に対して「もう少しカジュアルにしたい」と思ったとき、画像検索機能を用いることで、どのような服装が「少しカジュアルにした」服装に当てはまるかを把握することができる。この際、AAM機能を用いることで、検索された画像において「どのあたりがカジュアルなのか」は把握することができるとのことだ。