CC PLUS > CCplusforBiz > forBiz全ての記事 > 音声認識を導入して管理者、オペレーターの業務を効率化! ソニーネットワークコミュニケーションズ様の導入事例

音声認識を導入して管理者、オペレーターの業務を効率化! ソニーネットワークコミュニケーションズ様の導入事例

ソニーネットワークコミュニケーションズ佐野様に聞くAI音声認識ソリューションがもたらした効率化と現状認識

写真左から:ソニーネットワークコミュニケーションズ株式会社 佐野将也 氏、Hmcomm株式会社 笠井裕平 氏、株式会社セントメディア 田村佳士 氏

ソリューション名:AI音声認識ソリューション

導入企業:ソニーネットワークコミュニケーションズ株式会社

全国1400席のコールセンターの応対品質やパフォーマンスのばらつきが課題

コールセンター業界の人材不足、ビッグデータ活用を背景に、AI音声認識ソリューション対する期待が高まっている。
インターネット接続サービスを展開し、全国8拠点1400席のコールセンターをもつソニーネットワークコミュニケーションズ様もカスタマーサポートの応対品質やパフォーマンスのばらつきを抑え、オペレータの人材不足の市場でも安定的なセンター運営を実現するため、音声認識の本格的な検討を開始し、導入まで踏み切った。

大手も参入しているAI音声認識ソリューション市場で同社が選んだのは、当時導入事例も少なかった産総研発のベンチャー企業 Hmcomm社が開発した【VContact】だった。
VContactは、お客様、オペレーターの会話内容をリアルタイムにテキスト化し、要約までを行い、補助機能として、FAQレコメンド機能、管理者のモニタリング可視化機能を搭載している。
また、大きな特徴として、オペレーターごとの声や話し方の特徴をセンター側で学習させることができる「音響学習機能」がついており、認識精度の向上を、お金をかけてベンダーに依頼せずとも、センター側で向上させていく機能がついているという。
音声認識の選定から導入、の現場での活用までを指揮された、同社 業務設計部 CRM課兼企画管理課 課長の佐野氏に選定理由や、現場での導入事例、音声認識の活用方法についてお話をお伺いした。

「安定的なサポート基盤」「パフォーマンスの標準化」を背景に、導入を検討

プロジェックトを牽引している佐野様

Q:音声認識を導入するに至ったきっかけを教えてください。

だんだんオペレータの人材獲得が難しくなってきており、また、入れ替わりが激しいとそのたびに研修コストがかかるため、一度就業いただいた方には長く業務を担当して頂きたいと思っております。
そのため、弊社では人を大事にしたい、安定的なサポート基盤を作りたいというのがまずありました。

一方でマネジメントからは、コストの適正化が継続的に求められております。
SVやセンターマネージャが様々な改善活動を行い、平均値は年々良くなっているものの、オペレーター別にみると、すごくパフォーマンスの良い人と、そうでない人のばらつきがでてきていた。
このばたつきをなんとかできないかということで、解決策として音声認識が検討議題として浮上しました。

Q:時期としては、いつごろから検討を始めたのですか。

2015年度なので、3年前になりますかね。ちょうどその時期ぐらいから、AI技術いわゆるディープラーニングの発展にともない音声認識の精度が上がり、「そろそろ使えるレベルまで来た」というトレンドの時期に入り、検証を始めました。

検討から導入までは「石橋を叩くスタイル」で丁寧に…

Q:実際に検討を開始されてから導入までの経緯、選定理由を教えてください。

先行して音声認識を導入されている企業にヒアリングした結果、普通のシステム導入に比べて、音声認識は導入までのハードルが高いと聞いておりましたので、検討を開始してから導入までは、「石橋を叩くスタイル」で丁寧に進めていきました。

どう丁寧に進めたかというと、いきなりセンターに導入する前に2段階のステップを踏みました。
1段階目は、過去に保存した音声ファイルを使って、どれくらいの音声認識精度が出るのかを6社で机上の検証を実施し、評価を行い、2社まで絞りました。
2段階目は、実際に一部のセンターに何席か導入し、トライアルを実施してみて、最終的な1社を選定する方法をとりました。

Q:最初の6社の選定理由を教えてください。

まずは、マーケットでシェアを持たれているメジャーなプレーヤーを選びました。
また、Hmcomm社のようにこれから力を入れていこうという会社が当時何社かありましたので、そこを含めて6社選定しました。

Q:1段階目で6社から2社に選定する際は、どのように選定されたのですか。

第一に「音声認識精度が良いこと」を選定理由の最重要項目として評価しました。特に弊社の場合はアフターコールワークの削減に使いたかったので、リアルタイムで精度が良いことを重視しました。
第二に「投資に見合う効果が得られるか」を評価しました。

最終選定の末、当時実績に乏しかったHmcomm社に決めた理由とは。

Q:最終2社には、導入事例も多く最もシェアを持っている企業と、Hmcommの2社が選ばれたと聞いています。Hmcomm社に決められた選定理由を教えてください。

「新しい事に挑戦する」というソニーの文化があり、新しいもの好きといいますか、新しいものに挑戦したいという思いがありました。
また、Hmcomm社の音声認識エンジンが産業技術総合研究所のパテントを使われており、トータルのコストで比較的安価だったということで、Hmcomm社に決めました。

Q:当時のHmcomm社はまだ導入実績がありませんでしたが、社内の説得は大変だったのではないでしょうか。

社内から懸念の声がありましたが、トライアルの検証で、実際に使ってみて「どれくらいの効率化が図れるのか」というファクトを積み重ねていきました。
全拠点に導入すれば、後処理時間が何秒間減って、その結果、費用がこれだけ減るというコスト削減の試算を丁寧に行い、マネジメントの了承を得ました。

現場に導入するにあたって、初めは現場の抵抗も少なくなかった。

Q:システムを現場に導入するにあたって、現場の理解は重要な要素かと思います。初めは現場では音声認識に対してどういう理解でしたか。

音声認識というのは、聞き取りやすい音声だと音声認識を通しても精度が良く、人が聞き取りづらい音声だと精度も悪いものです。
当然、オペレーターの中で話し方によって、精度が良い人と悪い人が出てくるのですが、その精度が悪いことをシステムでなんとかしてほしいという要望はかなりありました。自分たちはきちんと話していると(笑)
また、初めはシステムトラブルもあったので、それとあい合わさって最初の抵抗は小さくなかったです。

Q:どのように現場の理解を進められたのですか。

現場に足しげく通って、現場の管理者と意見を交換する中で、もともと専門の部隊を作って行っていたチューニング作業をオペレーター本人にやらせてみてはどうかという意見がありました。
チューニング作業というのは、音声を聞きながら、テキスト化された文章で間違っているところを訂正していく作業のことで、その作業をセンター側でできるというのがHmcomm社の強みにありました。(※補足:多くの場合、チューニング作業はベンダー側しかできず、多大なコストがかかる。また、コストがかかるため、細かなチューニングができず、認識精度が上がりにくくなるという問題が発生する)
実際にチューニング作業をオペレーター本人にやってもらうと、自分の話し方は悪くないと思っていたオペレーターも、やっぱり自分の話し方に癖があるということに気付く機会が得られ、そこから理解が進みました。
また、ここでこういう風に話すと認識精度が良くなるといったシステムの癖の理解も進み、お互い理解が進んでいきました。

Q:オペレーターのチューニング作業はどのように行っているのですか。

もともと在籍していたオペレーターは、研修時間を設けて、その中でチューニング作業の教育と実際の作業を行っていきました。
研修の進め方としては、各センターでトレーナーを設けて、そのトレーナーに対してまずは研修を行い、理解してもらって、そのトレーナーが各センターで計画的に研修を行っていきました。
音声認識を入れた後に入社したオペレーターに関しては、初期研修の中でチューニング作業を実施しております。
また、現在試験的に音声認識精度をデビューの基準にするような取り組みも行っております。

Q:チューニング作業は、具体的にはどれくらいの時間がかかるものなのですか。

弊社の場合は1オペレーターあたり2~3コール分をチューニングしておりますので、イニシャルで1時間くらいの時間になります。そのあとは、特に作業は発生しません。

プロジェックトを牽引している佐野様

導入により、当初想定していた部分以外の効果もあった

Q:ここまで、選定、導入当初のお話をお伺いしてきましたが、導入してどのような効果がありましたか。

音声認識を適切に使えば、効果が出ることは分かっていたので、細かな調整を行いながら確実に成果を上げるための活動を継続しています。

分かりやすい効果は、後処理時間の削減です。導入して3か月で、全センターで後処理時間が90秒削減できております。

あと、オペレーターの効率化だけでなく、管理者の業務効率化にも繋がっています。例えば、クレームなどが発生したときに、オペレーターがどのような対応をしたのかSVが音声を確認するという業務があったのですが、現在ではテキストで確認が必要なところをすぐに確認することができます。音声認識を導入してからは、センターの試算で一管理者あたり月間10時間ぐらい労働時間が削減できているという声もあります。

さらに、定量的な効果だけでなく、当初想定していなかったような定性的な効果も多く得られました。
先ほどご説明したチューニング作業によるオペレーターの教育もその一つです。

また、定期的に行われるフィードバックでも良い効果が得られております。
弊社では品質管理担当からオペレーターにフィードバックを行うのですが、フィードバックがうまく伝わらないというような問題がありました。
しかし、音声認識を導入してからは、音声テキストという目に見える形で本人たちにフィードバックを行うことができます。例えば、ちゃんと挨拶しているかどうかをチェックして、「あなたは挨拶していない対応が○件あったので、これをゼロにしてください」というファクトでフィードバックを行えば、納得感が高まります。これは、計画段階では想定できておりませんでしたが、導入してみて分かった効果でした。

Q:目に見える形で導入効果が表れたことで、音声認識に対する現場の意識も変わりましたか。

はい、もともと音声認識の導入はサポートの窓口だけでしたが、入会窓口や、セールス系窓口でも使いたいという声が現場から上がってきました。
ある程度理解が進んで、定着が進んできていると思います。

今後はオペレーターのスキルの標準化の加速とテキストデータからインサイトを得たい

Q:導入の効果についてお伺いしましたが、現在の課題についても教えてください。

課題はいくつかあります。
これは業界全体の課題でもありますが、今の音声認識の技術レベルでいうと、オペレーター側に対し、お客様側の精度はまだまだ改善の余地があります。
お客様側は電話越しということもあって、電話回線の品質にもよりますし、オペレーターは標準語で話しますが、お客様側は方言の方もいらっしゃいますので、認識が難しい部分があります。

弊社では、もともとお客様が言ったことを必ず復唱するルールがあり、お客様側の音声認識精度が悪くても、オペレーターの復唱で拾えていますが、そういったルールがないセンターにとっては、お客様側の精度がもう少し上がってくると、導入のハードルは下がってくると思います。

Q:導入の効果についてお伺いしましたが、現在の課題についても教えてください。

今取り組んでいることとしては、適切なFAQを自動で検索してオペレーターにレコメンドする機能の活用に取り組んでおります。
音声認識によって、標準化できるものとして、パソコンのタイピングスキルや後処理の仕方があるのですが、FAQを自動表示することでナレッジの検索スキルも標準化できると考えています。

また、テキスト化したデータを分析して、そこからインサイトを得たいと考えております。
例えば、同じ話をしているはずなのに、あるオペレーターが対応すると成約に繋がり、別のオペレーターが対応すると成約にならないケースがあります。色々分析をして、その違いが何か分かっている部分もあるのですが、分からない部分もある。
恐らくですが、お客様側とオペレーター側の相性みたいなのがあったりとか、喋る順番だったり、喋り方だったり、というのがいろいろ作用して、違いになってくると思うのですが、テキストデータを使ってもっと科学的に分析したいと考えております。

佐野様ありがとうございました

音声認識は導入して初めて分かることも多い。
今回のソニーネットワークコミュニケーションズ様の例では、当初想定していた後処理時間の効率化以外にも、応対品質の部分でも効果が発揮されている。
また、今後は蓄積されていくテキストデータを分析・活用していくことで、コールセンターが企業の利益を生む出す重要な戦略拠点になっていく可能性がある。

今後、必ず起こりうる人材不足に対応するためにも、企業の競争強化のためにも、音声認識ソリューションには注目していきたい。

AI音声認識ソリューションにご興味がある方は、ぜひ以下のお問合せフォームよりお気軽にご相談ください。

お問い合わせフォーム
会社名
ご担当者名
電話番号
メールアドレス
(必須)
メッセージ本文

個人情報取扱規約を必ずお読み、同意のうえお進みください。


▲目次にもどる

関連記事